Date | Jun 27, 2019 |
---|---|
Speaker | 김지수 |
Dept. | INRIA |
Room | 27-220 |
Time | 15:00-16:30 |
이 발표에서는 위상학적 자료 분석(Topological Data Analysis)을 어떻게 하고, 그에 대한 통계적 추정을 어떻게 하는지 간단하게 소개한다. 위상학적 자료 분석은 포괄적으로는 자료에서 위상학적인 특성을 추출하는 분석 방법을 아우르는데, 대표적으로 persistent homology와 군집 나무(cluster tree) 등이 있다. persistent homology는 자료를 여러 해상에서 관측하고 지속성 있게 나타나는 위상 특성을 추려냄으로써 분석하고, 군집 나무는 자료의 분포 함수의 레벨 집합의 군집이 어떤 계층 구조를 생성하는지 봄으로써 자료를 분석한다. 자료로부터 계산한 persistent homology와 군집 나무는 자료 분포의 임의성에 의해 오차가 생기는데, 이를 통계적으로 정량화할 수 있다. 우선 persistent homology의 경우, Rips complex 위에서 핵밀도함수(kernel density estimator)의 persistent homology를 고려함으로써 어떻게 유효한 신뢰 집합을 얻으면서 계산복잡도를 향상할 수 있는지 알아본다. 군집 나무의 경우, 핵밀도함수의 군집 나무를 고려함으로써 어떻게 유효한 신뢰 집합을 얻고 가지치기(pruning)를 하는지 알아본다.