Date | Jul 13, 2018 |
---|---|
Speaker | 김지수 |
Dept. | Carnegie Mellon University |
Room | 27-116 |
Time | 11:00-12:00 |
이 발표에서는 위상학적 자료 분석(Topological Data Analysis)을 어떻게 하고, 그에 대한 통계적 추정을 어떻게 하는지 간단하게 소개한다. 위상학적 자료 분석은 일반적으로는 자료에서 위상학적인 특성을 추출하는 것을 뜻하는데, 여기서는 persistent homology와 군집 나무(cluster tree)의 통계적 추정을 어떻게 하는지 알아본다. persistent homology는 자료를 여러 해상에서 관측하고 지속성 있게 나타나는 위상 특성을 추려낸다. 군집 나무는 자료의 분포 함수의 레벨 집합의 군집이 어떤 계층 구조를 생성하는지 봄으로써 분포 함수를 요약한다. 분포 함수의 persistent homology와 군집 나무는 직접 계산할 수 없으므로 자료로부터 추정하게 된다. 이때 생성되는 오차를 통계적으로 정량화할 수 있는데, 이 발표에서는 persistent homology와 군집 나무의 경우에 어떻게 통계적으로 유효한 신뢰 집합을 얻을 수 있는지 제시하고, 어떻게 실제로 계산할 수 있는지 알아본다.