공부 참고자료: https://gaussian37.github.io/ml-concept-t_sne/
t-SNE 개념과 사용법
gaussian37's blog
gaussian37.github.io
위 글로 공부하면서 내가 필요한 포인트만 정리:
t-분포는 소표본으로 모평균을 추정하는 분포로,
모집단이 정규분포와 유사하나, 모표준편차를 모를때 주로 사용한다
일반적으로 정규분포보다 큰 표준편차를 갖는다고 가정하는데,
이는 정규분포 상에서는 i 번째 변수와 적당히 떨어진 j, 멀리 떨어진 k의 확률이 꼬리로 갈수록 차이가 나지 않기 때문이다.
큰 표준편차를 갖는(=꼬리가 두터운) 분포를 가정하면 변수끼리의 거리가 확률의 차이에 반영된다.
t-sne는 비선형적 방법 / PCA는 선형적 방법이다
t-sne는 iterative한 방법으로 feature 집단을 계산하고 sklearn을 이용하는 방법은 아래 매뉴얼을 따라하면 된다
https://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html
'딥러닝 공부 > 짧은 AI' 카테고리의 다른 글
어쩌다보니 공부한 domain adaptation (0) | 2023.01.09 |
---|---|
Representation Learning (0) | 2022.08.18 |