介紹兩個 unsupervised learning 演算法 PCA 跟 diffusion map
兩者非常像
基本上就是原資料生出某矩陣
計算eigenvalue 跟 eigenvector即可
因為一開始的矩陣決定了你的特徵向量代表的物理意義
只找前幾個的原因是這些算法都在尋找最佳表示法
而線性代數中對角化就是在找對佳表示法
我講最大的區別在哪裡
最大的區別就是PCA在找的最佳表示法是線性的
擴散圖是非線性的
PCA利用的是一般的平移旋轉
diffusion map用的是熱統計的擴散方程的解
它假設一個數據點到另一個數據點用擴散的連過去
No comments:
Post a Comment