交叉數據矩陣型PCA:理論與應用(3/3)

專案詳細資料

Description

主成分分析(PCA)已成為降維方法有用且重要的工具。 兩位日本學者 Yata和Aoshima(2010)在高維度低樣本數的設置中提出了一種基於交叉數據矩陣(CDM)的PCA。研究表明,CDM-PCA具有比PCA更寬的收斂性區域(Yata和Aoshima,2010; Aoshima等,2018); 對於特徵向量,CDM-PCA和PCA具有相同的收斂性區域(Wang 等,2020)。在實務上,CDM-PCA在一些高維度高相關性的數值資料中表現比PCA更好(Yata和Aoshima,2010; Wang 等,2020) 這些文獻結果表明了CDM PCA具有改進高維數據中PCA方法的巨大潛力,但至今仍沒有明確的理論來支持這樣數值結果。 本計劃旨在提供理論解釋,以支持CDM-PCA 在高維度高相關性資料上有更好性能,。 同時,預期發展一個量化指標,用來建議CDM-PCA或PCA的使用時機。此外,我們將研究了CDM-PCA的其他理論特性。例如,眾所周知,隨機矩陣設置中,具有標準高斯分配的樣本協方差矩陣的PCA,它的特徵值微弱收斂於Marcenko-Pastur分佈。我們一個有趣的問題是CDM-PCA對應的漸近行為是什麼?另一方面,本計劃也將CDM的設計結合到其他降維方法中,例如影像處理常用的MPCA,2SDR等。此外,該設計可用於機器學習以改善人工智能中的計算機算法。
狀態已完成
有效的開始/結束日期1/10/2231/10/23

Keywords

  • 漸近常態性
  • 交叉數據矩陣
  • 高維度
  • 低樣本數
  • 主成分分析
  • 隨機矩陣
  • 尖峰協方差模型
  • 擾動

指紋

探索此專案觸及的研究主題。這些標籤是根據基礎獎勵/補助款而產生。共同形成了獨特的指紋。