遺漏值填補 – 過去、現在與未來(3/3)

專案詳細資料

Description

遺漏值(Missing Value)是造成資料不完整的一項原因,而資料遺漏的原因可能來自人為的資料輸入錯 誤、隱瞒或背景差異等主觀影響所造成的缺失;亦可能來自機器本身,如:儲存失敗、硬體故障、毁損 等導致特定時段内的資料遺漏等。因此,在進行資料探勘時遺漏值的問題往往導致了探勘效能的降 低。針對遺漏值的處理方式可分為直接刪除法以及遺漏值填補法。本研究計晝之第一年研究目的主要 在於收集與檢視從2000至今所發表的相關文獻(共超過一百篇論文)進行探討以發現目前填補遺漏值 的限制,另一方面將試著瞭解使用直接刪除法之最佳時機(例如於何種資料類型以及多少遺漏率等 等)。而第二年的研究目的將著重在統計與監督式學習演算法於填補遺漏值的效能比較,其中將包含 六種不同的演算法。最後一年的研究目的將嘗試推出一個混合式學習的遺漏值填補法以提昇填補遺漏 值的品質。
狀態已完成
有效的開始/結束日期1/08/1831/07/19

聯合國永續發展目標

聯合國會員國於 2015 年同意 17 項全球永續發展目標 (SDG),以終結貧困、保護地球並確保全體的興盛繁榮。此專案有助於以下永續發展目標:

  • SDG 12 - 負責任的消費與生產
  • SDG 17 - 為永續目標構建夥伴關係

Keywords

  • 填補遺漏值
  • 資料前處理
  • 資料探勘
  • 監督式學習法

指紋

探索此專案觸及的研究主題。這些標籤是根據基礎獎勵/補助款而產生。共同形成了獨特的指紋。