基於其他語言條目之維基百科條目內容自動生成(1/3)

專案詳細資料

Description

隨著網路與社群媒體的興起,線上百科已是現代人日常生活重要之知識來源。維基百科因其自由開放與共享之精神,是目前網路上最大且最重要的百科全書知識庫。然中文維基百科雖然參與者眾,其條目數與西方主流語言的維基百科相比,仍然存在數倍以上的巨大差距,幾乎不可能以人工弭平。本計畫期望能以人工智慧的方法弭平這種知識差距。我們的構想是:研發人工智慧的技術,根據其他多種語言的條目,自動生成中文條目及內容,以擴充中文維基百科的知識涵蓋率,從而實現中文知識內容的流通與傳播。我們的發展步驟如下:第一年,我們將發展跨語言英中維基百科條目內容改寫技術,透過「跨語言階層式 Transformer」,將英文內容轉換生成為中文條目內容。第二年,我們擬發展基於循環生成對抗網路之文章風格轉換方法,自動學習如何依據目標用戶的習慣調整風格。第三年,我們將發展利用多語條目及外部資料之自動改寫技術。此技術利用維基百科多語種之優勢,將不同語言版本的百科知識以中文呈現,進而使中文維基百科的內容更加完備。
狀態已完成
有效的開始/結束日期1/08/2031/07/21

聯合國永續發展目標

聯合國會員國於 2015 年同意 17 項全球永續發展目標 (SDG),以終結貧困、保護地球並確保全體的興盛繁榮。此專案有助於以下永續發展目標:

  • SDG 3 - 良好的健康和福祉
  • SDG 7 - 經濟實惠的清潔能源

Keywords

  • 跨語言百科內容自動生成
  • 跨語言階層式 Transformer神經網路模型
  • 循環生成對抗網路﹑文章風格轉換
  • 自動改寫

指紋

探索此專案觸及的研究主題。這些標籤是根據基礎獎勵/補助款而產生。共同形成了獨特的指紋。