至今為止,AI 翻譯主要著重於各種書寫語言。但在全球超過 7,000 種的現存語言中,將近半數主要是以口語表達,而沒有標準或廣泛使用的書寫文字系統。這導致我們無法使用標準技術為這類語言打造機器翻譯工具,因為標準技術需有大量的書寫文字來訓練 AI 模型。為克服這項挑戰,Meta 為主要以口語表達的「閩南語(Hokkien)」打造了一個史無前例的人工智慧技術翻譯系統。閩南語是華裔群眾廣泛使用的語言,但缺少標準書寫文字系統。Meta 的技術可讓使用閩南語的人士與使用英語的人士對話。
你可能對這個有興趣…
- 買 3C 到蝦皮,選擇更多價格更優!
- 辦公軟體全場最便宜 3.8 折起!Office、作業系統限時特殺最低價!
- 最強資安防護軟體卡巴斯基這裡買,輸入折扣碼「AXIANG」結帳再享九折優惠!
- 大朋友、小朋友買玩具來這裡!熱門商品一次買到!
- 高速穩定、自由翻牆:Ivacy VPN 獨家超高折扣只有這裡
該開放原始碼的翻譯系統是 Meta Universal Speech Translator(UST,或譯:通用語音翻譯工具)專案的一部分,該專案致力於開發新的 AI 方法,希望最終能為所有現存語言進行即時語音翻譯,包括主要以口語表達的語言。Meta 相信口語溝通有助於打破隔閡,拉近人們之間的距離,無論身在何處,甚至在元宇宙中也不例外。
為開發這個只有語音的全新翻譯系統,Meta AI 研究人員必須克服許多來自傳統機器翻譯系統的挑戰,包括資料蒐集、模型設計,以及準確度評估。未來 Meta 不只會開放閩南語翻譯模型的原始碼,也會公開評估資料集和研究報告,讓他人能夠重製並以我們的工作成果為基礎建立模型。
克服訓練資料的挑戰
Meta 著手打造閩南語翻譯系統時,面臨的一個重大障礙就是是否能夠蒐集到足夠的資料。閩南語是所謂的資源匱乏語言,這意味著與西班牙文或英文等語言相比,該語言尚未有足夠的訓練資料。此外,將英語翻譯成閩南語的翻譯人員相對來說很少,因此更難以蒐集資料並加上註解來訓練模型。
Meta 利用中文作為中間語言,以建立偽標籤和人工翻譯,意思是我們先將英語(或閩南語)語音翻譯成中文文字,接著再翻譯成閩南語(或英語),然後新增至訓練資料中。此方法利用了資源充足的相似語言的資料,藉此大幅改善了模型成效。
另一個產生訓練資料的作法是語音探勘,Meta 使用預先訓練好的語音編碼器,便能透過編碼方式將閩南語語音嵌入內容加入到其他語言的相同語意空間中,而無須取得閩南語的書寫文字。閩南語語音可以和擁有相似語意嵌入內容的英語語音和文字配對,接著從文字來合成英文語音,產生平行的閩南語和英語語音。
全新的模型作法
許多語音翻譯系統依賴轉譯內容,或依賴語音轉文字系統。但由於主要以口語表達的語言並沒有標準書寫文字形式,因此我們就無法將翻譯的文字製作成翻譯內容輸出。因此,Meta 聚焦於語音轉語音翻譯。
Meta 使用語音轉單元翻譯(speech-to-unit translation,S2UT)系統,直接在先前由 Meta 開創的路徑中,將輸入的語音翻譯成一系列聲學單元,然後從這些單元中生成波形。此外,針對二次解碼機制採用 UnitY,讓第一階段的解碼器產生相關語言(中文)的文字,然後讓第二階段的解碼器製作單元。
評估準確度
語音翻譯系統通常會使用稱為 ASR-BLEU 的衡量指標來評估,首先需使用自動語音識別系統(ASR)將翻譯後的語音轉譯成文字,然後將轉譯後的文字與人工翻譯的文字比較,以計算 BLEU 分數(標準機器翻譯衡量指標)。但評估主要以口語表達的語言(例如閩南語)時,評估語音翻譯的挑戰之一就是沒有標準的書寫文字系統。為啟動自動評估程序,Meta 開發了稱為 Tâi-lô 的系統,將閩南語語音轉譯成標準化的拼音符號。這項技術讓 Meta 能以音節為單位計算 BLEU 分數,並能夠很容易地比較不同方法下的翻譯品質。
除了開發方法以評估閩南語與英語語音翻譯的準確度,Meta 也根據名為 Taiwanese Across Taiwan 的閩南語語音語料庫,建立第一個閩南語與英語雙向的語音翻譯基準資料集。Meta 將開放此基準資料集的原始碼,以鼓勵其他研究人員合作進行閩南語語音翻譯,並一同在該領域中取得進一步進展。
展望翻譯的未來
在目前的階段中,Meta 的作法能夠讓使用閩南語的人士與使用英語的人士對話。雖然該模型仍在開發中,而且每次只能翻譯一個完整句子,但已朝著未來實現為各種語言提供同步翻譯的目標邁開一步。
Meta 首創用於閩南語的各項技術,可以擴展至許多其他有書寫系統和無書寫系統的語言。為此,Meta 將發佈 SpeechMatrix(暫譯語音矩陣),這是由 Meta 的創新資料探勘技術支援的大型語音翻譯語料庫,稱為 LASER,能讓研究人員建立自己的語音翻譯(S2ST)系統,並以 Meta 的工作成果為基礎,展開研究及開發工作。
此外,Meta 在非監督方式語音識別技術(wav2vec-U)與非監督方式機器翻譯(mBART)上的最新進展,將有助於未來能翻譯更多口說語言的工作。隨著在非監督學習上的進展,Meta 證明了在沒有人工註解下建立高品質的語音轉語音翻譯模型的可行性。這將大幅降低往後擴展至低資源語言的條件,因為其中大部分的語言都沒有獲得標記的資料。
AI 研究有助於打破在現實世界和元宇宙中的語言限制,未來,所有語言,無論是否可以書寫,都不再是阻礙大家相互理解的障礙。Meta 期待為未來順暢無阻的溝通持續貢獻。
你可能對這個有興趣…
- 買 3C 到蝦皮,選擇更多價格更優!
- 辦公軟體全場最便宜 3.8 折起!Office、作業系統限時特殺最低價!
- 最強資安防護軟體卡巴斯基這裡買,輸入折扣碼「AXIANG」結帳再享九折優惠!
- 大朋友、小朋友買玩具來這裡!熱門商品一次買到!
- 高速穩定、自由翻牆:Ivacy VPN 獨家超高折扣只有這裡
相關連結:
AI translates Hokkien, an unwritten language, for the first time
FSW – TAT Corpus
歷史上的這一天,我還寫了…
- 便攜藍牙鍵盤 KF8700 開箱:78 鍵功能完整,附帶隱藏式觸控板操控流暢、還有立架方便搭配手機、平板等行動裝置! - 2024
- 三星可能讓 Galaxy Z Fold 6 變得更薄?但相機可能還是老樣子? - 2023
- Google 在台推出 Pixel 6、Pixel 6 Pro 與二代 Nest Hub 新品,即日起展開預購、10/28 正式上市! - 2021
- 金士頓 Kingston 推出新一代 DataTraveler 系列隨身碟,讓資料儲存更有型有色! - 2020
- 電視終於來了!小米台灣宣佈 65 型小米智慧顯示器正式登台,首波限量價 16999 元新台幣!10/22 早上 10 點開搶! - 2020
- 支援 Note10+ 45W 快充!ELECJET PowerPie 20000mAh PD 快充行動電源開箱,iPhone 11 系列、Google Pixel 與筆電都支援快充的行動充電神器! - 2019
- [Event] 最經典跑車品牌保時捷 Porsche 70週年「與時並勁」台灣慶祝活動現場記實! - 2018
- [Google] 介面改頭換面,功能小調整更順手的「Google 日曆」來了!改版重點一次看! - 2017
- [Unbox] 非典型NAS,搭配多元化應用更具可玩性:QNAP TS-451A產品功能與評測分享! - 2016
- [每日一片] 能說好台語的人,真的很厲害:來看看謝龍介議員教你說台灣俗語! - 2015
無留言