學習.思考 好用軟體一籮筐 訊息.趨勢 谷歌大神

Google MUM 技術讓搜尋結果跨語言、跨類型提供正確資訊,知識轉移更輕而易舉!

Google MUM 技術讓搜尋結果跨語言、跨類型提供正確資訊,知識轉移更輕而易舉! - 阿祥的網路筆記本

 

許多事物都有不同稱呼,比如碳酸飲料又名汽水,毛衣又名針織衫,美式足球又名橄欖球。這些名稱差異有的是語言功能使然,有的是在反映文化上的細微差異,也有單純因為地域不同,所以有同樣的東西有不同的稱呼。

 

 

 

 

你可能對這個有興趣…

 

 

而新冠肺炎(COVID-19 )就是一個非常具有代表性的例子,自 2 月的第一周以來,全球對冠狀病毒的搜索量就增加了 260% 之多,而 Google 也將相關資訊整合,並將相關正確資識與世界衛生組織(WHO)的權威訊息相互鏈結。對於專門尋找有關症狀、預防或治療信息的人,Google 正在努力擴展我們的健康狀況知識面板,包括 COVID-19 面板來提供即時資訊。

 

 

Google MUM 技術讓搜尋結果跨語言、跨類型提供正確資訊,知識轉移更輕而易舉! - 阿祥的網路筆記本

 

先前,Google 必須學會辨識大家用來指稱新型冠狀病毒的每個詞組,以確保為來自世界各地的搜尋者呈現優質且及時的資訊,讓大家都能從世界衛生組織、美國疾病控制與預防中心等值得信賴的衛生主管機關獲得正確情報。如今一年過去,疫苗因為變種而有更多不同的類型,名稱問題又為 Google 帶來了類似的挑戰。但和先前不同的是,Google 現在已經透過「Multitask Unified Model (MUM, 多任務統一模型) 」這項新工具來優化搜尋結果。

 

Google MUM 技術讓搜尋結果跨語言、跨類型提供正確資訊,知識轉移更輕而易舉! - 阿祥的網路筆記本

 

 

什麼是 MUM?

我們在使用 Google 搜尋時,通常為了滿足一項目的(例如:旅遊、學習),而需要進行多次、多關鍵字的搜尋,Google 發現到,人們平均會針對複雜問題任務發出多達 8 個查詢。以登山為例,你需要搜尋目的地的環境資訊以了解要準備哪些衣物、裝備,而 Google 的 MUM 就是為了「解決問題」而出發的功能,過去使用者需要自行深思熟慮一一完成的搜尋,現在 Google 可以協助你找出相關聯的知識,就像你與一位專家對談一下,你只需要問一個問題就夠了。

 

Google MUM 技術讓搜尋結果跨語言、跨類型提供正確資訊,知識轉移更輕而易舉! - 阿祥的網路筆記本

 

MUM 改變了 Google 幫助您處理複雜任務的方式。MUM 使用 T5 文本與文本框架 ,比 BERT 強大 1,000 倍 。MUM 不僅能理解語言,還能生成語言。它同時接受了 75 種不同語言和許多不同任務的訓練,使其能夠比以前的模型更全面地理解信息和世界知識。MUM 是多樣態的,因此它可以理解文本和圖像中的信息,並且在未來可以擴展到更多功能模組,例如視訊和音訊。

 



 

MUM 的分析範圍是多模態的,這意味著它可以同時理解來自不同格式的信息,如網頁、圖片等。最後,您或許可以為您的登山靴拍張照片,然後問:「我可以用這些裝備來攀登富士山嗎?」,而 Google 會理解圖像並將其與您的問題聯繫起來,並回答你的問題,並可以將您指向一個包含推薦裝備列表的部落格或網站。

 

 

 

了解針對疫苗資訊的搜尋,並進一步整合內容

根據 Google 的分析,AstraZeneca、CoronaVac、Moderna、Pfizer、Sputnik 等廣泛使用的疫苗在全世界共有超過 800 種名稱。使用者在搜尋疫苗資訊時,可能會使用「Coronavaccin Pfizer」、「mRNA-1273」、「CoVaccine」等各式各樣的關鍵字。而 Gogole 是否能正確識別所有的疫苗名稱,對於使用者能否獲得可靠的最新疫苗資訊至關重要。然而,要想辨識出全球使用者對於疫苗的不同稱呼,就得付出大量的時間成本,以人工而言需要幾百小時。

 

Google MUM 技術讓搜尋結果跨語言、跨類型提供正確資訊,知識轉移更輕而易舉! - 阿祥的網路筆記本

 

但現在有了 MUM,Google 就可以在短短幾秒鐘內辨識出 800 種以上超過 50 種語言用來稱呼疫苗的詞語。在驗證 MUM 的搜尋結果後,我們已能將這個模型應用在 Google 搜尋服務中,幫助使用者找到全世界有關 COVID-19 疫苗的優質及時資訊。

 

Google MUM 技術讓搜尋結果跨語言、跨類型提供正確資訊,知識轉移更輕而易舉! - 阿祥的網路筆記本

 

Google MUM 技術讓搜尋結果跨語言、跨類型提供正確資訊,知識轉移更輕而易舉! - 阿祥的網路筆記本

 

 

跨語言轉移知識

MUM 之所以能在幾秒內完成一項原本需要數週時間的工作,就是因為具有知識轉移能力。MUM 能夠從本身接受訓練的超過 75 種語言中學習並轉移知識。以閱讀一本書為例,如果你會多種語言,就可以在閱讀後用你會的其他語言來分享書中重點(取決於你的精通程度),因為你對這本書的理解不是取決於對語言或翻譯的依賴。MUM 對於不同語言知識的轉移也很類似這樣的概念。

 



 

MUM 也因為具有知識轉移能力,所以不需要從每一種新語言中學習新的能力或技能。這種跨語言遷移學習能力可以幫助我們快速擴展系統的改善,即使沒有太多訓練資料也是如此。這在一定程度上要歸功於 MUM 的樣本效率;換句話說,相較於之前的模型,MUM 在完成同一件工作時需要的資料量要少得多。以疫苗名稱來說,只需要一小部分官方疫苗名稱作為樣本,MUM 就能快速識別這是疫苗在不同語言間的名稱。

 

 

使用 MUM 來改善 Google 搜尋

MUM 的第一個應用讓我們能幫助世界各地的使用者及時取得關鍵資訊,Google 期待 MUM 在未來可以透過多種方式讓 Google 搜尋變得更實用。在早期的測試結果中顯示,MUM 不僅可以在許多面向上改進 Google 現有的系統,還可以協助打造全新的方式來探索和搜尋資訊。

 

 

你可能對這個有興趣…

 

 

相關連結:

Google台灣 – 官方部落格: MUM 對於 Google 搜尋提供 COVID-19 疫苗資訊有何幫助
Coronavirus (COVID-19): How Google is helping – The Keyword
MUM: A new AI milestone for understanding information

 

歷史上的這一天,我還寫了…

你也許會喜歡

無留言

發表留言