好用軟體一籮筐 學習.思考

活用文字轉語音~AI 加持免人工配音更便利!輕鬆打造專業影音創作-同場加映 iMyFone VoxBox 工具使用教學!

活用文字轉語音~AI 加持免人工配音更便利!輕鬆打造專業影音創作-同場加映 iMyFone VoxBox 工具使用教學! - 阿祥的網路筆記本

最近幾年影音內容類型的創作發展蓬勃,有不少人都加入成為創作者的行列,除了各類型的影音平台能成為大家發展的舞台,創作者可以使用的工具也愈來愈多,除了基本的畫面拍攝要靠自己,其他都能找到適合的工具來協助,像是過去讓不少人覺得最困擾的「配音」,現在也有工具輔助,讓你不用「自己來」!

你可能會有興趣

對於影音創作者來說,有不少類型的影片都需要透過預先撰寫文字腳本後再進行旁白錄製搭配,除了考驗創作者的文字撰寫能力,也需要多練習發音的正確性和語句的清晰,甚至語氣中的情緒轉折也都需要花很多時間著墨,並沒有大家想像這麼簡單。

文章目錄

關於「文字轉語音」

不過好在多年前就已經有了「文字轉語音」的技術,可以透過合成的方式讓電腦幫我們「念」出文稿,但語音轉文字比較大的問題會是像「Google 小姐」那樣較為生硬,不過好在近幾年 AI 技術的發展迅速,文字轉語音的自然語音效果已經愈來愈生動,想要讓AI模仿聲音並非難事,也能做到文字轉語音真人效果讓人難以分辨的地步。

iMyFone 在 9 月份全新推出主打 AI 模仿聲音 & 智慧語音轉文字的「VoxBox」工具,提供使用者最完整的文本轉語音、語音轉文本與客製化語音模型自定…等功能。
iMyFone 在 9 月份全新推出主打 AI 模仿聲音 & 智慧語音轉文字的「VoxBox」工具,提供使用者最完整的文本轉語音、語音轉文本與客製化語音模型自定…等功能。

目前市面上「文字轉語音」的應用不少,且包括線上服務、手機 APP 或是電腦端應用程式…等不同類型,而各家服務也都有各自的特色,像是真人語音的擬真度、可選擇語音類型的種類,以及實際應用上是否足夠廣泛,甚至還能提供自定義語音模型的建置…等,而近期阿祥就接觸到全新推出的 AI 模仿聲音與智慧語音轉文字工具「iMyFone VoxBox」,功能十分全方位,透過 AI 技術的整合,提供各種不同語言的擬真語音選擇,可以輕鬆將文字轉換為語音內容,可以滿足影音創作者對於敘述溝通的需求。

此外,iMyFone VoxBox 也支援了「聲音製作」的功能,無需額外的程式設定,只需要透過簡單的設定即可生成極為擬真的自定義語音,並運用在文字轉語音上。此外,iMyFone VoxBox 也整合了錄音檔轉文字的功能(也支援影片或圖片轉換),可用在影片內文轉錄、錄音逐字稿的應用上。

iMyFone VoxBox 功能簡介

  • 支援系統:Windows 7 以上、MacOS 10.12 以上、iOS 13 以上、Android 7 以上
  • 硬體需求:電腦 – Intel Core 第 6 代以上處理器、8GB 以上記憶體、10GB 以上儲存空間
  • 下載連結:https://tw.imyfone.com/voice-generator/

影片:AI文字轉語音工具🙎 🙎‍♂️完美真實貼合自然人聲,同時支援語音轉文字!

iMyFone VoxBox 功能指引

在 iMyFone 的官網上可免費下載試用 VoxBox ,目前這款軟體也同步支援 Windows、MacOS、iOS 與 Android 等不同作系統與多達 100 多種國際語音,對於使用者來說算是非常友善,不過要特別注意的是,免費版本可使用的功能有所限制,文字轉語音 / 語音轉文字 / 語音克隆…等功能都會有額度的限制,在進一步了解軟體功能後,大家可以再決定是否要付費。

在 iMyFone 官網上可下載 VoxBox 並進行安裝,目前有支援 Windows、MacOS、Android 與 iOS 四個平台
在 iMyFone 官網上可下載 VoxBox 並進行安裝,目前有支援 Windows、MacOS、Android 與 iOS 四個平台
以 Windows 版本為例,下載好安裝檔後雙擊,即可依照畫面指示完成安裝。
以 Windows 版本為例,下載好安裝檔後雙擊,即可依照畫面指示完成安裝。

語音轉文字功能

在 VoxBox 的主畫面左側可以看到各個主要功能的切換選項,在切換至「文字轉語音」的功能之後,可以看到中間欄位的文字輸入區與右側的語音設定介面,我們可以選擇自己想要使用的語音模型,內建相當多種類的語系,當然也包括台灣人熟悉的「國語」,且男性、女性都有,在選擇時也可以先試聽看看效果。

VoxBox 的主頁面採用三欄式設計,最左側為功能切換,以「文字轉語音」為例,切換後可看到中間與右側的編輯設定區,上圖 1 的區塊可透過圖片、文字進行文字的匯入,或是直接在下方的 2 欄位輸入文字,一次最多可輸入 5000 個字元,而右側 3 的區塊可選擇想要的語音模型,並在 4 的區域進行聲音的整體設定,或是選取文字段落進特定設定,設定完成後按下「轉換」即可完成文字轉語音,並詳列於下方 5 的區塊中。
VoxBox 的主頁面採用三欄式設計,最左側為功能切換,以「文字轉語音」為例,切換後可看到中間與右側的編輯設定區,上圖 1 的區塊可透過圖片、文字進行文字的匯入,或是直接在下方的 2 欄位輸入文字,一次最多可輸入 5000 個字元,而右側 3 的區塊可選擇想要的語音模型,並在 4 的區域進行聲音的整體設定,或是選取文字段落進特定設定,設定完成後按下「轉換」即可完成文字轉語音,並詳列於下方 5 的區塊中。
透過「Change Speaker」可進入到語音模型的選擇,除了直接在清單選擇,也能透過上方搜尋列以關鍵字搜尋,或透過語系下拉清單過濾。
透過「Change Speaker」可進入到語音模型的選擇,除了直接在清單選擇,也能透過上方搜尋列以關鍵字搜尋,或透過語系下拉清單過濾。
像是我們設定語系晚「國語(台灣)」,即可看到目前可選擇的六組語音,共三位男性、三位女性,點選頭像可試聽語音風格。
像是我們設定語系晚「國語(台灣)」,即可看到目前可選擇的六組語音,共三位男性、三位女性,點選頭像可試聽語音風格。
若是不想手動輸入文字,也能透過左上角的「匯入文字」功能,透過 WORD 檔、PDF 檔、JPG 圖片、PNG 圖片、BMP 圖片與 TIFF 圖片等格式完成文字的匯入。
若是不想手動輸入文字,也能透過左上角的「匯入文字」功能,透過 WORD 檔、PDF 檔、JPG 圖片、PNG 圖片、BMP 圖片與 TIFF 圖片等格式完成文字的匯入。

選擇好語音模型後,我們也能進一步設定語音的「整體設定」 ,包括語句中的「停頓」,說話的「速度」,以及是否要搭配背景音樂增強氛圍感。另外在「特定設定」中也能決定文字段落的「停頓」、「音量」、「音調」…等設置,針對「破音詞」與「重音」也能額外設定,設定完成後,即可按下「轉換」按鈕將文字轉為語音,轉換完成的語音也會出現在列表中,讓我們隨時聆聽,或是選擇進一步增加效果或是匯出為檔案。

針對文句中的特定段落,我們可以手動調整語氣的強弱、音量大小、停頓、語速放緩…等設定,來強化最終輸出成品的真實性。
針對文句中的特定段落,我們可以手動調整語氣的強弱、音量大小、停頓、語速放緩…等設定,來強化最終輸出成品的真實性。
除了單純將文字轉為語音,我們也能在匯出前額外加入背景音樂增加圍感。
除了單純將文字轉為語音,我們也能在匯出前額外加入背景音樂增加圍感。
設定完成後,按下「轉換」等待片刻,即可看到下方轉換完成的成品,可直接點選播放聆聽,也能透過「增強」功能進一步強化語音效果,同時也能匯出檔案轉存或是刪除。
設定完成後,按下「轉換」等待片刻,即可看到下方轉換完成的成品,可直接點選播放聆聽,也能透過「增強」功能進一步強化語音效果,同時也能匯出檔案轉存或是刪除。

比較有趣的是,VoxBox 中也內建了非常多種類型的語音模型,像是明星、名人甚至卡通人物的語音都蒐羅其中,只不過目前僅支援英文居多,但都可以試著玩玩看!下面阿祥也試著以中文語音模型展示幾段文字轉語音的成品讓大家參考一下!

影片:iMyFone VoxBox 文字轉語音功能展示

聲音製作功能,打造你的「語音分身」

除了使用內建的語音模型,VoxBox 另一個功能強大之處,就是直接將「AI 模仿人聲」的技術加入其中,不需要透過額外的應用程式或複雜設定,只要透過「聲音製作」功能指引,加入語音樣本,短時間內就能產出聲音、語調微妙微肖的「語音分身」,之後在文字轉語音功能中就能直接套用,將配音工作直接交由它代勞。

VoxBox 的「聲音製作」可說是這款應用另一個重要的亮點之一,透過「聲音克隆」的功能,我們可以打造個人專屬的「語音分身」,為你錄製各種語音旁白。
VoxBox 的「聲音製作」可說是這款應用另一個重要的亮點之一,透過「聲音克隆」的功能,我們可以打造個人專屬的「語音分身」,為你錄製各種語音旁白。
定製語音的方法有兩種,可上傳多達 25 個聲音樣本至雲端分析,或是直接在 VoxBox 透過麥克風朗讀指定文本讓 AI 進行分析與複製,阿祥自己是推薦後者。
定製語音的方法有兩種,可上傳多達 25 個聲音樣本至雲端分析,或是直接在 VoxBox 透過麥克風朗讀指定文本讓 AI 進行分析與複製,阿祥自己是推薦後者。
選擇朗讀文本,可依畫面指示文字念出三段文句,作為 AI 取樣的基礎。
選擇朗讀文本,可依畫面指示文字念出三段文句,作為 AI 取樣的基礎。
三段語音錄製完成後,可預覽確認內容是否正確,同時也能進行重新錄製,若無誤即可選擇右下角「開始克隆」的按鈕啟動生成。
三段語音錄製完成後,可預覽確認內容是否正確,同時也能進行重新錄製,若無誤即可選擇右下角「開始克隆」的按鈕啟動生成。
定製語音製作完成後,即會出現在「我的聲音庫」中,預設名稱為「User Voice」,我們也可以手動進行名稱的變動,之後就可以使用這個聲音庫來實現文字轉語音的功能囉!
定製語音製作完成後,即會出現在「我的聲音庫」中,預設名稱為「User Voice」,我們也可以手動進行名稱的變動,之後就可以使用這個聲音庫來實現文字轉語音的功能囉!
使用定製語音的方式與前面的「文字轉語音」相同,透過「Change Speaker」可替換成我們創建的語音,並進轉換生成,下面阿祥也透過一段影片,分別錄製阿祥的真人語音、VoxBox 製作語音的中文 / 英文轉換成品,大家也可以聽聽看像不像哦!
使用定製語音的方式與前面的「文字轉語音」相同,透過「Change Speaker」可替換成我們創建的語音,並進轉換生成,下面阿祥也透過一段影片,分別錄製阿祥的真人語音、VoxBox 製作語音的中文 / 英文轉換成品,大家也可以聽聽看像不像哦!

影片:iMyFone VoxBox 聲音製作(聲音克隆、聲音複製)-模擬阿祥真人語音效果比較

語音轉文字,將影片、錄音內容轉錄逐字稿

除了強大的文字轉語音,VoxBox 也提供了「語音轉文字」的功能,而且支援將錄音、影片匯入,將語音內容轉錄成為逐字稿,對於活動、會議記錄使用很方便,也為我們省去聽打的麻煩。

透過「語音轉文字」的功能,我們可以將有語音的音檔或影片匯入,由 VoxBox 幫我們轉錄出來,就像有人幫你聽打逐字稿一樣輕鬆!在加入檔案前,別忘了先設定上方的「語言」為符合台灣國語的「Maindrain(Taiwan)」。
透過「語音轉文字」的功能,我們可以將有語音的音檔或影片匯入,由 VoxBox 幫我們轉錄出來,就像有人幫你聽打逐字稿一樣輕鬆!在加入檔案前,別忘了先設定上方的「語言」為符合台灣國語的「Maindrain(Taiwan)」。
加入檔案後,按下右下角「轉換」即可進行文字的轉錄囉!
加入檔案後,按下右下角「轉換」即可進行文字的轉錄囉!
最終辨識出來的文字會出現在中央的欄位中,我們可以進一步編輯或複製下來使用。
最終辨識出來的文字會出現在中央的欄位中,我們可以進一步編輯或複製下來使用。

還有更多附屬加音訊工具也超方便

除了前面提到的主要功能,VoxBox 也內建了許多降加了音訊工具值得一試,像是可以透過 AI 輔助自己 DIY 打造「饒舌歌曲」,或是將語音轉為其他語音的「音檔變聲」功能,其他包括可以強化音訊效果的「音效增強 」,以及內建的「錄音」、「音檔轉換器」與「編輯」功能,都能讓我們一次完成音訊編輯相關的工作,讓創作一次到位!

VoxBox 中也提供了 AI 人工智慧協助創作饒舌歌曲的功能,而且從歌詞開始就能交給 AI 處理哦!我們可以先選擇好右上角的歌手語音模型,並選擇創作歌曲的節拍與要搭配的曲目,接下來按下「生成 AI 歌詞」。
VoxBox 中也提供了 AI 人工智慧協助創作饒舌歌曲的功能,而且從歌詞開始就能交給 AI 處理哦!我們可以先選擇好右上角的歌手語音模型,並選擇創作歌曲的節拍與要搭配的曲目,接下來按下「生成 AI 歌詞」。
在上方可輸入饒舌歌曲的主題(中英文皆可),點選「生成歌詞」,即可在下方生成出完整的英文歌詞,並可透過右下角的按鈕「匯入歌詞」。
在上方可輸入饒舌歌曲的主題(中英文皆可),點選「生成歌詞」,即可在下方生成出完整的英文歌詞,並可透過右下角的按鈕「匯入歌詞」。
接下來按下「轉換」即可完成一首完整的 Rap 說唱歌曲囉!
接下來按下「轉換」即可完成一首完整的 Rap 說唱歌曲囉!
VoxBox 也提供了 AI 技術輔助的「音頻變聲」功能,可將任意語音轉換成為所選擇的名人聲音。
VoxBox 也提供了 AI 技術輔助的「音頻變聲」功能,可將任意語音轉換成為所選擇的名人聲音。
VoxBox 內也加提供「音效增強」功能,可為我們進行背景噪音消除、提升音質、淨化語音與修正音量…等處理。
VoxBox 內也加提供「音效增強」功能,可為我們進行背景噪音消除、提升音質、淨化語音與修正音量…等處理。
VoxBox 也內建了「錄音」功能,搭配麥克風即可在同一應用中完成語音的錄製,不用再開啟其他程式。
VoxBox 也內建了「錄音」功能,搭配麥克風即可在同一應用中完成語音的錄製,不用再開啟其他程式。
VoxBox 內建的「音檔轉換器」也能將任意影片的音檔轉換出來使用。
VoxBox 內建的「音檔轉換器」也能將任意影片的音檔轉換出來使用。
VoxBox 也直接內建「編輯」工具,可進行音訊檔案的快速剪輯。
VoxBox 也直接內建「編輯」工具,可進行音訊檔案的快速剪輯。

結語:功能完整,不斷更新進化創作利器!

相較於市面上其他同類型的文字轉語音工具,iMyFone VoxBox 最大的優勢就是內建功能十分完整,除了主要的文字轉語音提供更具彈性的文字、圖片與檔案…等方式匯入文本,也有極為多樣化的真人語音模型可以選擇,同時也能支援在地化的台灣口音,而且也能依照文本與實際需求進行語速、特定段落音調…等細部調整,進一步提升真實性。

VoxBox 的「工具箱」中也列出了其他可以協助創作者完成音訊創作的其他工具,都相當值得一試。
VoxBox 的「工具箱」中也列出了其他可以協助創作者完成音訊創作的其他工具,都相當值得一試。

當然,阿祥自己覺得最讓人驚艷的應該還是「聲音製作」功能,透過 AI 技術量身打造符合自己說話聲調、風格的語音模型,成為你的專屬「代言人」。而且阿祥自己使用 VoxBox 已經一段時間了,發現到軟體的更新頻率相當高,也陸續為內建完善,像是可以選擇的語音模型的類型也愈來愈多,讓功能持續進化。

VoxBox 本身可免費試用,不過若是想要「解放」它所有的功能,會建議選購完整版本。
VoxBox 本身可免費試用,不過若是想要「解放」它所有的功能,會建議選購完整版本。

除了影音創作的旁白配音可以透過文字轉語音的功能讓過程變得更簡單、不用花時間練習口說和語氣,在日常中也有不少可以發揮功能的應用層面,像是自製語音教學內容、錄製有聲書、打造企業的語音客服…等,也都能透過 iMyFone VoxBox 的內建功能帶來助益,因此蠻推薦相關應用領域的使用者可以親身試用看看,絕對讓你耳目一新哦!

你可能會有興趣

相關連結:

[官方] iMyFone VoxBox – 文字轉語音 AI 配音工具,兼具AI 聲音模仿功能

歷史上的這一天,我還寫了…

你也許會喜歡

2 留言

  • 回覆
    Lin Minchang
    2024 年 02 月 01 日 於 19:22:28

    依你的安例,就算不計入破音字,其錯音率仍高得離譜,使其沒有任何實用價值。
    在有退款政策下,因無實用價值,而反應要退款後,該客服也僅願退一半款項。

    這款APP不可試用,實用性又低,建議所有使用者不要採用。

    • 回覆
      阿祥
      2024 年 03 月 12 日 於 22:04:00

      還是要手動調校

    發表留言