相較於過去兩年生成式 AI 在文字對談、文字或圖片生成影像的發展類似,今年的生成式 AI 可說是走向了「多媒體內容」創作的領域,除了讓大家為之驚艷的音樂生成式 AI「Suno AI」,二月份 Open AI 公開的文字生成影片 AI 模型「Sora」,以及三月份開放的同類型服務 Stable Video 也提供所有人公開測試,也讓許多人預言未來的影片創作能夠真正實現「無拍攝」。
你可能會有興趣
- Mac 檔案誤刪、消失、格式化用這一招來救
- 2024 年入手電競螢幕~選購攻略看這裡
- 2024 年最新版!大型按摩椅選購/推薦/體驗心得深入解析
- 買 3C 到蝦皮,選擇更多價格更優!
- 大朋友、小朋友買玩具來這裡!熱門商品一次買到!
- 大家都在用的 Surfshark VPN 下殺 12 折!再送 4 個月免費訂閱!
而近期也出現了另一個影音生成式 AI 服務:由 Luma AI 打造的「Dream Machine」,可以透過文字指令或是上傳的影像生成一段 5 秒左右的動態影片,並能模擬物理反應與真實鏡頭運鏡,而且與 Stable Video 一樣提供了免費的公開測試。
在接下來的文章中,阿祥就為大家帶來實測心得,同時也附上一段採用相同 Prompt 指令在 Sora、Stable Video 與 Dream Machine 生成的影片內容比較!
Dream Machine 基本介紹
目前 Luma AI 的 Dream Machine 可以提供一般使用者免費註冊使用,並提供每個月 30 則影片生成的使用額度,同時也提供標準版、專業版與頂級版三種付費方案,可以提供每個月最多的影片生成數量、更高的影片生成品質、移除浮水印並可允許商業應用。
使用文字生成影片
Dream Machine 以文字生成影片的方式與 Stable Video 大同小異,可使用英文或中文輸入影片場景、內容動作的描述,只不過 Dream Machine 並像 Stable Video 一樣會先生成最多四組靜態影像畫面,再讓使用者選擇其一來生成影片,也沒有進階的鏡頭運鏡的設定,在輸入指令之後,會需要等待一段時間(實測約 5 分鐘以上)才會產出影片。
不過目前看得出來 Dream Machine 在影像生成時仍舊有不少詭異的錯誤發生,像是下面這一段米格魯狗狗在花園玩耍的影片就蠻驚悚的…
影片:Luma AI:Dream Machine 生成影片範例 – 米格魯
使用圖片生成影片
除了透過文字,Dream Machine 也允許上傳圖片作為畫面基礎來生成影片,且可以搭配文字指令輔助,同時也能再上傳另一張圖片作為影片結束的「關鍵幀」,讓使用者更能指定影片生成的發展方向,不過實測若是使用兩張照片上傳來生成影片,系統花費的時間會長達數個小時之久。
這裡提供一組上傳單張照片、不加上任何指令的影片生成範例:
影片:Luma AI:Dream Machine 生成影片範例(圖片上傳生成)
這裡提供一組有上傳照片與結尾關鍵幀、不加上任何指令的影片生成範例:
影片:Luma AI:Dream Machine 生成影片範例(圖片上傳生成,有設定結尾關鍵幀)
結語
Dream Machine 的免費版方案生成的影片尺寸為 1360 x 752 px ,略高於 Stable Video 的 1024 x 576 px 的規格,不過生成結果來看,影片的細節似乎還有不少改進的空間,尤其是影像的清晰度有些不足,這一點是略遜色於 Stable Video 的,但不確定是否付費版本的生成品質會有明顯的提升?
若要比較目前已經公開的影片生成式 AI 模型,毫無疑問 Open AI 的 Sora 仍舊是最令人驚艷的一個,不過由於該服務還未向公眾開放,因此並不清楚實際使用的狀況是否如官方已揭露的生成內容這樣高水準,尤其是 Sora 可允許成成數十秒甚至一分鐘的長影片,相較於 Stable Video 與 Dream Machine 僅能生成 5 秒左右長度的影片,仍然有不小的差距。
目前有傳言 Sora 在今年年底前就會正式公開上線,在這之前是否還會有其他的影片生成式 AI 出現來挑戰,應該是相當值得大家期待的吧?
影片:影片生成式 AI 服務比較(Sora、Stable Video、Dream Machine)
更多 AI 相關文章
- ChatGPT 還不夠?iPhone 今年秋季將 Gemini AI 也一併整合其中
- 蘋果、Google與三星行動AI發展比較:隱私、樂趣或便利?
- AI 文字、圖片生成影片服務 Stable Video 實測心得!
- 你的隱私已經成為 ChatGPT 和 Google Bard 的 AI 訓練素材?
- Windows 用戶請注意…微軟的 Copilot 可以存取你的檔案後是否造成隱私問題?
- NVIDIA 推出「Chat With RTX」可在 RTX 30、RTX 40 GPU 電腦本機運行大型語言模型
- Google 相簿的「Project Ellmann」計劃讓 AI 看盡你的照片、道盡你的人生?
- Meta 推出「Imagine」AI 圖片生成工具,第一手實測心得分享!
- Image Creator from Microsoft Designer 大進化?升級「DALL-E3」模型之後變強了嗎?實測心得分享!
- AI 加持!Google 推出「SGE」生成圖像搜尋體驗,搜不到圖就幫你「無中生有」!
- 高通 Snapdragon 平台將導入 Llama 2 AI 大型語言模型,最快 2024 年手機就可使用!
- Image Creator from Microsoft Designer 功能實測:簡單好上手的 AI 圖像生成工具,下達指令就能獲取各類型圖片!
你可能會有興趣
- Mac 檔案誤刪、消失、格式化用這一招來救
- 2024 年入手電競螢幕~選購攻略看這裡
- 2024 年最新版!大型按摩椅選購/推薦/體驗心得深入解析
- 買 3C 到蝦皮,選擇更多價格更優!
- 大朋友、小朋友買玩具來這裡!熱門商品一次買到!
- 大家都在用的 Surfshark VPN 下殺 12 折!再送 4 個月免費訂閱!
相關連結:
歷史上的這一天,我還寫了…
- Xiaomi 手環 8 於 7/10 在台開賣,快拆錶帶打造不同風格! - 2023
- 創作者專屬!十銓 T-CREATE 系列推 DDR5 記憶體,全新散熱結構帶來穩定性能! - 2022
- 遠傳擴充 700 MHz 頻寬,室內網速提升 22%! - 2022
- 三星雲端將再「延壽」三個月,2021 年 11 月 30 日前別忘了趕快備份好資料! - 2021
- Sony Mobile 大師級超旗艦 Xperia 1 III 正式登台,建議售價 NT 36,990 元,即日起展開預購! - 2021
- 華為聯手燦坤!一日店長活動提供年度最殺折扣與限量好禮!HUAWEI MateBook D15 筆電一元起標、預購再享近 13000 元獨家好禮! - 2020
- 不只好看,還更好聽!三星 QLED 8K 量子電視 65 吋 Q800T 開箱體驗:OTS+ 魔術音效加持,搭配 Soundbar Q70T 同步輸出魔幻音場! - 2020
- Galaxy Note20 真的要來啦!三星官方宣佈 Galaxy Unpacked 2020 確認於 8/5 晚上 10 點展開!! - 2020
- [Mobile] KTV 歡唱~也能使用 LINE Pay 付款囉!即日起全台錢櫃、好樂迪都可以用手機行動支付囉! - 2019
- [Mobile] Galaxy S10 的三鏡頭架構,將包括一個「超廣角」鏡頭! - 2018
無留言