AI 人工智慧準備統治全世界 智慧新世代

AI 文字、圖片生成影片服務 Stable Video 實測心得!

AI 文字、圖片生成影片服務 Stable Video 實測心得! - 阿祥的網路筆記本

生成式 AI 技術可以說是近兩年來科技領域發展最快速、也被認為是最會影響大家生活的重要話題,而且除了已經十分成熟的語言模型對話機器人、文字生成圖片這類服務,直接使用文字指令生成影片內容的技術也有極大的進展,像是今年二月 OpenAI 就無預警公開名為「Sora」的文字生成影片 AI 模型,展示出來的影音生成結果甚至真假難辨。

你可能會有興趣

不過目前 Sora 並未開放公開測試,僅止於小規模封測的階段,但另一個生成式 AI 技術的重量級公司 Stability AI 頗有與 Open AI 較勁的意味,除了去年就推出可生成影片的新模型「Stable Video Diffusion」之外,三月份也開放了 Stable Video 這個可以公開給大眾使用的 AI 生成式影片平台,只要輸入文字指令、上傳圖片,即可透過 AI 生成一段 5 秒左右的影片內容。

OpenAI 的「Sora」生成的影片樣本,無論成品的品質或影音的長度都很驚人
OpenAI 的「Sora」生成的影片樣本,無論成品的品質或影音的長度都很驚人

Stable Video A可免費註冊使用

不同於 Open AI 的 Sora 還未公開測試的階段,Stable Video AI 平台已經可以開放一般使用者免費註冊使用,且註冊後可免費獲得 110 點的「Balance」點數,且每天最多可供 40 點的免費點數供使用者運用。

在 Stable Video 的首頁,可選擇「Sign UP」來註冊,或使用「Contiune with Google」以 Google 帳號登入
在 Stable Video 的首頁,可選擇「Sign UP」來註冊,或使用「Contiune with Google」以 Google 帳號登入
登入後,在 Stable Video 主頁選擇「Start with Text」以文字生成,或選擇「Start with Image」以圖片生成
登入後,在 Stable Video 主頁選擇「Start with Text」以文字生成,或選擇「Start with Image」以圖片生成

在使用文字生成影片時,每次執行會耗費 11 點點數若是使用照片上傳每次則是耗費 10 點的點數。

Stable Video 平台 實測

Stable Video 目前只的操作介面沒有中文,但功能不複雜,在註冊登入後,可透過文字指令(Text Prompt)輸入想要生成影片的描述,和生成生成式圖片服務類似,Stable Video 會先生成出四組可供選擇的靜態畫面影像,使用者可選擇其一來生成影片。

在 Stable Video 的生成功能介面,上方可切換文字(Text)或圖片(Image),以文字為例,下方的「Desctribe your image.」可輸入說明指令,並按下「Generage」來生成
在 Stable Video 的生成功能介面,上方可切換文字(Text)或圖片(Image),以文字為例,下方的「Desctribe your image.」可輸入說明指令,並按下「Generage」來生成
這時會出現四組生成的靜態影像,可選擇其一作為影片生成的基礎
這時會出現四組生成的靜態影像,可選擇其一作為影片生成的基礎
選擇靜態影像後,下方有其他可調整的鏡頭參數,可依需求調整,接著選擇「Proceed」進行影片生成
選擇靜態影像後,下方有其他可調整的鏡頭參數,可依需求調整,接著選擇「Proceed」進行影片生成
除了基本的運鏡參數,下方還有「Advanced」的進階選項可調整,有三個可調參數,分別可設定影片動態起始點、生成品質/速度設定與動態強度設定
除了基本的運鏡參數,下方還有「Advanced」的進階選項可調整,有三個可調參數,分別可設定影片動態起始點、生成品質/速度設定與動態強度設定
處理後,影片會需要一段時間生成,時間約 2 分鐘左右
處理後,影片會需要一段時間生成,時間約 2 分鐘左右

在生成影片前,Stable Video 目前也提供幾個運鏡的參數讓使用者挑選,包括鏡頭是鎖定或是手持,運鏡採垂直移動、水平環移或是前後推進…等,同時也可以設定縮放畫面、軌道推進或是下下移動…等方式,但一次只能選擇一種。

影片生成完成,可直接看到動態預覽,上方也有下載按鈕可進行影片的下載
影片生成完成,可直接看到動態預覽,上方也有下載按鈕可進行影片的下載

選擇生成後,約莫 2 分鐘左右影片就會生成出來,可直接預覽或下載使用,但解析度並不高,影片尺寸約在 1024 x 576 px 左右,畫格為每秒 24 張,生成的動態品質並不算太自然,有點像是生成式圖片 AI 在發展初期的情況,有待後續的改進。

Stable Video 介面切換「Image」可改用影像生成影片,下方可選擇要上傳的影像,或直接將影像拖拉到範圍內上傳
Stable Video 介面切換「Image」可改用影像生成影片,下方可選擇要上傳的影像,或直接將影像拖拉到範圍內上傳
照片上傳後,下方同樣可設定運鏡參數,並選擇生成
照片上傳後,下方同樣可設定運鏡參數,並選擇生成

Stable Video 影片生成工具:生成內容展示

可以查看歷史生成記錄

在 Stable Video 的主頁,點右上角的「History」
在 Stable Video 的主頁,點右上角的「History」
在「Video」分頁,可看到過去生成的影片列表
在「Video」分頁,可看到過去生成的影片列表
在「Image」分頁,可看到過去生成的影像列表
在「Image」分頁,可看到過去生成的影像列表

小結

目前 Stable Video 屬於免費開放測試的狀態,也建議大家可以親自實測看看,目前看起來模型生成的品質還不算太好,生成的秒數約 4 – 6 秒之間,且解析度不高,不太能夠真的拿來作為影音創作之用,但相信經過一段時間的訓練與改進,未來應該會有更好的生成結果,畢竟 Stable Diffusion 是目前很多人使用的本地端圖像生成式 AI 模型,相信 Stable Video 也會是不少人關注的重點,可以期待有朝一日 Stable Video 能真正成為可用於影音創作素材生成的功能,與 Open AI 的 Sora 一較高下。

你可能會有興趣

相關連超:

Stable Video | Generate Videos with AI

歷史上的這一天,我還寫了…

你也許會喜歡

無留言

發表留言