AI 人工智慧準備統治全世界智慧新世代 2024 年 03 月 31 日

AI 文字、圖片生成影片服務 Stable Video 實測心得！

AI 文字、圖片生成影片服務 Stable Video 實測心得！ - 阿祥的網路筆記本

生成式 AI 技術可以說是近兩年來科技領域發展最快速、也被認為是最會影響大家生活的重要話題，而且除了已經十分成熟的語言模型對話機器人、文字生成圖片這類服務，直接使用文字指令生成影片內容的技術也有極大的進展，像是今年二月 OpenAI 就無預警公開名為「Sora」的文字生成影片 AI 模型，展示出來的影音生成結果甚至真假難辨。

你可能會有興趣

不過目前 Sora 並未開放公開測試，僅止於小規模封測的階段，但另一個生成式 AI 技術的重量級公司 Stability AI 頗有與 Open AI 較勁的意味，除了去年就推出可生成影片的新模型「Stable Video Diffusion」之外，三月份也開放了 Stable Video 這個可以公開給大眾使用的 AI 生成式影片平台，只要輸入文字指令、上傳圖片，即可透過 AI 生成一段 5 秒左右的影片內容。

OpenAI 的「Sora」生成的影片樣本，無論成品的品質或影音的長度都很驚人

文章目錄

Stable Video A可免費註冊使用

不同於 Open AI 的 Sora 還未公開測試的階段，Stable Video AI 平台已經可以開放一般使用者免費註冊使用，且註冊後可免費獲得 110 點的「Balance」點數，且每天最多可供 40 點的免費點數供使用者運用。

在 Stable Video 的首頁，可選擇「Sign UP」來註冊，或使用「Contiune with Google」以 Google 帳號登入

登入後，在 Stable Video 主頁選擇「Start with Text」以文字生成，或選擇「Start with Image」以圖片生成

在使用文字生成影片時，每次執行會耗費 11 點點數若是使用照片上傳每次則是耗費 10 點的點數。

Stable Video 平台實測

Stable Video 目前只的操作介面沒有中文，但功能不複雜，在註冊登入後，可透過文字指令（Text Prompt）輸入想要生成影片的描述，和生成生成式圖片服務類似，Stable Video 會先生成出四組可供選擇的靜態畫面影像，使用者可選擇其一來生成影片。

在 Stable Video 的生成功能介面，上方可切換文字（Text）或圖片（Image），以文字為例，下方的「Desctribe your image.」可輸入說明指令，並按下「Generage」來生成

這時會出現四組生成的靜態影像，可選擇其一作為影片生成的基礎

選擇靜態影像後，下方有其他可調整的鏡頭參數，可依需求調整，接著選擇「Proceed」進行影片生成

除了基本的運鏡參數，下方還有「Advanced」的進階選項可調整，有三個可調參數，分別可設定影片動態起始點、生成品質/速度設定與動態強度設定

處理後，影片會需要一段時間生成，時間約 2 分鐘左右

在生成影片前，Stable Video 目前也提供幾個運鏡的參數讓使用者挑選，包括鏡頭是鎖定或是手持，運鏡採垂直移動、水平環移或是前後推進…等，同時也可以設定縮放畫面、軌道推進或是下下移動…等方式，但一次只能選擇一種。

影片生成完成，可直接看到動態預覽，上方也有下載按鈕可進行影片的下載

選擇生成後，約莫 2 分鐘左右影片就會生成出來，可直接預覽或下載使用，但解析度並不高，影片尺寸約在 1024 x 576 px 左右，畫格為每秒 24 張，生成的動態品質並不算太自然，有點像是生成式圖片 AI 在發展初期的情況，有待後續的改進。

Stable Video 介面切換「Image」可改用影像生成影片，下方可選擇要上傳的影像，或直接將影像拖拉到範圍內上傳

照片上傳後，下方同樣可設定運鏡參數，並選擇生成

Stable Video 影片生成工具：生成內容展示

可以查看歷史生成記錄

在 Stable Video 的主頁，點右上角的「History」

在「Video」分頁，可看到過去生成的影片列表

在「Image」分頁，可看到過去生成的影像列表

小結

目前 Stable Video 屬於免費開放測試的狀態，也建議大家可以親自實測看看，目前看起來模型生成的品質還不算太好，生成的秒數約 4 – 6 秒之間，且解析度不高，不太能夠真的拿來作為影音創作之用，但相信經過一段時間的訓練與改進，未來應該會有更好的生成結果，畢竟 Stable Diffusion 是目前很多人使用的本地端圖像生成式 AI 模型，相信 Stable Video 也會是不少人關注的重點，可以期待有朝一日 Stable Video 能真正成為可用於影音創作素材生成的功能，與 Open AI 的 Sora 一較高下。

你可能會有興趣

相關連超：

Stable Video | Generate Videos with AI

歷史上的這一天，我還寫了…

相關

AI AI生成影片 OpenAI Sora Stability AI Stable Vide Stable Video AI Text Prompt）實測影片生成式AI 生成式生成式 AI 服務生成式AI 生成式人工智慧

阿祥

阿祥，本名秦庭祥（Axiang Chin），是一個專注於3C領域、尤其是行動通訊領域的部落客，自2004年10月開始經營部落格超過20年之久，長期關注3C產品資訊與應用－尤其聚焦於智慧型行動裝置、雲端服務應用、App評析與行銷、以及遊戲評測與產業趨勢…等議題。阿祥同時也是3C布政司共同創辦人，提供社群行銷、教學與體驗活動規劃…等服務，並曾擔任元智大學資訊傳播學系兼任講師、國立空中大學管理與資訊學系學科委員，並於三星學園長期擔任手機課程講師，也受邀前往多間大學、政府機關擔任講師，分享雲端與行動工具應用心得。 Google

無留言

發表留言取消回應