AI 人工智慧準備統治全世界 學習.思考 智慧新世代 讓你暈到死

Image Creator from Microsoft Designer 大進化?升級「DALL-E3」模型之後變強了嗎?實測心得分享!

Image Creator from Microsoft Designer 大進化?升級「DALL-E3」模型之後變強了嗎?實測心得分享! - 阿祥的網路筆記本

最近一兩年,AI 人工智慧應用發展快速,除了自然語言模型 ChatGPT 之外,另一個熱門領域就是「AI 圖像生成技術」,而微軟在大舉投資 OpenAI 之後,也在今年 2 月推出整合 ChatGPT 功能的 Bing 搜尋引擎,並在 3 月推出以 DALL-E 模型為基礎的「Bing Image Creator」(目前名稱「Image Creator from Microsoft Designer」),而近期微軟也宣佈支援最新 DALL-E3 模型的 Bing Image Creator 已全面升級,同樣開放大家免費使用。

你可能會有興趣

在 DALL-E3 模型的導入後,圖像生成的品質將會更好,也能更容易理解使用者下達的指令,而原本僅支援中文的 Bing Image Creator 現在也看得懂中文了,再加上完全免費使用,相信會是不少圖像生成式 AI 技術入門者的最佳選擇。

Bing Image Creator 現在已經有「由以下提供: DALL-E3」的標示
Bing Image Creator 現在已經有「由以下提供: DALL-E3」的標示

阿祥先前在 2 月份也有寫過一篇 Bing Image Creator 的使用介紹與心得,當時也發現到不少圖像生成的問題,例如人像的面部表情、動作生硬、詭異,有些畫面上的不合理,或是針對既有的動漫風格無法忠實還原…等,在時隔 8 個月後,升級版本的Bing Image Creator 是否變得更強?下面阿祥就為大家帶來比較實測心得!

如何使用 Bing Image Creator?

Bing Image Creator(影像建立者)是一個基於 OpenAI 旗下 DALL-E 影像生成技術的工具,只需要輸入描述影像的指令(一般被稱作「Prompt」、「咒語」或是「咏唱」),AI 就會依據內容自動生成圖片內容,時間約莫數十秒左右。

Bing Image Creator 已經可以支援中文指令了,而且大部份都能很好的理解
Bing Image Creator 已經可以支援中文指令了,而且大部份都能很好的理解
不過也是有例外,像是阿祥測試「米格魯」,用中文就是怎麼生成都是其他東西
不過也是有例外,像是阿祥測試「米格魯」,用中文就是怎麼生成都是其他東西

在使用時,需要我們登錄一組微軟帳號,並透過消耗「點數」的方式來提升影像生成的速度,而這些點數是會定期自動補充的,若是使用量不大,其實不會有太大的問題,若是使用者有需求,也能透過 Microsoft Rewards 來兌換。

比較一下 DALL-E3 版本與 DALL-E 版本的生成不同

接下來阿祥以先前「微軟 Bing Image Creator(影像建立者)功能實測:簡單好上手的 AI 圖像生成工具,下達指令就能獲取各類型圖片!」這篇文章中使用的測試生成影像指令,以現今版本再生成一次,並比較看看兩者之間的差異是否真的很明顯!

來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「一位女孩在台灣街道上的照片」,光是表情就能看出天差地遠了吧?
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「一位女孩在台灣街道上的照片」,光是表情就能看出天差地遠了吧?
另一組同樣指令的代表,上面的 2 月版臉部便秘,下面新版本的笑容揚逸,落差極大啊!
另一組同樣指令的代表,上面的 2 月版臉部便秘,下面新版本的笑容洋溢,落差極大啊!
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「NBA 球員爭搶籃板球」,可以看出兩個版本的模型生成的邏輯不太一樣
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「NBA 球員爭搶籃板球」,可以看出兩個版本的模型生成的邏輯不太一樣
單圖也能看出,2 月舊版的畫面沒有球員面部與身體,而新版本則是更生動地模擬出攝影機補捉的畫面
單圖也能看出,2 月舊版的畫面沒有球員面部與身體,而新版本則是更生動地模擬出攝影機補捉的畫面
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「一群米格魯在花園中玩耍」,可以看出舊版其實小狗的動作與表情都算蠻生動,但仔細看略有一些扭曲,但新版本的小狗面部與動作就自然許多,不仔細看難辨真假!
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「一群米格魯在花園中玩耍」,可以看出舊版其實小狗的動作與表情都算蠻生動,但仔細看略有一些扭曲,但新版本的小狗面部與動作就自然許多,不仔細看難辨真假!
之前國慶日阿祥也用新版本生成了一個「米格魯在國慶日遊行」的畫面,讓許多人誤以為是真的呢!
之前國慶日阿祥也用新版本生成了一個「米格魯在國慶日遊行」的畫面,讓許多人誤以為是真的呢!
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「宇宙中鋼彈對決薩克」,可以看出舊版為了規避版權,所以模擬並不真實,但新版就和原作87分像了
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「宇宙中鋼彈對決薩克」,可以看出舊版為了規避版權,所以模擬並不真實,但新版就和原作87分像了
但放大後還是破功,薩克變成綠色身體的鋼彈了…
但放大後還是破功,薩克變成綠色身體的鋼彈了…
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「寶可夢在競技場戰鬥」,可以看出舊版與新版的生成邏輯有些不同。
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「寶可夢在競技場戰鬥」,可以看出舊版與新版的生成邏輯有些不同。
單張畫面來看,和卡通風格幾乎一樣了
單張畫面來看,和卡通風格幾乎一樣了
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「露營中帳篷內的一群人」,可以看出人物的表情自然度有極大的升級
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「露營中帳篷內的一群人」,可以看出人物的表情自然度有極大的升級
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「伊藤潤二風格女高中生頭像」,新舊版都沒辦法完全還原原作風格,但明顯新版的圖像精緻許多
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「伊藤潤二風格女高中生頭像」,新舊版都沒辦法完全還原原作風格,但明顯新版的圖像精緻許多
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「餐桌上的日本懷石料理」,舊版的食物真實度已經很不錯了,但新版在細節與豐富度更勝一籌
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「餐桌上的日本懷石料理」,舊版的食物真實度已經很不錯了,但新版在細節與豐富度更勝一籌
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「移軸攝影風格的城市地標照片」,舊版的表現不錯,但新版本細節更多、構圖也更美
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「移軸攝影風格的城市地標照片」,舊版的表現不錯,但新版本細節更多、構圖也更美
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「仿造 Netflix 影集愛死機器人風格的女性頭像」,舊版生成的水準不錯,但新版同樣以更多細節、畫面構圖與色彩搭配取勝
來比較一下 2 月版(圖上)的 Bing Image Creator 和現在 DALL-E3 版本生成「仿造 Netflix 影集愛死機器人風格的女性頭像」,舊版生成的水準不錯,但新版同樣以更多細節、畫面構圖與色彩搭配取勝

小結:DALL-E3 真的夠強,但 Bing Image Creator 無法提供進階設定是最大罩門

經過上面的比較測試,相信大家都有發現到,升級 DALL-E3 後的 Bing Image Creator 真的強大許多,也能滿足絕大多數人對於入門生成式 AI 的需求,生成出來的圖片的品質也是可用的狀態。但相較於其他的生成式 AI 服務,目前 Bing Image Creator 並未有太多進階的指令可以使用是一大罩門,像是圖像的尺寸仍舊為 1024 x 1024 px,無法調整大小或比例,同時也無法針對已生成的圖片進行改進生成。

直接請 Bing Image Creator 幫自己的 DALL-E3 版本設計一張海報,成品很完整,不過生成出來的圖片英文都拼錯耶,不知為什麼?
直接請 Bing Image Creator 幫自己的 DALL-E3 版本設計一張海報,成品很完整,不過生成出來的圖片英文都拼錯耶(只有這篇文章首圖是拼對的),不知為什麼?

不過整體來說, Bing Image Creator 還是非常值得一用,而且完全免費,對使用者來說也不會有額外的收費負擔,因此阿祥是很推薦大家使用的哦!

你可能會有興趣

相關連結:

來自 Microsoft Bing 的影像建立者

歷史上的這一天,我還寫了…

你也許會喜歡

無留言

發表留言