AI照片再進化 Nano Banana生成3D公仔圖像掀流行

(中央社記者張欣瑜舊金山4日專電)Google圖像編輯AI工具Nano Banana推出後引發熱議;隨著社群上越來越多人將它用來生成3D公仔圖、並上傳分享,使它更加受到歡迎。有評論指出,它生成的圖像連專家都難辨真偽,眼見為憑在網路上徹底失效。

奈米香蕉(Nano Banana)的正式名稱是Gemini 2.5 Flash Image,它是Google近期發布的一款圖像編輯模型,推出後掀起熱潮,有如OpenAI之前的吉卜力風格AI圖片。

華盛頓郵報(The Washington Post)近日在評論中指出,這款圖像編輯工具一般能在30秒內生成圖片,若讓OpenAI的GPT-5處理相同請求,有時需要花超過3倍的時間。

想體驗Nano Banana,最普遍的方式是透過Google聊天機器人Gemini。

社群平台Reddit上有達人分享如何用它生成公仔模型,將圖片上傳、下達指令:「用Nano Banana模型,將圖片中角色製作成一個1/7比例的商業化模型公仔,並呈現於寫實風格的環境中。」不到1分鐘內,便能生成出3D公仔圖,且模樣逼真、細節到位。

除公仔圖像,這款模型也能將多個主體物件合成。社群平台領英(LinkedIn)一篇評論指出,模型令人驚訝的地方並非將2人合成至1張圖片裡,而是它對於光線、人與人在空間中的互動、某種坐姿下的衣服皺褶細節都掌握到位,「完全是另一個層次」。

此外,它還能從不同視角生成照片,畫面呈現符合攝影規則,不會出現拉伸或扭曲。

同時,這款工具可以用來修復老照片;例如將阿嬤的婚紗照上傳,用它重新還原褪去的顏色,但保留住動態模糊和時代感,呈現出自然的感覺,讓照片不至於失去靈魂。

華盛頓郵報指出,這款模型雖然不能稱得上完美無瑕,但速度夠快、有效且易於使用的特性,已經讓很多人開始應用,不過這也意味著生成爭議性圖像將變得更加容易。

Nano Banana模型生成的圖片右下角會有標記,但透過後製便能裁切。Google也表示,使用新模型編輯的圖片,會嵌入特殊浮水印以顯示圖片經過AI操作的痕跡。

Google新聞透明的Google新聞

領英評論分享,目前要確認照片是否為AI生成的圖像,檢查文字仍是一個方法;AI仍然無法處理文字,若將圖像中的標誌、招牌放大時,字母會扭曲,單字可能會變成亂碼。此外,也可從圖片來源可信度、逆向圖片搜尋、及多重驗證等方式進行查證。

卡內基美隆大學(Carnegie Mellon University)電腦科學教授康尼澤( Vincent Conitzer)告訴華盛頓郵報,AI工具雖然帶來衝擊,但不會消失、只會越來越強大。(編輯:陳慧萍)1140905


標題:AI照片再進化 Nano Banana生成3D公仔圖像掀流行

聲明: 本文版權屬原作者。轉載內容僅供資訊傳遞,不涉及任何投資建議。如有侵權,請立即告知,我們將儘速處理。感謝您的理解。

分享你的喜愛