編輯 | Sia
谷歌家的 AI ,你咋又雙叒叕搞事情啦!
今兒一早,谷歌的 Gemini 2.0 Flash 突然沖上風口浪尖——一個剛開放的圖像編輯功能,竟然被網友玩成了「水印粉碎機」!連 Getty Images 等專業圖庫的防盜水印都能咔咔消除!
吃瓜群眾鬧不明白了,原來谷歌隱藏業務是給盜圖黨發外掛?
雖然掛著「實驗功能」的免戰牌(目前僅限 AI Studio 體驗),但也架不住網友實測打臉。
隔壁家的 Claude 和 GPT-4o 早就把這類請求拉黑名單了,唯獨 Gemini 像個鐵憨憨,來者不拒照單全收。
免費體驗: https://aistudio.google.com/prompts/new_chat
到底是咋回事?
咱們趕緊圍觀網友們曬出的各種「鐵證」。
輸入類似「 remove the marks and text over the image 」的要求,新生成的圖像立刻變干凈。
乍一看,還真像那么回事兒。
我們也拿了張明星 G 社的生圖試了一下,真就一句話的事兒。
為了防止朋友圈盜圖,一位鳥友剛學會用美圖秀秀給作品加水印。
我一句話就給她去掉了。
小紅書水印也能順利去掉。
大面積的水印,貌似也能搞定。
這么大面積的堆字,居然也能行,有些夸張啊!
難道 Gemini 2.0 Flash 真是完美的水印去除器?其實,不是。
比如,這種滿屏+半透明的水印,就很難搞定。
這是一篇財新報道的截圖,系統會自動添加水印,也是半透明+全屏。
結果(右圖)呢,水印確實沒了,但文字全成了亂碼。
為什么會這樣呢?
我們推測,和「腦補」圖片相比,「腦補」文字實在難太多。
換句話說,這個新模型應該是通過一些方式重新畫了一張圖,而不是真會編輯掉水印。
它會根據學習到的模式生成全新圖像,包括填充原來水印的位置,而不是直接復制或重復使用原始圖像。
其實,一些眼尖網友也發現比如這張圖「去水印」后,山都消失了,完成是一張新照片。
雖然 Gemini 2.0 Flash 「去水印神力」涉嫌違法的說法不是很有說服力,但這次祭出了業界首個「圖片文字一把抓」的全能模型,確實是一件大事兒。
要知道,傳統 AI 作圖要像打乒乓球似的在文字模型( LLM )和畫圖模型(擴散模型)間傳話。
有了這個真正的原生多模態生圖工具,一番實測, 這速度比我 PS 按保存鍵還快!而且 ,OneShot (不用反復生成)的概率很高。
用網友的話說,它基本上完成了人類使用 Photoshop 克隆工具所做的事情,但只需幾秒鐘而不是一個小時。
你可以直接用文字進行各種 PS 。
比如,合照中的 Jennie(右) 作為素材,直接生成一張白底的護照證件照。
將文本快速清晰地集成到圖像中,也很出色。替換圖片文字,居然一次就成功(也許是運氣好?)。
這些體驗,幾乎都是一次成功。
腦洞再大點。同時輸入兩張圖片,可以輕松生成廣告圖片。
怎么樣,可還行?
這個案例更復雜。劉雯要同時展示衣服和包包。
整體合理,結果還是有明顯瑕疵,主要是手沒拿住包包。
考慮到一次就能生成這個水平,已經很意外。
模型可以連續出圖、還能保持風格一致性,不必每次都從頭開始。
就像和專業修圖師溝通,你只管提要求,它負責改,而且反應很快。
Jennie 變換不同角度的圖片,還能「腦補」全身圖:
讓全智賢不斷變換造型,都是一次性成功。
最好玩的是這個例子。清空房間,按照你的要求,重新裝修設計。
這是模型最后給到的中式家居風格。
網友的一個案例。
首先想要「一個舒適的閱讀角落,里面有壁爐、擺滿小說的書架和一把舒適的大扶手椅。」
然后,進一步要求「用柔和溫暖的燈光營造夜晚的氛圍」、「扶手椅上放一只睡覺的貓。」
最后,「給房間營造復古的維多利亞風格」。
最終結果幾乎和他想象的一模一樣。
除了嘮嗑式生圖、修圖,Gemini Flash 2.0 還有一個很好玩的功能——視覺故事,一次性生成帶配圖的內容。
比如,寫一個曲奇餅干的教程,要求圖文并茂,然后一鍵搞定。
?
講一個簡單的卡皮巴拉冒險小故事,圖文并茂。
從 0 到 1 畫翠鳥,從線條概念圖開始,每一步都用圖片展示。
以后我們會帶來更多好玩的AI話題,也歡迎大家進群交流。
? THE END
轉載請聯系本公眾號獲得授權
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.