新智元報道
編輯:犀牛 定慧
【新智元導讀】Midjourney V7 Alpha來了,帶著「最聰明、最美麗」的承諾和讓人驚嘆的「草稿模式」。本文將通過未編輯的圖片并排對比V7、V6和GPT-4o,深入剖析V7的個性化設置和語音控制功能。
終于,Midjourney帶著V7 Alpha回來了!兌現了
但GPT4o生圖的「余威」還在,
所有人的注意力都被即將到來的新模型所吸引,除非V7有一些實質性的提升,否則AI在生圖上的故事要翻篇了。
V7 Alpha是否帶來了革命性的變化,還是針對GPT4o生圖迫不得已的出手?
最聰明美麗的版本!「草稿模式」可語音控制
V7版本確實很能打,Midjourney稱V7 Alpha版本是最聰明、最美麗、最連貫的模型。 光說不練假把式,先來看看網友用V7創作的作品,整體感受一下這個模型。 網友@IterIntellectus認為gpt4o很棒,但只是個玩具,V7是另外一回事,絕對令人難以置信。 他用V7創作了四個不同風格的作品,印象派風格、暗黑奇幻風格、古典主義巴洛克雕塑風格和日系漫畫風,最后漫畫風里的「五條悟」和動畫里的一模一樣。
網友@PJaccetturo沒有使用任何參考資料,只是提供簡單的提示「村莊、備戰、武士」,就可以生成電影級別的鏡頭圖片。
網友@doganuraldesign和@ai_for_success用V7制作的人物肖像,幾乎以假亂真,你能分辨出這是AI生成還是真人嗎?
網友@8co28用V7制作了動畫的分鏡草稿,這些草稿的精美程度可以用來直接制作動畫了。
效果確實很驚艷,Midjourney強調這次V7有兩大更新:
V7是第一個默認開啟模型個性化設置的模型。
什么意思?就是在生成圖像前,必須解鎖個性化設置才能使用。這大約需要5分鐘。相當于更好的「定制化」,讓模型提前了解用戶的喜好和審美。
另一個是「草稿模式」,被V7稱為旗艦功能。
草稿模式的價格只有標準模式的一半,渲染圖片的速度卻快了10倍。它的速度快到你可以通過對話來控制它。
點擊「草稿模式」,再點麥克風按鈕,就能開啟「語音模式」——你可以大聲思考,圖像就像流動的夢境一樣在你眼前生成。
比如像這樣讓貓咪吃草莓。
草稿模式的圖像質量低于標準模式,但兩者的繪畫行為和美學非常一致。
可以使用各種語言跟它對話,快速將創意變成現實。
以下視頻是草稿模式下可能實現的效果預覽,可以通過和模型「對話」來共同創作,看起來是很夢幻的交互形式。
V7 Alpha后的路線圖:預計在接下來的 60 天內,每隔一到兩周就會有新功能推出。
誰能定義AI視覺的未來,V7 、V6 、GPT4o誰更強?
V7的效果確實很棒,但是每個產品發布前,都免不了會在社交媒體上炒作一番。 如何確定V7很強,當然是和別的模型比較一下。 網友@Zapidroid使用相同的提示詞,并排圖像比較了相同提示詞下,V6、V7和GPT-4o的效果。他認為GPT4o依然更勝一籌。 以下為相同提示詞的生成效果,圖片從左到右依次為V6、V7和GPT-4o生成的圖像。 你認為哪個模型更好?歡迎在評論區討論。
A young Indian woman with dark hair in an open ponytail and a black jacket stands on a university campus, looking directly at the camera. The image has a 1990s-style movie still aesthetic, with a close-up portrait on a sunny day.
一位留著深色頭發、扎著開放式馬尾辮、身穿黑色夾克的印度年輕女子站在大學校園里,直視鏡頭,畫面有90年代風格的電影依然唯美,還有一張陽光明媚的日子里的特寫肖像。
A majestic barn owl perched on an ancient, moss-covered tree branch, surrounded by the misty forest. The scene is bathed in soft light filtering through the dense foliage, creating a magical and ethereal atmosphere. Photorealistic style with attention to detail of the feathers and textures.
一只雄偉的谷倉貓頭鷹棲息在一根古老的苔蘚覆蓋的樹枝上,周圍是迷蒙的森林。場景沐浴在柔和的光線中,透過茂密的樹葉過濾,營造出一種神奇而空靈的氛圍。寫實風格,注重羽毛和紋理的細節。
A person's hand points towards the window of an airplane, which is seen from inside with its wing visible in profile. The sky outside shows a clear horizon at dawn or dusk. In front of them lies a vast expanse of ocean.
一個人的手指向飛機的窗戶,從里面可以看到飛機的機翼。外面的天空在黎明或黃昏時顯示出清晰的地平線。在他們面前是一片廣闊的海洋。
Close-up of an anime woman's face with a shocked expression, dark hair, in the anime style. Colorful animation stills, close-up intensity, soft lighting, low-angle camera view, and high detail.
動漫女性面部特寫,表情震驚,深色頭發,動漫風格。彩色動畫劇照,特寫強度,柔和的燈光,低角度相機視圖,高細節。
A close-up of broccoli being sautéed in oil, with the vegetable's green florets contrasting against a dark brown sauce. A large spoon is partially visible inside a stainless steel pot filled with caramelized and shiny black glaze on top, against a white background.
花椰菜在油中炒的特寫鏡頭,蔬菜的綠色小花與深棕色醬汁形成對比。一個不銹鋼鍋里部分可見一個大勺子,上面裝滿焦糖和閃亮的黑色釉,背景是白色的。
A wide image taken with the phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, sporting a tshirt with a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer's reflection.
在俯瞰海灣大橋的房間里,用手機用玻璃白板拍攝的一張寬照片。視野顯示一個女人在寫作,穿著一件印有大OpenAI標志的t恤。筆跡看起來很自然,有點凌亂,我們看到了攝影師的倒影。
看完以上對比后,你認為哪個模型更好?
雖然無法下論斷V7和GPT4o誰更強,但是V7確實要比V6版本優化不少。
當然,也有人對V7的一些效果提出了質疑,比如圖片生成中一個重要的考點「文字生成」。
網友@sleone_76嘗試使用Midjourney v7和ChatGPT-4執行相同的提示,Midjourney V7的文字生成仍然完全失敗。
sleone_76說他很失望,對于一個專門從事圖像創作并承諾使用V7可以更好地生成文本的團隊來說,這應該是最基本的要求。
Midjourney V7的推出無疑為已經夠火的圖像生成賽道又添了把火。
不管是通過對話實現創意想法的「草稿模式」還是可以個性化定制的智能美感,都展現了V7的強大實力。
但將其與GPT-4o放在一起同臺競技時,它并未「遙遙領先」。尤其是文字生成等短板依然刺眼。
不過,Midjourney承諾未來60天將會有新功能放出,不知道那時它是否會重回文生圖領域的王者。
參考資料:
https://twitter.com/Zapidroid/status/1908058828295250205
https://twitter.com/doganuraldesign/status/1908061707160924593
https://www.midjourney.com/updates/v7-alpha
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.