網易首頁 > 網易號 > 正文申請入駐

Midjourney V7重磅上線，硬剛GPT-4o強強對決！AI生圖王者爭霸實測來襲

2025-04-05 17:21:48　來源: 新智元

北京舉報

分享至

新智元報道

編輯：犀牛定慧

【新智元導讀】Midjourney V7 Alpha來了，帶著「最聰明、最美麗」的承諾和讓人驚嘆的「草稿模式」。本文將通過未編輯的圖片并排對比V7、V6和GPT-4o，深入剖析V7的個性化設置和語音控制功能。

終于，Midjourney帶著V7 Alpha回來了！兌現了

但GPT4o生圖的「余威」還在，

所有人的注意力都被即將到來的新模型所吸引，除非V7有一些實質性的提升，否則AI在生圖上的故事要翻篇了。

V7 Alpha是否帶來了革命性的變化，還是針對GPT4o生圖迫不得已的出手？

最聰明美麗的版本！「草稿模式」可語音控制

V7版本確實很能打，Midjourney稱V7 Alpha版本是最聰明、最美麗、最連貫的模型。光說不練假把式，先來看看網友用V7創作的作品，整體感受一下這個模型。網友@IterIntellectus認為gpt4o很棒，但只是個玩具，V7是另外一回事，絕對令人難以置信。他用V7創作了四個不同風格的作品，印象派風格、暗黑奇幻風格、古典主義巴洛克雕塑風格和日系漫畫風，最后漫畫風里的「五條悟」和動畫里的一模一樣。

網友@PJaccetturo沒有使用任何參考資料，只是提供簡單的提示「村莊、備戰、武士」，就可以生成電影級別的鏡頭圖片。

網友@doganuraldesign和@ai_for_success用V7制作的人物肖像，幾乎以假亂真，你能分辨出這是AI生成還是真人嗎？

網友@8co28用V7制作了動畫的分鏡草稿，這些草稿的精美程度可以用來直接制作動畫了。

效果確實很驚艷，Midjourney強調這次V7有兩大更新：

V7是第一個默認開啟模型個性化設置的模型。
什么意思？就是在生成圖像前，必須解鎖個性化設置才能使用。這大約需要5分鐘。相當于更好的「定制化」，讓模型提前了解用戶的喜好和審美。
另一個是「草稿模式」，被V7稱為旗艦功能。
草稿模式的價格只有標準模式的一半，渲染圖片的速度卻快了10倍。它的速度快到你可以通過對話來控制它。

點擊「草稿模式」，再點麥克風按鈕，就能開啟「語音模式」——你可以大聲思考，圖像就像流動的夢境一樣在你眼前生成。

比如像這樣讓貓咪吃草莓。

草稿模式的圖像質量低于標準模式，但兩者的繪畫行為和美學非常一致。

可以使用各種語言跟它對話，快速將創意變成現實。

以下視頻是草稿模式下可能實現的效果預覽，可以通過和模型「對話」來共同創作，看起來是很夢幻的交互形式。

V7 Alpha后的路線圖：預計在接下來的 60 天內，每隔一到兩周就會有新功能推出。

誰能定義AI視覺的未來，V7 、V6 、GPT4o誰更強？

V7的效果確實很棒，但是每個產品發布前，都免不了會在社交媒體上炒作一番。如何確定V7很強，當然是和別的模型比較一下。網友@Zapidroid使用相同的提示詞，并排圖像比較了相同提示詞下，V6、V7和GPT-4o的效果。他認為GPT4o依然更勝一籌。以下為相同提示詞的生成效果，圖片從左到右依次為V6、V7和GPT-4o生成的圖像。你認為哪個模型更好？歡迎在評論區討論。

A young Indian woman with dark hair in an open ponytail and a black jacket stands on a university campus, looking directly at the camera. The image has a 1990s-style movie still aesthetic, with a close-up portrait on a sunny day.

一位留著深色頭發、扎著開放式馬尾辮、身穿黑色夾克的印度年輕女子站在大學校園里，直視鏡頭，畫面有90年代風格的電影依然唯美，還有一張陽光明媚的日子里的特寫肖像。

A majestic barn owl perched on an ancient, moss-covered tree branch, surrounded by the misty forest. The scene is bathed in soft light filtering through the dense foliage, creating a magical and ethereal atmosphere. Photorealistic style with attention to detail of the feathers and textures.

一只雄偉的谷倉貓頭鷹棲息在一根古老的苔蘚覆蓋的樹枝上，周圍是迷蒙的森林。場景沐浴在柔和的光線中，透過茂密的樹葉過濾，營造出一種神奇而空靈的氛圍。寫實風格，注重羽毛和紋理的細節。

A person's hand points towards the window of an airplane, which is seen from inside with its wing visible in profile. The sky outside shows a clear horizon at dawn or dusk. In front of them lies a vast expanse of ocean.

一個人的手指向飛機的窗戶，從里面可以看到飛機的機翼。外面的天空在黎明或黃昏時顯示出清晰的地平線。在他們面前是一片廣闊的海洋。

Close-up of an anime woman's face with a shocked expression, dark hair, in the anime style. Colorful animation stills, close-up intensity, soft lighting, low-angle camera view, and high detail.

動漫女性面部特寫，表情震驚，深色頭發，動漫風格。彩色動畫劇照，特寫強度，柔和的燈光，低角度相機視圖，高細節。

A close-up of broccoli being sautéed in oil, with the vegetable's green florets contrasting against a dark brown sauce. A large spoon is partially visible inside a stainless steel pot filled with caramelized and shiny black glaze on top, against a white background.

花椰菜在油中炒的特寫鏡頭，蔬菜的綠色小花與深棕色醬汁形成對比。一個不銹鋼鍋里部分可見一個大勺子，上面裝滿焦糖和閃亮的黑色釉，背景是白色的。

A wide image taken with the phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, sporting a tshirt with a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer's reflection.

在俯瞰海灣大橋的房間里，用手機用玻璃白板拍攝的一張寬照片。視野顯示一個女人在寫作，穿著一件印有大OpenAI標志的t恤。筆跡看起來很自然，有點凌亂，我們看到了攝影師的倒影。

看完以上對比后，你認為哪個模型更好？

雖然無法下論斷V7和GPT4o誰更強，但是V7確實要比V6版本優化不少。

當然，也有人對V7的一些效果提出了質疑，比如圖片生成中一個重要的考點「文字生成」。

網友@sleone_76嘗試使用Midjourney v7和ChatGPT-4執行相同的提示，Midjourney V7的文字生成仍然完全失敗。

sleone_76說他很失望，對于一個專門從事圖像創作并承諾使用V7可以更好地生成文本的團隊來說，這應該是最基本的要求。

Midjourney V7的推出無疑為已經夠火的圖像生成賽道又添了把火。

不管是通過對話實現創意想法的「草稿模式」還是可以個性化定制的智能美感，都展現了V7的強大實力。

但將其與GPT-4o放在一起同臺競技時，它并未「遙遙領先」。尤其是文字生成等短板依然刺眼。

不過，Midjourney承諾未來60天將會有新功能放出，不知道那時它是否會重回文生圖領域的王者。

參考資料：

https://twitter.com/Zapidroid/status/1908058828295250205

https://twitter.com/doganuraldesign/status/1908061707160924593

https://www.midjourney.com/updates/v7-alpha

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.