剛剛,Midjourney 推出了一個全新圖像生成模型,距離其上次發布新模型已經過去了一年多。該模型叫做 V7,官方表示它得到了全面的重新設計,且默認啟用了個性化功能,目前用戶可以使用其測試版本。
(來源:Midjourney)
Midjourney 在 X 表示:“我們現在開始對新的 V7 圖像模型進行 Alpha 測試。這是我們迄今為止最智能、最美觀、最連貫的模型。請嘗試一下,預計在接下來的兩個月內每周或每兩周都會更新一次。”
V7 有兩個方面的改進:第一是生成質量更好的圖像,第二是推出了新工具和工作流程。
在圖像質量的提升上,Midjourney 表示 V7 在手部、手指、身體部位以及“各類物體”的生成上,具有更高的連貫性和一致性。它還能呈現出更加細致逼真的紋理和材質效果,比如皮膚的皺紋或是陶瓷花瓶的細微之處。
(來源:Midjourney)
這些細節往往是判斷一幅圖像是否由 AI 生成的最明顯標志。需要明確的是,Midjourney 并沒有宣稱其取得了能讓訓練有素的人無法識別出 AI 生成圖像的進展,它只是表示人們習以為常的一些粗糙之處已在很大程度上得到了改善。
在功能方面,最引人注目的是新推出的“草稿模式”。Midjourney 在其與用戶溝通的各個渠道(博客、Discord、X 等平臺)上表示,“草稿模式的成本減半,圖像渲染速度提升至原來的 10 倍”。
Midjourney 在 X 表示:“草稿模式的成本是原來的一半,速度是原來的 10 倍,它可能是有史以來迭代創意的最佳方式。用語音嘗試一下,大聲說出自己的想法,讓我們的想法像夢一樣流動?!迸c此同時,Midjourney 附上了一則視頻來展示草稿模式。
不過,該模式下生成的圖像質量比其他模式要低,所以它并非用于生成最終成品圖像的模式。相反,它的作用是讓用戶在切換模式生成高質量的圖像之前,通過反復嘗試和探索來找到理想的效果。
V7 有兩種模式:加速模式和普通模式。加速模式能快速生成最終圖像,但是成本更高;而普通模式耗時較長,但成本僅為加速模式的一半。奇怪的是,目前 V7 沒有標準模式。Midjourney 表示標準模式稍后會推出,因為還需要一些時間來完善。
V7 支持之前版本的大多數參數(如--ar、--seed 等),包括用戶現有的來自 6.1 版本的--sref 代碼,以及最近推出的個性化功能。實際上,V7 是 Midjourney 首個默認啟用個性化功能的模型,這意味著用戶必須至少挑選 200 張圖片來訓練,以便建立自己的審美偏好。
在使用個性化功能的時候,V7 會數百次地讓用戶在兩張圖片之間做出選擇,這樣它就能了解用戶認為“好看”的標準,并根據這些偏好生成圖像。不過,和之前的模型一樣,用戶在 V7 中也可以根據需要關閉個性化功能。
Midjourney 是最早被廣泛使用的 AI 圖像生成工具之一。最初,它在 Discord 平臺上可用,且需要通過有點晦澀難懂的語法來操作,但后來它推出了更現代化的網頁界面。
社交媒體上分享的很大一部分 AI 藝術作品都是用 Midjourney 創作的。對于許多 AI 視頻創作者來說,它也是工作流程中的關鍵環節,這些創作者通常會先在 Midjourney 中生成初始圖像,然后再使用如 Runway 等應用程序的圖像轉視頻功能。
然而,盡管 Midjourney 很受歡迎,但它也成為了多起訴訟的對象,并且它也卷入了“在受版權保護的作品上訓練 AI 模型是否構成合理使用”的巨大爭議之中。使用過 Midjourney 的人都知道,它是在受版權保護的作品上進行訓練的、它甚至有時會在生成的圖像中出現水印和藝術家簽名。
另據悉,該公司還宣布計劃在未來推出硬件產品,但具體會是什么樣子仍不清楚。
參考資料:
https://www.midjourney.com/updates/v7-alpha
https://x.com/midjourney/status/1908012961840672947
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.