Midjourney 是網(wǎng)絡(luò)上首批基于 AI 的圖像生成器之一,近一年來,該公司發(fā)布了其首個全新 AI 圖像模型。它被稱為V7,于美國東部時間周四午夜左右開始以 Alpha 形式推出。一周前,OpenAI 在 ChatGPT 中推出了一款新的圖像生成器,該生成器因能夠創(chuàng)建吉卜力風(fēng)格的照片而迅速走紅。
盡管 Midjourney 的模型并非針對 Ghibli 進行了優(yōu)化(至少官方說法并非如此),但它仍然可以生成美觀的作品,至少在這位記者的業(yè)余眼光看來是如此。
要使用它,首先必須對大約 200 張圖片進行評級,以構(gòu)建 Midjourney“個性化”配置文件(如果還沒有這樣做的話)。此配置文件會根據(jù)您的個人視覺偏好調(diào)整模型;V7 是 Midjourney 第一個默認(rèn)啟用個性化的模型。
完成此操作后,您將能夠在 Midjourney 網(wǎng)站上打開或關(guān)閉 V7,如果您是 Midjourney Discord 服務(wù)器的成員,還可以在其 Discord 聊天機器人上打開或關(guān)閉。在 Web 應(yīng)用程序中,您可以從“版本”標(biāo)簽旁邊的下拉菜單中快速選擇模型。
圖片來源: Midjourney
Midjourney 首席執(zhí)行官 David Holz 在X 的一篇文章中將 V7 描述為“完全不同的架構(gòu)” 。
Holz 在 Discord 上的公告中繼續(xù)說道:“V7 在文本提示方面更加智能。圖像提示看起來很棒,圖像質(zhì)量明顯更高,紋理也很漂亮,身體、手和各種物體在所有細(xì)節(jié)上的連貫性明顯更好?!?/p>
V7 有兩種版本,Turbo(運行成本較高)和 Relax,并支持一種名為“草稿模式”的新工具,該工具渲染圖像的速度是標(biāo)準(zhǔn)模式的 10 倍,成本僅為標(biāo)準(zhǔn)模式的一半。草稿圖像的質(zhì)量低于標(biāo)準(zhǔn)模式圖像,但可以通過單擊對其進行增強和重新渲染。
Holz 表示,V7 中尚未提供許多標(biāo)準(zhǔn)的 Midjourney 功能,包括圖像升級和重新紋理。他說,這些功能將在不久的將來推出,可能在兩個月內(nèi)。
“這是一個全新的模式,具有獨特的優(yōu)勢,但也可能存在一些弱點”,Holz 在 Discord 上寫道。“我們想從你那里了解它的優(yōu)點和缺點,但一定要記住,它可能需要不同的提示風(fēng)格。所以,多嘗試一下吧?!?/p>
提示是:“一條尾巴帶刺的龍?!眻D片來源: Midjourney
我的提示是:“吉卜力風(fēng)格的角色?!眻D片來源: Midjourney
Midjourney 是一家不同尋常的公司。2022 年,Holz 創(chuàng)辦了這家公司,他也是 PC 外設(shè)公司 Leap Motion 的聯(lián)合創(chuàng)始人。該公司至今未從外部籌集到一分錢資金。
據(jù)報道,到 2023 年底,Midjourney預(yù)計將帶來約 2 億美元的收入。最近,這家總部位于舊金山的公司表示,它正在組建一個硬件團隊來開展一些尚未詳細(xì)說明的項目,并且它繼續(xù)訓(xùn)練之前宣布的視頻和 3D 對象生成模型。
該公司正面臨多起訴訟,這些訴訟指控其在未經(jīng)圖片創(chuàng)作者同意的情況下使用從網(wǎng)絡(luò)上抓取的圖片來訓(xùn)練人工智能工具,侵犯了數(shù)百萬藝術(shù)家的權(quán)利。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.