2025 年 4 月 6 日,Meta( 偏偏挑在周六)發(fā)布了其 Llama 家族的新一批 AI 模型:Llama 4。
這次共有四種新模型:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。
Meta 表示,所有模型都使用“大量未標(biāo)記的文本、圖像和視頻數(shù)據(jù)”進(jìn)行了訓(xùn)練,從而獲得“廣泛的視覺(jué)理解”。
DeepSeek 的開(kāi)放模型大獲成功,其性能比肩甚至勝過(guò) Meta 之前的旗艦 Llama 模型,據(jù)稱這刺激了 Meta 加快開(kāi)發(fā) Llama。
據(jù)說(shuō) Meta 已緊急設(shè)立作戰(zhàn)室來(lái)解密 DeepSeek 如何降低運(yùn)行和部署 R1 和 V3 等模型的成本。
Scout 和 Maverick 已在 Llama.com 上公開(kāi)可用,包括 AI 開(kāi)發(fā)平臺(tái) Hugging Face,而 Behemoth 仍在訓(xùn)練中。
Meta 表示,廣泛用于WhatsApp、Messenger 和 Instagram 等應(yīng)用程序中的 AI 助手 Meta AI 已經(jīng)過(guò)更新,可在 40 個(gè)國(guó)家或地區(qū)使用 Llama 4。
目前,多模態(tài)功能僅限于美國(guó)市場(chǎng)的英文版。
一些開(kāi)發(fā)人員可能會(huì)對(duì) Llama 4 許可證提出異議。
“注冊(cè)地”或“主要營(yíng)業(yè)地點(diǎn)”在歐盟的用戶和公司被禁止使用或分發(fā)這些模型,這可能是歐盟地區(qū)的AI和數(shù)據(jù)隱私法律規(guī)定的治理要求的結(jié)果。(過(guò)去,Meta曾炮轟這些法律過(guò)于繁瑣。)
此外,與之前的Llama 版本一樣,月活躍用戶超過(guò) 7 億的公司必須向 Meta 申請(qǐng)?zhí)厥庠S可 證 , Meta 可自行決定授予 還是 拒絕許可 證 。
Meta 在一篇博文中寫道:“這些 Llama 4 模型標(biāo)志著 Llama 生態(tài)系統(tǒng)開(kāi)始迎來(lái)一個(gè)新時(shí)代。 這只是 Llama 4 系列的開(kāi)始。”
Meta 表示,Llama 4 是其第一批使用混合專家(MoE)架構(gòu)的模型,這種架構(gòu)擁有更高的計(jì)算效率,便于訓(xùn)練和回答查詢。
MoE 架構(gòu)基本上將數(shù)據(jù)處理任務(wù)分解為多個(gè)子任務(wù),然后將它們交給更小、更專門的“專家”模型處理。
比如說(shuō),Maverick 共有 4000 億個(gè)參數(shù),但只有 170 億個(gè)活躍參數(shù),卻有128 個(gè)“專家”。(參數(shù)大致對(duì)應(yīng)于一個(gè)模型解決問(wèn)題的技能。)Scout 有 170 億個(gè)活躍參數(shù)、16 個(gè)專家和 1090 億個(gè)總參數(shù)。
據(jù) Meta 的內(nèi)部測(cè)試結(jié)果顯示,Maverick 在某些編程、推理、多語(yǔ)言、長(zhǎng)上下文和圖像等基準(zhǔn)測(cè)試中的表現(xiàn)超過(guò)了 OpenAI 的 GPT-4o 和谷歌的 Gemini 2.0 等模型。
該公司聲稱,Maverick 最適合創(chuàng)意寫作等“一般助理和聊天”用例。
然而,Maverick 還無(wú)法與谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等功能更強(qiáng)大的最新模型相提并論。
Scout 的優(yōu)勢(shì)在于處理文檔摘要和大型代碼庫(kù)推理等任務(wù)。其獨(dú)特之處在于,它有一個(gè)非常大的上下文窗口:1000 萬(wàn)個(gè) token。(token 代表原始文本的片段,比如說(shuō)“fantastic”這個(gè)單詞分成了“fan”、“tas”和“tic”。)
簡(jiǎn)而言之,Scout 可以接收?qǐng)D片和多達(dá)數(shù)百萬(wàn)個(gè)單詞,從而能夠處理篇幅極長(zhǎng)的文檔。
據(jù) Meta 估算,Scout 可以在單單一塊英偉達(dá)H100 GPU 上運(yùn)行,而 Maverick 需要英偉達(dá) H100 DGX 系統(tǒng)或同等系統(tǒng)。
Meta 尚未發(fā)布的 Behemoth 將需要功能還要強(qiáng)大的硬件。
據(jù)該公司聲稱,Behemoth 擁有 2880 億個(gè)活躍參數(shù)、16 個(gè)專家和近兩萬(wàn)億個(gè)總參數(shù)。
Meta 的內(nèi)部基準(zhǔn)測(cè)試顯示,在衡量 STEM 技能(比如數(shù)學(xué)問(wèn)題解決)的幾項(xiàng)評(píng)測(cè)中,Behemoth 的表現(xiàn)壓倒 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不如 2.5 Pro)。
值得注意的是,Llama 4 模型中沒(méi)有一個(gè)像 OpenAI 的 o1 和 o3-mini 那樣采用正宗的“推理”模型。推理模型會(huì)核對(duì)答案的真實(shí)性,并且通常能更可靠地回答問(wèn)題,但因此需要花比傳統(tǒng)的“非推理”模型更長(zhǎng)的時(shí)間來(lái)提供答案。
值得關(guān)注的是,Meta 表示,它對(duì)所有 Llama 4 模型進(jìn)行了調(diào)整,以便不再頻繁地拒絕回答“有爭(zhēng)議”的問(wèn)題。
據(jù)該公司聲稱,Llama 4 會(huì)回答“有爭(zhēng)議”的政治和社會(huì)話題,而之前的那批 Llama 模型拒絕回答。此外,該公司表示,Llama 4 在拒絕回答哪些提示方面“明顯更加平衡”。
Meta 發(fā)言人稱:“您可以指望 Llama 4 提供有幫助的、事實(shí)性的回答,它并不做出任何判斷。我們正繼續(xù)提高 Llama 的響應(yīng)能力,以便它能夠回答更多的問(wèn)題,能夠回應(yīng)各種不同的觀點(diǎn),并且不會(huì)偏袒某些觀點(diǎn)。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.