網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Meta 發(fā)布 Llama 4：禁止歐盟使用或分發(fā)

2025-04-06 12:45:16　來(lái)源: 云頭條

北京舉報(bào)

分享至

2025 年 4 月 6 日，Meta（偏偏挑在周六）發(fā)布了其 Llama 家族的新一批 AI 模型：Llama 4。

這次共有四種新模型：Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。

Meta 表示，所有模型都使用“大量未標(biāo)記的文本、圖像和視頻數(shù)據(jù)”進(jìn)行了訓(xùn)練，從而獲得“廣泛的視覺(jué)理解”。

DeepSeek 的開(kāi)放模型大獲成功，其性能比肩甚至勝過(guò) Meta 之前的旗艦 Llama 模型，據(jù)稱這刺激了 Meta 加快開(kāi)發(fā) Llama。

據(jù)說(shuō) Meta 已緊急設(shè)立作戰(zhàn)室來(lái)解密 DeepSeek 如何降低運(yùn)行和部署 R1 和 V3 等模型的成本。

Scout 和 Maverick 已在 Llama.com 上公開(kāi)可用，包括 AI 開(kāi)發(fā)平臺(tái) Hugging Face，而 Behemoth 仍在訓(xùn)練中。

Meta 表示，廣泛用于WhatsApp、Messenger 和 Instagram 等應(yīng)用程序中的 AI 助手 Meta AI 已經(jīng)過(guò)更新，可在 40 個(gè)國(guó)家或地區(qū)使用 Llama 4。

目前，多模態(tài)功能僅限于美國(guó)市場(chǎng)的英文版。

一些開(kāi)發(fā)人員可能會(huì)對(duì) Llama 4 許可證提出異議。

“注冊(cè)地”或“主要營(yíng)業(yè)地點(diǎn)”在歐盟的用戶和公司被禁止使用或分發(fā)這些模型，這可能是歐盟地區(qū)的AI和數(shù)據(jù)隱私法律規(guī)定的治理要求的結(jié)果。（過(guò)去，Meta曾炮轟這些法律過(guò)于繁瑣。）

此外，與之前的Llama 版本一樣，月活躍用戶超過(guò) 7 億的公司必須向 Meta 申請(qǐng)?zhí)厥庠S可證， Meta 可自行決定授予還是拒絕許可證。

Meta 在一篇博文中寫道：“這些 Llama 4 模型標(biāo)志著 Llama 生態(tài)系統(tǒng)開(kāi)始迎來(lái)一個(gè)新時(shí)代。這只是 Llama 4 系列的開(kāi)始。”

Meta 表示，Llama 4 是其第一批使用混合專家（MoE）架構(gòu)的模型，這種架構(gòu)擁有更高的計(jì)算效率，便于訓(xùn)練和回答查詢。

MoE 架構(gòu)基本上將數(shù)據(jù)處理任務(wù)分解為多個(gè)子任務(wù)，然后將它們交給更小、更專門的“專家”模型處理。

比如說(shuō)，Maverick 共有 4000 億個(gè)參數(shù)，但只有 170 億個(gè)活躍參數(shù)，卻有128 個(gè)“專家”。（參數(shù)大致對(duì)應(yīng)于一個(gè)模型解決問(wèn)題的技能。）Scout 有 170 億個(gè)活躍參數(shù)、16 個(gè)專家和 1090 億個(gè)總參數(shù)。

據(jù) Meta 的內(nèi)部測(cè)試結(jié)果顯示，Maverick 在某些編程、推理、多語(yǔ)言、長(zhǎng)上下文和圖像等基準(zhǔn)測(cè)試中的表現(xiàn)超過(guò)了 OpenAI 的 GPT-4o 和谷歌的 Gemini 2.0 等模型。

該公司聲稱，Maverick 最適合創(chuàng)意寫作等“一般助理和聊天”用例。

然而，Maverick 還無(wú)法與谷歌的 Gemini 2.5 Pro、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等功能更強(qiáng)大的最新模型相提并論。

Scout 的優(yōu)勢(shì)在于處理文檔摘要和大型代碼庫(kù)推理等任務(wù)。其獨(dú)特之處在于，它有一個(gè)非常大的上下文窗口：1000 萬(wàn)個(gè) token。（token 代表原始文本的片段，比如說(shuō)“fantastic”這個(gè)單詞分成了“fan”、“tas”和“tic”。）

簡(jiǎn)而言之，Scout 可以接收?qǐng)D片和多達(dá)數(shù)百萬(wàn)個(gè)單詞，從而能夠處理篇幅極長(zhǎng)的文檔。

據(jù) Meta 估算，Scout 可以在單單一塊英偉達(dá)H100 GPU 上運(yùn)行，而 Maverick 需要英偉達(dá) H100 DGX 系統(tǒng)或同等系統(tǒng)。

Meta 尚未發(fā)布的 Behemoth 將需要功能還要強(qiáng)大的硬件。

據(jù)該公司聲稱，Behemoth 擁有 2880 億個(gè)活躍參數(shù)、16 個(gè)專家和近兩萬(wàn)億個(gè)總參數(shù)。

Meta 的內(nèi)部基準(zhǔn)測(cè)試顯示，在衡量 STEM 技能（比如數(shù)學(xué)問(wèn)題解決）的幾項(xiàng)評(píng)測(cè)中，Behemoth 的表現(xiàn)壓倒 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro（但不如 2.5 Pro）。

值得注意的是，Llama 4 模型中沒(méi)有一個(gè)像 OpenAI 的 o1 和 o3-mini 那樣采用正宗的“推理”模型。推理模型會(huì)核對(duì)答案的真實(shí)性，并且通常能更可靠地回答問(wèn)題，但因此需要花比傳統(tǒng)的“非推理”模型更長(zhǎng)的時(shí)間來(lái)提供答案。

值得關(guān)注的是，Meta 表示，它對(duì)所有 Llama 4 模型進(jìn)行了調(diào)整，以便不再頻繁地拒絕回答“有爭(zhēng)議”的問(wèn)題。

據(jù)該公司聲稱，Llama 4 會(huì)回答“有爭(zhēng)議”的政治和社會(huì)話題，而之前的那批 Llama 模型拒絕回答。此外，該公司表示，Llama 4 在拒絕回答哪些提示方面“明顯更加平衡”。

Meta 發(fā)言人稱：“您可以指望 Llama 4 提供有幫助的、事實(shí)性的回答，它并不做出任何判斷。我們正繼續(xù)提高 Llama 的響應(yīng)能力，以便它能夠回答更多的問(wèn)題，能夠回應(yīng)各種不同的觀點(diǎn)，并且不會(huì)偏袒某些觀點(diǎn)。”

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.