網易首頁 > 網易號 > 正文申請入駐

Llama 4全網首測來襲，3臺Mac狂飆2萬億！多模態驚艷代碼卻翻車

2025-04-06 15:04:12　來源: 新智元

北京舉報

分享至

新智元報道

編輯：定慧桃子

【新智元導讀】Llama 4家族周末突襲，實屬意外。這場AI領域的「閃電戰」不僅帶來了兩款全新架構的開源模型，更揭示了一個驚人事實：蘋果Mac設備或將成為部署大型AI模型的「性價比之王」。

誰也沒料到，

一共三款模型，首次采用MoE架構，開啟了原生多模態的Llama時代！

Llama 4 Scout，激活17B，16個專家，109B參數；
Llama 4 Maverick，激活17B，128個專家，402B參數；
Llama 4 Behemoth，激活288B，16個專家，2T參數。

Llama 4發布后排名瞬間躍升，甚至超過了DeepSeek-V3，Meta再一次回到牌桌。

業界首個1000萬上下文，RAG已死？

Meta宣稱Llama-4-Scout-17B-16E測試中好于Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1。甚至，小扎劇透了推理模型也不遠了。

但也有網友調侃Llama 4這次是「趕鴨子上架」，所以Llama 4性能到底如何，請看下面網友的實測。

稀疏MoE模型，和蘋果芯堪稱天作之合

當前，第一批測試結果已經出來了！

蘋果ML工程師Awni Hannun實測，Llama 4 Maverick在單臺M3 Ultra-512GB上使用MLX推理框架時速度極快，達到了50 token/秒！

與DeepSeek V3/R1類似，Llama 4系都是巨大的稀疏MoE模型。

這些模型擁有極其龐大的參數量，但每次只有少量參數（專家）被激活。由于事先無法預測哪些參數會被激活，因此必須把所有參數同時存放在高速的GPU顯存中。

為何對于開源模型，社區大佬都傾向于使用蘋果芯片去測試？

一方面，是因為買不到英偉達H100啊。

Awni Hannun表示，更重要的是Apple芯片適合稀疏模型。

GPU顯存速度快，但成本昂貴。然而Apple Silicon通過統一內存（Unified Memory）和UltraFusion 技術融合多個芯片，使其能夠以更低的成本提供更大容量、中等速度的內存。

一個月前發布的M3 Ultra Mac Studio的統一內存容量高達512GB！

然而，當內存容量增大到這個程度時，內存帶寬就不足了。對于512GB版本來說，內存刷新率（每秒GPU可完整遍歷所有內存的次數，即內存帶寬與容量之比）只有1.56次/秒。與其他硬件對比如下：

NVIDIA H100（80GB）：37.5次/秒
AMD MI300X（192GB）：27.6次/秒
Apple M2 Ultra（192GB）：4.16次/秒（比H100慢9倍）
Apple M3 Ultra（512GB）：1.56次/秒（比H100慢24倍）

理想情況下，工作負載特性應與硬件特性相匹配。否則，硬件會存在浪費（性能過剩）或瓶頸（性能不足）。對工作負載（此處為批大小=1的推理任務）而言，關鍵特性是模型稀疏度。

模型的稀疏度定義為 1-（激活參數數/總參數數）。

稠密模型稀疏度為0%（因為激活參數 = 總參數）。各模型稀疏度如下：

Llama 3.3 405B：總參數=405B，激活參數=405B，稀疏度=0%
DeepSeek V3/R1：總參數=671B，激活參數=37B，稀疏度=94.4%
Llama 4 Scout：總參數=109B，激活參數=17B，稀疏度=84.4%
Llama 4 Maverick：總參數=400B，激活參數=17B，稀疏度=95.75%（非常高！）
Llama 4 Behemoth：總參數=2T，激活參數=288B，稀疏度=85.6%

一般來說，稀疏度越高，越適合內存刷新率較低的Apple Silicon。因此，Llama 4 Maverick顯然是最適合 Apple Silicon的模型。

另外更重要的原因就是Apple Silicon是運行大模型最具成本效益的方案，因為統一內存每GB的成本遠低于GPU顯存：

NVIDIA H100：80GB，3TB/s，售價$25,000，每GB成本$312.50
AMD MI300X：192GB，5.3TB/s，售價$20,000，每GB成本$104.17
Apple M3 Ultra：512GB，800GB/s，售價$9,500，每GB成本$18.55

以2萬億參數巨獸Llama 4 Behemoth為例。

考慮到若用H100來完整容納Behemoth模型（fp16精度），則需要50塊H100，總成本為125萬美元；
MI300X的總成本則為42萬美元；
但若使用M3 Ultra，總成本僅為7.6萬美元！

以下是網友@alexocheema對不同版本Mac運行新Llama 4版本的情況進行了全面分析。

Llama 4這次發布的模型最大一個優點之一就是稀疏模型，這給了本地部署很多想象力，也是開源模型的使命。

以精度4-bit為例，使用MLX推理框架可以在具有足夠RAM的Mac上部署這些模型。

網友@awnihannun總結了部署Llama 4最新三個模型所需要的最小配置，幾乎都可以完成本地部署：

Llama 4 Scout 109B參數：64GB的M4 Max；
Llama 4 Maverick 400B參數：256GB的M3 Ultra；
Llama 4 Behemoth 2T參數：3臺512GB的M3 Ultra；

Llama 4很強，就是寫代碼有點菜

說完了硬件，再來看看Llama 4的實測效果。網友@gnukeith測試了Llama 4的多模態能力，讓模型識別圖片中的人物來自于哪個動漫，Llama成功識別！

網友@attentionmech制作了一個模型視覺化網頁（簡單說就是看模型有多少層，有多深），Llama 4視覺上看起來確實令人驚嘆。

網友@philip_kiely使用Llama 4（Maverick）輕松擊敗了Brick Breaker氛圍測試。

當然，也有翻車的，比如網友@fighto測試了「喜聞樂見」的讓模型數r的問題，Llama 4 Maverick回答錯誤。

網友@tariquesha1測試了Llama 4的圖像生成能力。

再來看看Llama 4寫代碼的實戰案例。

網友AlexBefest宣布Llama 4 Maverick——Python六邊形測試失敗。Python六邊形測試可以說是每個新發布大模型的「試金石」了。

下面展示了其他模型在Python六邊形測試彈跳小球上的結果，來自Github的KCORES團隊。

KCORES團隊成員karminski-牙醫發布了Llama 4 Scout和Llama 4 Maverick的測試結果。

用他的話說，Llama 4 Scout小參數模型開心就好；足足有402B參數的Maverick模型的表現并不是很滿意：

Scout小參數模型大概接近Grok2的水平（咋還倒退了）；
而Mavericks還不如使用DeepSeek-V3-0324；
總之不建議Llama 4寫代碼

按照KCORES LLM Arena的評測結果，目前最好的模型GPT-4.5-Preview。

當然，目前的測試只針對寫代碼，其他長文本和多模態領域還需要更多的測試案例。

Llama 4的另一個突破就是支持10M的上下文窗口長度，相當于20個小時的視頻。

全網部署Llama 4

不管怎么說Llama 4的發布依然是開源模型的又一劑強心針。各家巨頭和平臺同時宣布支持最新的Llama 4。微軟CEO Satya Nadella宣布馬上將Scout和Maverick發布在Azure AI Foundry平臺。

Cerebras宣布將在下周完成Llama 4最新模型的部署。

Together AI上也同步推出Llama 4模型，作為Meta的發布合作伙伴，還支持Together API的方式來訪問Llama 4 Maverick 和Llama 4 Scout。

T3 Chat也宣布Llama 4 Scout和Maverick均已啟動，Scout由Groq托管，而Maverick由OpenRouter托管，并且聲明了小參數模型Scout非常便宜，決定免費發布。

Databricks數據智能平臺宣布使用Llama模型來為AI應用程序、智能體和工作流程提供支持。

接下來還會有更多的平臺跟進Llama 4最新模型，就像幾個月前各家平臺也是「瘋狂」上線DeepSeek一樣。

還有一個問題，為啥小扎選在他們的休息日發布Llama 4，馬上就周一了啊？

Defined和Liftoff的聯合創始人Nathan Lambert說頂尖Lab的領導們都會知道其他Labs的發布計劃。

難道說小扎知道下周會有什么「瘋狂」的模型發布可能會蓋過Llama 4的風頭，所以「趕鴨子上架」嗎。

首先在Llama 4的Github Model_Card的更新日志中，發現一個改動：

模型發布的日期從美國時間的4月7號改到了4月5號（也就是我們4月6號的凌晨）！

所以，周一Meta還會發布什么新模型嗎？

在llama.com的官網上，我們看到了llama4-resoning-is-coming的后綴，似乎預示著llama-4推理模型也要馬上發布了！

而奧特曼繼續放出他的煙霧彈，在社交媒體不停的預熱：OpenAI接下來也要放大招了！

而不論是此前奧特曼宣布GPT5、o3和o4-mini的消息，還是Llama 4的發布，還是DeepSeek和清華共同發布的論文，似乎預示著一件事：

所有人都在等待并期待著DeepSeek-R2！

請大家做好準備，也許下周即將是「瘋狂」的一周。

參考資料：

https://x.com/karminski3/status/1908673924596195838

https://x.com/awnihannun/status/1908676110717771994

https://x.com/alexocheema/status/1908651942777397737

https://docs.google.com/spreadsheets/d/1mcRayUPtVJG_hOMruWWEf6T8TKbfTQIvH3WUkj_kx6E/edit?gid=0#gid=0

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

太牛了！400塊洋垃圾，也能在本地部署DeepSeek？！

雷科技 2025-02-14 11:33:42
261 跟貼 261
Llama 4訓練作弊爆出驚天丑聞！AI大佬憤而辭職，代碼實測崩盤全網炸鍋

新智元 2025-04-07 13:11:24
18 跟貼 18

Meta發布Llama 4系列模型，參數高達2萬億

DeepTech深科技 2025-04-06 21:56:32
2 跟貼 2

AI 圈今年最大丑聞曝光！Llama 4 被揭訓練作弊，實測慘遭滑鐵盧，核心骨干憤然離職

愛范兒 2025-04-07 18:26:17
1 跟貼 1
Meta Llama 4被疑考試「作弊」：在競技場刷高分，但實戰中頻翻車

機器之心Pro 2025-04-07 14:37:59
0 跟貼 0

ILLUME+：華為諾亞探索新GPT-4o架構，理解生成一體模型

機器之心Pro 2025-04-07 14:47:31
0 跟貼 0

為什么只有AI編程成功落地？

虎嗅APP 2025-01-14 12:02:04
254 跟貼 254
科學家將R1技術遷移到多模態領域，只需10條數據就能提升模型性能

DeepTech深科技 2025-03-05 18:08:03
0 跟貼 0

DeepSeek開口說話了反應超神無限打斷只要兩行代碼15分鐘

量子位 2025-03-07 14:20:34
0 跟貼 0
微軟AI模型MatterGen能根據需求生成新材料

量子位 2025-01-21 18:07:40
29 跟貼 29
首個個性化對齊大模型問世！可精準識別用戶內在動機和偏好

量子位 2025-04-07 17:08:38
0 跟貼 0
清華耶魯推理模型新范式：動態推理實現高效測試時擴展

量子位 2025-04-07 17:34:42
1 跟貼 1
博睿數據全面接入DeepSeek：運用AI 鋪就大模型可觀測性進階之路

經濟觀察報 2025-04-07 20:39:06
0 跟貼 0
豪擲36億！傳OpenAI收購AI硬件公司，前蘋果首席設計師創辦

智東西 2025-04-07 20:02:36
0 跟貼 0
零基礎入門Python機器學習，復現多個頂刊案例！

醫咖會 2025-01-08 19:56:07
0 跟貼 0
大模型如何讓智能硬件有腦有腳、聽話能干？

36氪 2025-01-26 10:30:50
0 跟貼 0
估值615億美元的AI巨頭盯上高等教育

芥末堆看教育 2025-04-07 18:44:48
0 跟貼 0
DeepSeek用的GRPO占用大量內存？有人給出了些破解方法

機器之心Pro 2025-02-07 14:49:06
1 跟貼 1
司馬夾頭翻車，真相大起底

陳根談科技 2025-04-06 18:50:57
0 跟貼 0
史上最刺激147滿分桿，觀眾捂眼不敢看，連飆神仙球結果卻翻車！

大能的體育世界 2025-04-07 08:59:52
1 跟貼 1
Deadline 前還在熬夜做圖表，DeepSeek + AI 指令上線，復雜圖表即可一鍵生成

生物學霸 2025-03-30 17:36:28
0 跟貼 0
盤點那些網購翻車名場面，客服你睡著了嗎？反正我是睡不著了

情感路人乙 2025-04-04 13:20:57
14 跟貼 14
老人在院里學開三輪車，突然失控不慎側翻

小白社會觀察站 2025-04-07 16:44:15
0 跟貼 0
大船海上發生側翻，背后的損失無法估量，這就是我不買輪船的原因

田老七聊生活 2025-04-07 12:34:10
0 跟貼 0
盤點那放鞭炮翻車名場面！試試就逝世！

迷惑俠 2025-04-06 11:52:56
0 跟貼 0
水泥罐車發生側翻，救援后卻忘了司機

圖圖看劇 2025-04-07 11:40:22
3 跟貼 3
側翻在泥土里的混凝土車

小渣愛酒 2025-04-07 08:51:02
1 跟貼 1
狂妄自大的下場！格斗翻車合集

搏擊格斗在線 2025-04-06 21:09:13
1 跟貼 1
都翻車了怪誰，他始終認為是車不行，也從不懷疑自己車技不行！

愛麗絲生活說 2025-04-06 05:37:52
0 跟貼 0
亮哥今天出門試駕國產7座車，感受一下智能駕駛

股癡亮哥 2025-04-05 13:21:59
10 跟貼 10
M4 MacBook Air適合誰買？用了一陣子后我有了答案

雷科技 2025-04-07 16:36:09
4 跟貼 4
關鍵時刻人民日報重磅發聲：天塌不下來

北京青年報 2025-04-07 08:35:19
25821 跟貼 25821
謝浩楠爸爸：這次算是翻車！

正哥說 2025-04-06 22:48:49
0 跟貼 0
盤點網戀奔現翻車名場面！媽媽我再也不敢網戀了！

愛寵物頻道 2025-04-06 12:19:35
0 跟貼 0
男子坐椅子翻車，女生想救結果拉不起來

營天下 2025-04-07 11:19:13
0 跟貼 0
路口翻車事故現場！這是誰闖紅燈了？

動態新聞 2025-04-06 13:14:52
0 跟貼 0
女子騎三輪車翻車，摔的頭破血流，萬幸孩子沒事

動態新聞 2025-04-07 10:38:31
0 跟貼 0
三輪車不慎側翻，車內人員被困，眾人紛紛上前幫忙，網友：看到大家齊心協力，心里暖呼呼的

每日看點匯 2025-04-06 15:56:49
0 跟貼 0
AEB之誤踩油門遇行人，新勢力8車大混戰！竟有一半翻車了？

太平洋汽車 2025-04-06 20:00:00
5 跟貼 5
心智觀察所：誰是美國對華科技戰“總架構師”

補懂事的孩紙 2025-04-05 01:53:00
0 跟貼 0

新智元

AI產業主平臺領航智能+時代

12486文章數 66006關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

數碼

游戲

房產

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
中國最大沙漠中唯一的城市，周邊300公里被黃沙覆蓋
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

Llama 4全網首測來襲，3臺Mac狂飆2萬億！多模態驚艷代碼卻翻車

Llama 4發布36小時差評如潮！匿名員工爆料

美國小伙武當山習武15年金發變黑發:頭發都入鄉隨俗了

美國小伙武當山習武15年金發變黑發:頭發都入鄉隨俗了

刷屏中文互聯網，甲亢哥是怎么火的？

汪小菲身旁的朋友，對馬筱梅的評價

盤后A50拉升，盤中國家隊出手，啥信號

途昂Pro的五套組合拳打完 看清油車的自我救贖

態度原創

熱聞|清明假期將至，熱門目的地有哪些?

5499元！微星新款27英寸電競顯示器官宣：4K/240Hz

《巫師3》NS版幾乎不賺錢 《2077》Switch 2版截圖

生猛！三亞開始巨量拆遷！

途昂Pro的五套組合拳打完看清油車的自我救贖

《巫師3》NS版幾乎不賺錢《2077》Switch 2版截圖