99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

關(guān)稅刷屏的一周,AI圈也“暗流涌動”:Llama 4來了,O3和O4-mini也要來了,DeepSeek R2和GPT-5也不遠了?

0
分享至

本文作者:鮑奕龍

來源:硬AI

本周全球被關(guān)稅議題占據(jù)頭條,但科技界的目光卻聚焦在AI領(lǐng)域的密集動作上。

周末,Meta深夜突襲發(fā)布Llama 4系列,號稱“原生多模態(tài)+千萬級上下文窗口”,并首次披露單卡H100可運行的輕量化版本。此前OpenAI則宣布O3和O4-mini模型即將在幾周內(nèi)上線,同時確認(rèn)GPT-5因技術(shù)整合和算力部署問題推遲數(shù)月。

DeepSeek則與清華大學(xué)的研究團隊本周聯(lián)合發(fā)布了一篇關(guān)于推理時Scaling的新論文,提出了一種名為自我原則點評調(diào)優(yōu)(SPCT)的學(xué)習(xí)方法,并構(gòu)建了DeepSeek-GRM系列模型。結(jié)合元獎勵模型實現(xiàn)推理時擴展,性能接近671B大模型,暗示DeepSeek R2臨近。

Meta強勢推出Llama 4,多模態(tài)與超長上下文成亮點

周六,Meta正式發(fā)布了Llama 4系列模型,Llama 4全系采用混合專家(MoE)架構(gòu),并實現(xiàn)了原生多模態(tài)訓(xùn)練,徹底告別了Llama 3純文本模型的時代。此次發(fā)布的模型包括:

  • Llama 4 Scout(17B 激活參數(shù),109B 總參數(shù)量,支持 1000 萬+ Token 上下文窗口,可在單張 H100 GPU 上運行);
  • Llama 4 Maverick(17B 激活參數(shù),400B 總參數(shù)量,上下文窗口 100 萬+,性能優(yōu)于 GPT-4o 和 Gemini 2.0 Flash);
  • 以及強大的 Llama 4 Behemoth 預(yù)覽(288B 激活參數(shù),2 萬億總參數(shù)量,訓(xùn)練使用 32000 塊 GPU 和 30 萬億多模態(tài) Token)

此次公布的Llama 4 Maverick 和 Llama 4 Scout 將是開源軟件。然而,Llama 4 的新許可證對使用有一定限制,例如月活用戶超 7 億的公司需申請?zhí)厥庠S可,且使用時需遵守多項品牌和歸屬要求

前kaggle總裁,fast AI 創(chuàng)始人Jeremy Howard表示,雖然感謝開源,但Llama 4 Scout 和 Maverick 都是大型 MoE 模型,即使量化后也無法在消費級 GPU 上運行,這對開源社區(qū)的可及性來說是個不小的損失


Meta強調(diào),Llama 4 Scout 和 Llama 4 Maverick 是其“迄今為止最先進的型號”,也是“同類產(chǎn)品中多模態(tài)性最好的版本”

  • Scout亮點:速度極快,原生支持多模態(tài),擁有業(yè)界領(lǐng)先的 1000 萬+ Token 多模態(tài)上下文窗口(相當(dāng)于處理 20 多個小時的視頻!),并且能在單張 H100 GPU 上運行(Int4 量化后)
  • Maverick性能:在多個主流基準(zhǔn)測試中擊敗了 GPT-4o 和 Gemini 2.0 Flash,推理和編碼能力與新發(fā)布的 DeepSeek v3 相當(dāng),但激活參數(shù)量不到后者一半

X網(wǎng)友也對Scout模型的性能感到震驚,尤其是其在單GPU上運行并支持超長上下文窗口的能力。


最令人矚目的是Llama 4 Behemoth。目前Behemoth仍處訓(xùn)練中,不過Meta將其定位為“世界上最智能的 LLM 之一”。這個擁有288B激活參數(shù)和2萬億總參數(shù)量的“巨獸”,在32000塊GPU上訓(xùn)練了30萬億多模態(tài)Token,展現(xiàn)了Meta在AI領(lǐng)域的雄厚實力。

有X網(wǎng)友指出了Behemoth訓(xùn)練的性能潛力,強調(diào)了它在階段就已經(jīng)表現(xiàn)出超越多個最高級模型的能力,例如Claude 3.7 和Gemini 2.0 Pro。


還有X網(wǎng)友調(diào)侃了 Meta 的“燒錢”策略,同時對 Llama 4 的參數(shù)規(guī)模表示驚訝。


此前《The Information》周五報道稱,在投資者向大型科技公司施壓,要求其展示投資回報的情況下,Meta 計劃今年投入高達650 億美元來擴展其 AI 基礎(chǔ)設(shè)施。

OpenAI確認(rèn)O3和O4-mini即將上線,GPT-5免費策略引轟動

在Llama 4發(fā)布的同時,OpenAI首席執(zhí)行官Sam Altman則在社交媒體上確認(rèn),O3和O4-mini將在未來幾周內(nèi)發(fā)布,而GPT-5則將在未來幾個月與公眾見面。


盡管沒有更多關(guān)于o3和o4mini的細(xì)節(jié)內(nèi)容,但是Altman表示,OpenAI在很多方面真正改進了o3模型,一定會讓用戶大為滿意。


實際上GPT-5的功能和發(fā)布時間才是市場關(guān)注的重點。據(jù)Altman透露,GPT-5將整合語音、Canvas、搜索、Deep Research等多項功能,成為OpenAI統(tǒng)一模型戰(zhàn)略的核心。

這意味著GPT-5將不再是一個單一的模型,而是一個集成了多種工具和功能的綜合系統(tǒng)。通過這種整合,GPT-5將能夠自主使用工具,判斷何時需要深入思考、何時可以快速響應(yīng),從而勝任各類復(fù)雜任務(wù)。OpenAI的這一舉措旨在簡化內(nèi)部模型和產(chǎn)品體系,讓AI真正實現(xiàn)隨開隨用的便捷性。

更令人興奮的是,GPT-5將對免費用戶開放無限使用權(quán)限,而付費用戶則能體驗到更高智力水平的版本。此前,奧特曼在和硅谷知名分析師Ben Thompson的深度對談中,表示因為DeepSeek 的影響, GPT-5將考慮讓用戶免費使用。

不過對于GPT-5的發(fā)布時間反復(fù)推遲,有網(wǎng)友做出了下面這個時間表來調(diào)侃。


DeepSeek攜手清華發(fā)布新論文

DeepSeek與清華大學(xué)的研究團隊本周聯(lián)合發(fā)布了一篇關(guān)于推理時Scaling的新論文,提出了一種名為自我原則點評調(diào)優(yōu)(Self-Principled Critique Tuning,簡稱SPCT)的學(xué)習(xí)方法,并構(gòu)建了DeepSeek-GRM系列模型。這一方法通過在線強化學(xué)習(xí)(RL)動態(tài)生成評判原則和點評內(nèi)容,顯著提升了通用獎勵建模(RM)在推理階段的可擴展性,并引入元獎勵模型(meta RM)進一步優(yōu)化擴展性能。


SPCT方法的核心在于將“原則”從傳統(tǒng)的理解過程轉(zhuǎn)變?yōu)楠剟钌傻囊徊糠郑鼓P湍軌蚋鶕?jù)輸入問題及其回答內(nèi)容動態(tài)生成高質(zhì)量的原則和點評。這種方法包括兩個階段:

  • 拒絕式微調(diào)(rejective fine-tuning)作為冷啟動階段,幫助模型適應(yīng)不同輸入類型;
  • 基于規(guī)則的在線強化學(xué)習(xí)(rule-based online RL)則進一步優(yōu)化生成內(nèi)容,提升獎勵質(zhì)量和推理擴展性。

為了優(yōu)化投票過程,研究團隊引入了元獎勵模型(meta RM)。該模型通過判斷生成原則和評論的正確性,過濾掉低質(zhì)量樣本,從而提升最終輸出的準(zhǔn)確性和可靠性。


實驗結(jié)果顯示,DeepSeek-GRM-27B在多個RM基準(zhǔn)測試中顯著優(yōu)于現(xiàn)有方法和模型,尤其是在推理時擴展性方面表現(xiàn)出色。通過增加推理計算資源,DeepSeek-GRM-27B展現(xiàn)了強大的性能提升潛力,證明了推理階段擴展策略的優(yōu)勢

這一成果不僅推動了通用獎勵建模的發(fā)展,也為AI模型在復(fù)雜任務(wù)中的應(yīng)用提供了新的技術(shù)路徑,甚至可能在DeepSeek R2上能看到該成果的展示。

有海外論壇網(wǎng)友調(diào)侃道,DeepSeek一貫是“論文后發(fā)模型”的節(jié)奏,競爭對手Llama-4可能因此受壓。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國拒買波音,特朗普暴怒,白宮:現(xiàn)在明明是中國要跟我們談協(xié)議

中國拒買波音,特朗普暴怒,白宮:現(xiàn)在明明是中國要跟我們談協(xié)議

千里持劍
2025-04-16 08:51:49
對話鄭永年:特朗普逼中國簽下新版“廣場協(xié)議”幾無可能 | 新京報專欄

對話鄭永年:特朗普逼中國簽下新版“廣場協(xié)議”幾無可能 | 新京報專欄

新京報評論
2025-04-16 22:37:28
乒乓球世界杯女子1/8決賽:王曼昱vs張本美和 孫穎莎vs波爾卡諾娃

乒乓球世界杯女子1/8決賽:王曼昱vs張本美和 孫穎莎vs波爾卡諾娃

直播吧
2025-04-16 23:41:09
硬脫鉤已開始?240萬噸大豆運抵中國港口,這一次,中國動了真格

硬脫鉤已開始?240萬噸大豆運抵中國港口,這一次,中國動了真格

科學(xué)認(rèn)識論
2025-04-16 17:38:13
國務(wù)院任命他新職務(wù),不再擔(dān)任外交部副部長

國務(wù)院任命他新職務(wù),不再擔(dān)任外交部副部長

上觀新聞
2025-04-16 13:09:06
異常簡短!浙江隊長:我不是不尊重你們,沒什么特別想說的

異常簡短!浙江隊長:我不是不尊重你們,沒什么特別想說的

直播吧
2025-04-16 21:12:12
特朗普這次徹底急眼了:我治不了中國,我還治不了你?

特朗普這次徹底急眼了:我治不了中國,我還治不了你?

翻開歷史和現(xiàn)實
2025-04-16 09:31:48
特朗普的底牌亮出后,我國突然換將,不一般,美國如意算盤要落空

特朗普的底牌亮出后,我國突然換將,不一般,美國如意算盤要落空

DS北風(fēng)
2025-04-16 23:17:05
這個牢他坐定了

這個牢他坐定了

阿亮評論
2025-04-16 18:19:22
老婆拒絕同房半年,我受不了找岳母談?wù)?誰知岳母的舉動讓我慌了神

老婆拒絕同房半年,我受不了找岳母談?wù)?誰知岳母的舉動讓我慌了神

荔枝人物記
2025-04-11 17:41:19
醫(yī)生忠告:別再拿這些瓶子裝東西了,患癌再后悔就晚了!趕緊扔掉

醫(yī)生忠告:別再拿這些瓶子裝東西了,患癌再后悔就晚了!趕緊扔掉

奇妙的本草
2025-04-15 19:00:06
哈啰回應(yīng)1400元順風(fēng)車拼了7個人:永久封禁涉事車主賬號

哈啰回應(yīng)1400元順風(fēng)車拼了7個人:永久封禁涉事車主賬號

大象新聞
2025-04-16 16:26:01
歐冠主場上半場0射正,這是皇馬自2024年3月以來首次

歐冠主場上半場0射正,這是皇馬自2024年3月以來首次

直播吧
2025-04-17 04:08:05
歐冠狂歡夜:阿森納開場丟點 皇馬進球+點球被取消 拜仁0-0國米!

歐冠狂歡夜:阿森納開場丟點 皇馬進球+點球被取消 拜仁0-0國米!

侃球熊弟
2025-04-17 03:41:12
又變卦了,特朗普不甘心失敗,這一戰(zhàn)把中國超級大國地位打出來了

又變卦了,特朗普不甘心失敗,這一戰(zhàn)把中國超級大國地位打出來了

艾米手工作品
2025-04-15 14:56:11
“第二個烏克蘭”出現(xiàn)?亞洲一強國突然倒戈,中方做好最壞準(zhǔn)備

“第二個烏克蘭”出現(xiàn)?亞洲一強國突然倒戈,中方做好最壞準(zhǔn)備

凌晨觀點
2025-04-16 17:59:31
訂婚強奸案維持原判:男方拒不認(rèn)罪,其母親因公布女方隱私遭訓(xùn)誡

訂婚強奸案維持原判:男方拒不認(rèn)罪,其母親因公布女方隱私遭訓(xùn)誡

新京報
2025-04-16 14:32:11
中超浙江隊外援布彭扎墜亡,警方通報:排除刑事案件

中超浙江隊外援布彭扎墜亡,警方通報:排除刑事案件

澎湃新聞
2025-04-16 23:07:02
拜登狠批特朗普政府:“破壞巨大,令人震驚”!還要見“300歲領(lǐng)社保的人”

拜登狠批特朗普政府:“破壞巨大,令人震驚”!還要見“300歲領(lǐng)社保的人”

上觀新聞
2025-04-16 18:08:14
關(guān)稅戰(zhàn),是破除中國內(nèi)卷的契機

關(guān)稅戰(zhàn),是破除中國內(nèi)卷的契機

老羅視野
2025-04-16 10:37:34
2025-04-17 04:24:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
128702文章數(shù) 2648918關(guān)注度
往期回顧 全部

科技要聞

華為問界M8售價公布:36.98萬元起

頭條要聞

鄭永年:特朗普逼中國簽下新版"廣場協(xié)議"幾無可能

頭條要聞

鄭永年:特朗普逼中國簽下新版"廣場協(xié)議"幾無可能

體育要聞

對著木板踢球的小鎮(zhèn)姑娘 成了皇馬第一人

娛樂要聞

娛樂圈的“現(xiàn)實”在岳云鵬身上應(yīng)驗了

財經(jīng)要聞

增長5.4% 一季度GDP增速為何超預(yù)期?

汽車要聞

又帥又快超實用 極氪007GT獵裝車才是完美的車?

態(tài)度原創(chuàng)

教育
時尚
本地
游戲
健康

教育要聞

看看三年級同學(xué)的算式謎題,大家?guī)追昼娔茏龀稣_答案來呢

《我的后半生》,70歲正是純愛的好年紀(jì)!

本地新聞

云游湖北 | 七仙女都愛的山水,雙峰米酒一口上頭

夢幻西游4月仙族門派調(diào)整:魔天宮首回合秒6 凌波被削清寵能力

在中國,到底哪些人在吃“偉哥”?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 纳雍县| 平泉县| 军事| 青冈县| 霍林郭勒市| 英山县| 怀柔区| 栾城县| 珠海市| 临澧县| 淮阳县| 丹江口市| 湘阴县| 南昌县| 无为县| 宁城县| 赞皇县| 临武县| 阳东县| 辛集市| 安多县| 卫辉市| 土默特左旗| 驻马店市| 铁岭市| 图木舒克市| 静安区| 奎屯市| 弥渡县| 宜丰县| 湘西| 南溪县| 响水县| 江达县| 故城县| 永兴县| 永昌县| 淳安县| 安宁市| 通州市| 会泽县|