99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

關稅刷屏的一周,AI圈也“暗流涌動”:Llama 4來了,O3和O4-mini也要來了,DeepSeek R2和GPT-5也不遠了?

0
分享至

本文作者:鮑奕龍

來源:硬AI

本周全球被關稅議題占據頭條,但科技界的目光卻聚焦在AI領域的密集動作上。

周末,Meta深夜突襲發布Llama 4系列,號稱“原生多模態+千萬級上下文窗口”,并首次披露單卡H100可運行的輕量化版本。此前OpenAI則宣布O3和O4-mini模型即將在幾周內上線,同時確認GPT-5因技術整合和算力部署問題推遲數月。

DeepSeek則與清華大學的研究團隊本周聯合發布了一篇關于推理時Scaling的新論文,提出了一種名為自我原則點評調優(SPCT)的學習方法,并構建了DeepSeek-GRM系列模型。結合元獎勵模型實現推理時擴展,性能接近671B大模型,暗示DeepSeek R2臨近。

Meta強勢推出Llama 4,多模態與超長上下文成亮點

周六,Meta正式發布了Llama 4系列模型,Llama 4全系采用混合專家(MoE)架構,并實現了原生多模態訓練,徹底告別了Llama 3純文本模型的時代。此次發布的模型包括:

  • Llama 4 Scout(17B 激活參數,109B 總參數量,支持 1000 萬+ Token 上下文窗口,可在單張 H100 GPU 上運行);
  • Llama 4 Maverick(17B 激活參數,400B 總參數量,上下文窗口 100 萬+,性能優于 GPT-4o 和 Gemini 2.0 Flash);
  • 以及強大的 Llama 4 Behemoth 預覽(288B 激活參數,2 萬億總參數量,訓練使用 32000 塊 GPU 和 30 萬億多模態 Token)

此次公布的Llama 4 Maverick 和 Llama 4 Scout 將是開源軟件。然而,Llama 4 的新許可證對使用有一定限制,例如月活用戶超 7 億的公司需申請特殊許可,且使用時需遵守多項品牌和歸屬要求

前kaggle總裁,fast AI 創始人Jeremy Howard表示,雖然感謝開源,但Llama 4 Scout 和 Maverick 都是大型 MoE 模型,即使量化后也無法在消費級 GPU 上運行,這對開源社區的可及性來說是個不小的損失


Meta強調,Llama 4 Scout 和 Llama 4 Maverick 是其“迄今為止最先進的型號”,也是“同類產品中多模態性最好的版本”

  • Scout亮點:速度極快,原生支持多模態,擁有業界領先的 1000 萬+ Token 多模態上下文窗口(相當于處理 20 多個小時的視頻!),并且能在單張 H100 GPU 上運行(Int4 量化后)
  • Maverick性能:在多個主流基準測試中擊敗了 GPT-4o 和 Gemini 2.0 Flash,推理和編碼能力與新發布的 DeepSeek v3 相當,但激活參數量不到后者一半

X網友也對Scout模型的性能感到震驚,尤其是其在單GPU上運行并支持超長上下文窗口的能力。


最令人矚目的是Llama 4 Behemoth。目前Behemoth仍處訓練中,不過Meta將其定位為“世界上最智能的 LLM 之一”。這個擁有288B激活參數和2萬億總參數量的“巨獸”,在32000塊GPU上訓練了30萬億多模態Token,展現了Meta在AI領域的雄厚實力。

有X網友指出了Behemoth訓練的性能潛力,強調了它在階段就已經表現出超越多個最高級模型的能力,例如Claude 3.7 和Gemini 2.0 Pro。


還有X網友調侃了 Meta 的“燒錢”策略,同時對 Llama 4 的參數規模表示驚訝。


此前《The Information》周五報道稱,在投資者向大型科技公司施壓,要求其展示投資回報的情況下,Meta 計劃今年投入高達650 億美元來擴展其 AI 基礎設施。

OpenAI確認O3和O4-mini即將上線,GPT-5免費策略引轟動

在Llama 4發布的同時,OpenAI首席執行官Sam Altman則在社交媒體上確認,O3和O4-mini將在未來幾周內發布,而GPT-5則將在未來幾個月與公眾見面。


盡管沒有更多關于o3和o4mini的細節內容,但是Altman表示,OpenAI在很多方面真正改進了o3模型,一定會讓用戶大為滿意。


實際上GPT-5的功能和發布時間才是市場關注的重點。據Altman透露,GPT-5將整合語音、Canvas、搜索、Deep Research等多項功能,成為OpenAI統一模型戰略的核心。

這意味著GPT-5將不再是一個單一的模型,而是一個集成了多種工具和功能的綜合系統。通過這種整合,GPT-5將能夠自主使用工具,判斷何時需要深入思考、何時可以快速響應,從而勝任各類復雜任務。OpenAI的這一舉措旨在簡化內部模型和產品體系,讓AI真正實現隨開隨用的便捷性。

更令人興奮的是,GPT-5將對免費用戶開放無限使用權限,而付費用戶則能體驗到更高智力水平的版本。此前,奧特曼在和硅谷知名分析師Ben Thompson的深度對談中,表示因為DeepSeek 的影響, GPT-5將考慮讓用戶免費使用。

不過對于GPT-5的發布時間反復推遲,有網友做出了下面這個時間表來調侃。


DeepSeek攜手清華發布新論文

DeepSeek與清華大學的研究團隊本周聯合發布了一篇關于推理時Scaling的新論文,提出了一種名為自我原則點評調優(Self-Principled Critique Tuning,簡稱SPCT)的學習方法,并構建了DeepSeek-GRM系列模型。這一方法通過在線強化學習(RL)動態生成評判原則和點評內容,顯著提升了通用獎勵建模(RM)在推理階段的可擴展性,并引入元獎勵模型(meta RM)進一步優化擴展性能。


SPCT方法的核心在于將“原則”從傳統的理解過程轉變為獎勵生成的一部分,使模型能夠根據輸入問題及其回答內容動態生成高質量的原則和點評。這種方法包括兩個階段:

  • 拒絕式微調(rejective fine-tuning)作為冷啟動階段,幫助模型適應不同輸入類型;
  • 基于規則的在線強化學習(rule-based online RL)則進一步優化生成內容,提升獎勵質量和推理擴展性。

為了優化投票過程,研究團隊引入了元獎勵模型(meta RM)。該模型通過判斷生成原則和評論的正確性,過濾掉低質量樣本,從而提升最終輸出的準確性和可靠性。


實驗結果顯示,DeepSeek-GRM-27B在多個RM基準測試中顯著優于現有方法和模型,尤其是在推理時擴展性方面表現出色。通過增加推理計算資源,DeepSeek-GRM-27B展現了強大的性能提升潛力,證明了推理階段擴展策略的優勢

這一成果不僅推動了通用獎勵建模的發展,也為AI模型在復雜任務中的應用提供了新的技術路徑,甚至可能在DeepSeek R2上能看到該成果的展示。

有海外論壇網友調侃道,DeepSeek一貫是“論文后發模型”的節奏,競爭對手Llama-4可能因此受壓。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
媽媽最大的成功是,在兩件事上少管孩子,越不管,越有出息

媽媽最大的成功是,在兩件事上少管孩子,越不管,越有出息

西紅柿媽媽
2025-04-08 08:10:16
2025年,5國被踢出發達國家行列,分別都是誰?

2025年,5國被踢出發達國家行列,分別都是誰?

校長侃財
2025-03-02 09:37:24
特朗普很生氣,要對中國加關稅?至?104%,越南給我國提了一個醒

特朗普很生氣,要對中國加關稅?至?104%,越南給我國提了一個醒

逍遙史記
2025-04-08 10:09:29
俄軍總兵力238萬,烏軍90萬,為何雙方僅投入百萬人雙雙兵力緊張

俄軍總兵力238萬,烏軍90萬,為何雙方僅投入百萬人雙雙兵力緊張

史政先鋒
2025-04-06 13:36:18
不可思議!網傳成都一家設計院,居然給法院“發函”指導工作了…

不可思議!網傳成都一家設計院,居然給法院“發函”指導工作了…

火山詩話
2025-04-08 07:43:49
庫里罕見生氣!怒批勇士最大毒瘤,對科爾輪換安排提出2個意見

庫里罕見生氣!怒批勇士最大毒瘤,對科爾輪換安排提出2個意見

生活新鮮市
2025-04-07 16:24:30
42歲胡歌患肺癌在北京住院,時日無多想多陪女兒?工作室回應了

42歲胡歌患肺癌在北京住院,時日無多想多陪女兒?工作室回應了

慎獨贏
2025-02-24 23:56:51
遙遙落后:俄羅斯關于對繳獲的豹2A6坦克的研究結果

遙遙落后:俄羅斯關于對繳獲的豹2A6坦克的研究結果

健身狂人
2025-04-08 08:09:44
中國的出生率,永遠都不會回來了

中國的出生率,永遠都不會回來了

請辯
2024-04-23 13:50:49
人生需要六面鏡子(值得一讀)

人生需要六面鏡子(值得一讀)

可讀
2024-12-28 19:34:46
現在局勢很明朗,美國得接招了,你敢動波斯,我就收臺!

現在局勢很明朗,美國得接招了,你敢動波斯,我就收臺!

慢看世界
2025-04-07 10:59:06
賈府歸位!35歲少帥率阿賈克斯13輪不敗 贏下天王山&剩6輪9分領跑

賈府歸位!35歲少帥率阿賈克斯13輪不敗 贏下天王山&剩6輪9分領跑

直播吧
2025-04-08 11:44:10
大S豪宅拍賣新進展來了!關鍵人物出現,具俊曄或扛下爛攤子?

大S豪宅拍賣新進展來了!關鍵人物出現,具俊曄或扛下爛攤子?

阿鳧愛吐槽
2025-04-07 20:38:21
特朗普攤牌了!若對中國關稅再加征50%,統一臺灣時間將加速到來

特朗普攤牌了!若對中國關稅再加征50%,統一臺灣時間將加速到來

夢史
2025-04-08 10:09:00
“更多的國家可能轉向中國”

“更多的國家可能轉向中國”

觀察者網
2025-04-08 12:03:41
甲亢哥在香港,露出了在內地少有的白眼和表情

甲亢哥在香港,露出了在內地少有的白眼和表情

瀘沽湖
2025-04-08 10:18:49
快船最失敗的交易!這樣的湖人,也太陌生了!

快船最失敗的交易!這樣的湖人,也太陌生了!

籃球技巧教學
2025-04-08 13:58:34
“墊大欺客”?吉娜這就有點不厚道了……

“墊大欺客”?吉娜這就有點不厚道了……

印象逍遙子
2025-04-07 13:25:03
字母哥26次獲得周最佳 超越喬丹排名歷史第4!詹姆斯69次斷檔第一

字母哥26次獲得周最佳 超越喬丹排名歷史第4!詹姆斯69次斷檔第一

老王大話體育
2025-04-08 13:59:32
河北公務員出軌女教師:用道具助興,監控畫面流出,骯臟過程被扒

河北公務員出軌女教師:用道具助興,監控畫面流出,骯臟過程被扒

博士觀察
2025-04-08 11:45:09
2025-04-08 14:59:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領先的金融商業信息提供商
128381文章數 2648741關注度
往期回顧 全部

科技要聞

iPhone在美會賣2萬元上嗎?在中國會漲價嗎

頭條要聞

外交部回應美方威脅進一步對華加征50%關稅:奉陪到底

頭條要聞

外交部回應美方威脅進一步對華加征50%關稅:奉陪到底

體育要聞

極限一穿四,他把韓國主場打到靜音

娛樂要聞

尷尬!甲亢哥想聯動大張偉,卻被迫錄節目

財經要聞

"中國版平準基金"橫空出世 央行表態

汽車要聞

一季度車企銷量:下沉與上行,覺醒與迷惘

態度原創

手機
旅游
家居
時尚
公開課

手機要聞

酷賽科技旗下產品登頂紅點獎 中國智造再獲國際設計界權威認證

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

家居要聞

現代風格 年輕簡約

別再披頭散發了!今春流行“奶奶發飾”,好看巨顯臉小

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 蒙阴县| 腾冲县| 临夏县| 亳州市| 松潘县| 斗六市| 昭通市| 浠水县| 嘉鱼县| 黑龙江省| 泰和县| 上饶市| 城固县| 商洛市| 万山特区| 临武县| 屏南县| 介休市| 稷山县| 达日县| 马龙县| 丹江口市| 天台县| 孝义市| 乐都县| 通城县| 扬州市| 司法| 资阳市| 信丰县| 峨边| 九龙坡区| 泰来县| 石泉县| 朔州市| 台北市| 太保市| 绥化市| 泸州市| 赤峰市| 望城县|