網易首頁 > 網易號 > 正文申請入駐

剛剛，馬斯克發布 Grok3，推理能力遠超 o3 mini(high) 和 DeepSeek-R1

2025-02-18 14:01:00　來源: 學術頭條

北京舉報

分享至

在試圖以 974 億美元收購 OpenAI 的提議被拒絕后， 世界首富馬斯克又搞了一個大動作 ——

剛剛，他發布了 號稱“地球最聰明的 AI” ，Grok3，其由一個包含約 20 萬個 GPU 的數據中心訓練，計算能力是上一代模型 Grok 2 的“10 倍”，且使用了擴大的訓練數據集。

據此前介紹，Grok 3 是在合成數據的基礎上進行訓練的，它能夠通過重讀數據來反思所犯的錯誤，從而達到邏輯上的一致性。

評測結果方面 ，Grok3 在 AIME'24（美國數學競賽）、GPQA（研究生水平科學知識問答能力的基準測試）等測試中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。

尤其在推理方面 ，Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等測試中取得了壓倒性的優勢，最高分達到 96 分，超過了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。

甚至， 在最新的 AIME 2025 評測中 ，Grok3 推理系列模型更是達到了 90 及以上的分數，稍微領先 o3 mini(high) 的 87 分。

基于 Grok3 推理模型，Grok app 上線了 DeepSearch 功能，DeepSearch 可以表達其理解查詢的過程以及計劃響應的方式，會掃描互聯網和 X，分析信息，并針對問題提供摘要。據現場演示，DeepSearch 包括研究、頭腦風暴和數據分析等選項。

此外，在 Chatbot Arena 評估中，Grok-3 的得分達到了 1400 分，同樣超過了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。

此外，馬斯克在直播中透露，未來——最快一周后——Grok 應用程序將具備“語音模式”，這將為 Grok 模型提供合成語音。幾個月后，xAI 將開源上一代模型 Grok 2。“我們的一般做法是，當下一個版本完全推出時，我們將開源上一個版本（Grok）。”

馬斯克曾多次警告說，人工智能會給人類文明帶來風險，但他仍在極力推動加大對這一領域的投資。

xAI 于 12 月表示，它在新一輪融資中籌集了 60 億美元，投資者包括美國風險資本家、芯片制造商英偉達和 AMD，以及沙特阿拉伯和卡塔爾的投資基金等。去年 5 月，該公司首次融資便獲得了高達 60 億美元的資金。

作者：學術君

如需轉載或投稿，請直接在公眾號內留言

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

讓ChatGPT不敢開口的名字！神秘bug引馬斯克圍觀

量子位 2024-12-02 19:33:09
0 跟貼 0
馬斯克還沒做到的事，居然讓他干成了！

華商韜略 2025-02-11 10:04:46
248 跟貼 248

馬斯克擎天柱機器人表演單手接網球！

每日經濟新聞 2024-11-30 19:47:57
0 跟貼 0

DeepSeek前員工領銜，復現R1強化學習框架訓練Agent在行動中推理

量子位 2025-04-25 13:29:15
4 跟貼 4
馬斯克談外星人：沒有外星人才是最可怕的

財經網科技 2025-04-23 11:15:05
110 跟貼 110

奧特曼公開回懟馬斯克：他一生缺乏安全感

量子位 2025-02-15 12:09:37
1 跟貼 1

李飛飛等領銜，來自七所高校“三代AI人”聯合提出強化學習新框架

DeepTech深科技 2025-04-25 20:25:35
5 跟貼 5
強化學習被高估！清華上交：RL不能提升推理能力，新知識得靠蒸餾

新智元 2025-04-26 13:36:22
0 跟貼 0

特斯拉變身“自動駕駛網約車” 馬斯克：快讓你的車幫你賺錢

網易科技態度見聞 2025-04-25 10:41:55
0 跟貼 0
全球開發者組團訓練，首個異步強化學習32B推理模型震撼來襲！數據已開源

新智元 2025-04-26 13:36:18
0 跟貼 0
馬斯克談自動駕駛鐵律：天塌了也不能撞車

界面新聞 2025-04-24 09:37:16
0 跟貼 0
垂直小模型精準補位，MVP驗證成本更低更高效了

量子位 2025-04-21 14:49:47
0 跟貼 0
時隔6年，OpenAI又要開源大模型！輕量版Deep Research深夜上線，免費可用

智東西 2025-04-25 19:28:11
13 跟貼 13
研究人員構建欲求驅動智能體，可用于模擬人類日常活動

DeepTech深科技 2025-04-26 19:02:06
0 跟貼 0
馬斯克談自動駕駛：不碰撞是第一要義

財聯社 2025-04-24 10:53:20
0 跟貼 0
DeepSeek開口說話了反應超神無限打斷只要兩行代碼15分鐘

量子位 2025-03-07 14:20:34
0 跟貼 0
本想去谷歌撈一筆就跑，卻成了改變AI歷史的人

量子位 2025-02-13 13:51:17
0 跟貼 0
科學家研制具身智能巡檢機器人，對自然語言理解準確率超過96%

DeepTech深科技 2025-01-11 18:34:23
0 跟貼 0
百度，來勢洶洶

虎嗅APP 2025-04-27 01:42:08
1 跟貼 1
o3/o4-mini實測太炸裂：看照片反推定位

量子位 2025-04-17 22:23:17
0 跟貼 0
DeepSeek引爆AI革命，誰能笑到最后？

量子位 2025-03-11 17:16:22
0 跟貼 0
DeepSeek應用如何落地？解鎖“性能x多模態xRAG”技術組合密碼！

量子位 2025-03-07 22:29:18
0 跟貼 0
DeepSeek開口說話了：只要15分鐘就能讓DeepSeek開口說話

量子位 2025-03-10 18:03:15
0 跟貼 0
DeepSeek應用如何落地？解鎖性能釋放x多模態融合xRAG增強

量子位 2025-03-07 22:58:40
0 跟貼 0
實測訊飛曉醫VS DeepSeek-R1，誰是更懂你的家庭健康助手？

量子位 2025-03-08 19:20:56
0 跟貼 0
首都師范大學教師推出AI音樂學習App，已免費上架應用商店

芥末堆看教育 2025-04-26 21:28:54
0 跟貼 0
AI進校，利弊幾何

芥末堆看教育 2025-04-26 21:27:19
0 跟貼 0
李彥宏：便宜已經不是DeepSeek的優勢了

36氪 2025-04-25 21:36:11
28 跟貼 28
特朗普為何突然讓步，中美貿易戰要熄火？特斯拉降價早已說明問

肆時說 2025-04-26 23:26:23
0 跟貼 0
馬斯克剛回來，特斯拉Robotaxi就內測了

智能車參考 2025-04-26 22:19:35
2 跟貼 2
出版多本DeepSeek圖書，為何這本極具代表性？

出版商務周報 2025-04-26 19:03:59
0 跟貼 0
對話firefly螢火蟲總裁金舸：對標MINI，全球化箭在弦上

e汽車 2025-04-25 19:45:42
1 跟貼 1
跳槽請注意！未來哪三家銀行發展最好？Deepseek給出了答案

金融圈小大佬 2025-04-26 22:30:57
8 跟貼 8
鄭州高新區錦和公園：親子mini馬拉松活力開跑

大象新聞 2025-04-22 16:03:04
3 跟貼 3
多巴胺配色暴擊！科沃斯地寶 mini 顏值天花板實錘

中關村在線 2025-04-24 15:28:41
0 跟貼 0
Honda攜手Momenta、DeepSeek、寧德時代，共啟智電時代新篇章

速度計 2025-04-26 19:23:07
0 跟貼 0
以前的和現在的數學解題思路，大家喜歡以前的還是現在的呢，網友：現在的邏輯更加完整

童話鶴壁 2025-04-24 10:49:18
187 跟貼 187
美國報告發現：不是美國，反而是中國機構正在主導全球芯片的研究

包明說 2025-04-26 12:51:42
8 跟貼 8
聽聽老美的強盜邏輯，把造船業沒落，怪到我們中國頭上

老周說趣 2025-04-25 13:58:48
6 跟貼 6
董明珠，讓一幫牛鬼蛇神蹦了出來

阿鳧愛吐槽 2025-04-26 08:03:35
14854 跟貼 14854

手機 / 數碼

房產 / 家居

剛剛，馬斯克發布 Grok3，推理能力遠超 o3 mini(high) 和 DeepSeek-R1

百度心響實測：“能用版Manus”開了個好頭

特朗普將舉行集會慶祝執政100天 美媒：時機不妙

特朗普將舉行集會慶祝執政100天 美媒：時機不妙

廣廈19分勝遼寧獲開門紅 孫銘徽13分3助崴腳

金掃帚獎出爐，包貝爾意外獲“影帝”

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

夢幻西游：出了雙固傷玉魄卻難過，口袋版成刷80級環裝首選

云游湖北 | 漢川文旅新體驗：千年陶藝邂逅湖光

清徐現代 有溫度有態度

她美得好邪乎，讓人又怕又愛

特朗普將舉行集會慶祝執政100天美媒：時機不妙

特朗普將舉行集會慶祝執政100天美媒：時機不妙

廣廈19分勝遼寧獲開門紅孫銘徽13分3助崴腳

充電5分鐘續航100公里探訪華為兆瓦超充站

清徐現代有溫度有態度