早些時候,馬斯克稱Grok 3"聰明得有點可怕",能提出"完全沒有預料到的、非常不明顯的解決方案"。今天,xAI正式舉行Grok 3發布會,這款被稱為"理解宇宙"的AI模型不僅使用了最多的計算資源進行訓練,更展現出驚人的推理能力。
在發布會現場,Grok 3展示了其卓越的數學推理能力,在AIME(美國數學邀請賽)等權威測試中表現優異,甚至能解決博士級別的科學問題。更令人印象深刻的是,團隊通過兩個實時演示——計算地球到火星的往返軌道和即興創造全新游戲,證明了Grok 3不僅具備理論推理能力,還能將復雜概念轉化為實際應用。正如馬斯克所說,"這可能是最后一次有AI比Grok更優秀了。"
一、Grok 3能力突破
xAI研究負責人Jimmy在發布會上表示,從啟動第一個模型到今天不到17個月,團隊實現了前所未有的進展速度。對比最初只有3140億參數的Grok 1,Grok 3展現出顯著提升:
"距離我們啟動第一個模型還不到17個月。Grok 1當時對于現在的我們來說幾乎像是一個'玩具'——只有3140億參數。如果把時間畫在X軸,把性能指標畫在Y軸,你會看到我們整體的進展速度在整個AI領域都可以說是前所未有的。"
三大核心能力驗證
Grok 3的評估聚焦三個關鍵方向:
通用數學推理:在AIME(美國數學邀請賽)等權威測試中表現優異。值得注意的是,在2025年剛結束的AIME新題目中,Grok 3表現出了強大的泛化能力。
科學與STEM知識:能夠處理博士級別的科學問題,展現出深厚的專業知識儲備。
計算機編程實現:通過競爭性編程和LeetCode等測試,驗證了強大的代碼能力。
Deep Search:突破性搜索能力
發布會上,xAI還介紹了Grok 3的新功能"Deep Search"。這是一個革新性的搜索系統,能夠:
深度分析用戶意圖
訪問并交叉驗證多個信息源
提供透明的搜索過程
支持用戶自定義信息源
實時能力展示
為證明Grok 3的實力,發布會現場進行了兩個實時演示:
物理軌道計算:即時計算并可視化地球到火星的往返軌道。
創新游戲開發:現場將《俄羅斯方塊》和《寶石迷陣》融合,創造出一個全新的可玩游戲。
這些演示展現了Grok 3不僅具備理論推理能力,還能將復雜概念轉化為實際應用。正如xAI團隊所說,這些能力每天都在提升,"你可能會發現它幾乎每天都在變強,因為我們在不斷迭代更新,你甚至會在24小時內看到明顯的變化。"
二、技術基礎設施
在發布會上,Elon Musk詳細介紹了xAI如何在短短122天內建成了一個擁有10萬片H100 GPU的超級計算集群。這一速度遠超行業標準,正如Musk所說:"剛開始我們想找別人托管數據中心,可一問得要18-24個月才能做好。等18-24個月再啟動訓練,那我們就輸定了。只能自己干。"
關鍵挑戰解決方案
1、選址與空間:團隊找到了孟菲斯的一家閑置的伊萊克斯(Electrolux)工廠作為數據中心基地。這個決策避免了新建設施所需的漫長周期。
2、供電系統突破:"我們需要電力。我們最初想要至少120兆瓦,但那棟樓只有15兆瓦的供電。后來我們想放到20萬張GPU時,需要1/4吉瓦(250兆瓦)左右。" 為解決供電不足問題,團隊采取了三層解決方案:部署大量移動發電機;使用Tesla Megapack電池系統平滑功率波動;特殊編程優化電力管理。
創新的散熱方案
面對前所未有的密集計算資源,團隊采用了大規模液冷系統。如原文所述:"為了實現這么高的密度必須用液冷。而大規模液冷數據中心以前幾乎沒人做過,所以這是非常有挑戰的項目。"
同時,團隊租用了"全美移動冷卻能力的四分之一"來確保系統穩定運行。
網絡架構優化
為確保10萬片GPU的協同工作,團隊進行了大量網絡優化工作。正如Igor描述:"我們要讓所有GPU協同通信,得排查無數網線問題。我們曾在凌晨四五點調試某個網卡或BIOS配置......整夜整夜地忙。"
未來擴展計劃
xAI的野心不止于此。團隊已經開始籌備下一代集群,計劃將算力提升至現有規模的五倍,需要約1.2吉瓦的供電規模。Musk幽默地表示:"你知道《回到未來》里那個時光車需要1.21吉瓦嗎,差不多就是這個數量級。我們會再一次打造世界上最強的訓練集群。我們并不會就此停下。"
這一基礎設施建設展現了xAI在AI領域的決心和執行力,為Grok 3的持續進化提供了堅實的硬件基礎。團隊表示,這種規模的算力不僅支持了當前的突破,更將支持未來更多的創新。
三、產品落地
根據發布會信息,Grok 3將通過多個渠道向用戶開放:
1、X Premium Plus用戶優先體驗:正如Jimmy在發布會上宣布:"我們從今天起就開始面向X(推特)上的Premium Plus用戶率先開放。"
2、Super Grok獨立訂閱:他們介紹:"我們還宣布推出一個獨立的訂閱服務,叫Super Grok,面向那些真正的Grok粉絲。他們可以最早體驗到新功能,以及最先進的能力。" 多平臺支持
3、grok.com網頁版:提供最新、最完整的功能 iOS應用:已上架App Store 注意事項:如Igor強調,"grok.com上網頁版的功能通常是最新、最先進的,因為App上架需要額外審核流程,而手機端也有一些交互和算力限制。"
即將推出的重要功能
API開放計劃:Igor透露:"Grok 3的API,將包括推理模型和Deep Search功能,在接下來的幾周內會逐步放出。我們對企業級用例非常感興趣。"
端到端語音交互,語音功能特點:
完整的端到端模型;
支持個性化語音識別;
理解語氣、語速、情感。
如Jimmy分享:"我今天早上還試了一下,效果不錯,但還需要再打磨一點。能做到你只要開口,Grok就像真人在跟你聊天,非常酷。大概一周左右,我們就會把它放出來試試。"
個性化功能:
會話記憶功能;
多樣化角色定制:如Igor提到,"可能有人會想要一個'Dr. Grok',或者一個'Grok廚子'";
支持個性化設置和偏好保存。。
Beta階段說明
Igor特別強調:"這里要強調一下,現在還是Beta階段,也就是說一開始可能會有一些小瑕疵。我們會非??斓氐?,幾乎每天都會更新、變得更好。如果你想要更'打磨'得很好的版本,可以等一周左右。但基本上,你每一天都會看到它在進步。"
這種快速迭代的方式顯示了xAI對產品質量的追求,同時也為用戶提供了清晰的期望管理。通過多樣化的接入方式和持續的功能更新,Grok 3正在逐步實現其"理解宇宙"的愿景。
四、Grok3 發展規劃
在發布會上,xAI團隊強調了Grok 3的持續進化特性。如馬斯克所說:"如果你在用Grok 3,你可能會發現它幾乎每天都在變強,因為我們在不斷迭代更新,你甚至會在24小時內看到明顯的變化。"
團隊認為這種快速迭代對于AI發展至關重要,尤其在以下幾個方面:
模型基礎能力提升;
推理功能增強;
工具接入擴展;
用戶體驗優化;
硬件擴展計劃
xAI已經開始規劃更大規模的硬件升級。根據發布會披露:"這并不是我們建的最后一個集群,我們已經在籌備下一個了,大概會是現在算力的五倍,也就是差不多1.2吉瓦供電規模。" 這一擴展計劃包括:
擴大GPU集群規模;
提升供電能力;
優化散熱系統;
增強網絡架構;
開源策略
關于開源計劃,Elon Musk在發布會上明確表示:"我們的做法是:當新版本正式成熟時,就會開源上一代的版本。所以當Grok 3完全穩定成熟后,可能幾個月左右吧,我們會開源Grok 2。" 這一開源策略反映了xAI的兩個重要理念:保持技術領先;回饋開源社區
長期發展愿景
xAI團隊在發布會結束時表達了他們的終極目標:"讓我們一直努力下去的動力,就是能把Grok 3提供給所有人,用得越多越好,我們想讓更多人用它并享受它,這才是我們每天起床的理由。" 這個愿景包含幾個關鍵方面:
技術普及化;
應用場景擴展;
用戶價值最大化;
推動AI技術發展。
通過這些規劃,xAI展現了他們在AI領域的長期承諾和清晰路徑,為Grok 3的持續發展提供了明確方向。團隊的快速執行力和開放態度,將支持這些宏偉目標的實現。
四、馬斯克總結
在發布會最后,馬斯克分享了Grok 3項目中最具挑戰性的環節——在10萬張H100 GPU上進行模型訓練。正如其所說:"這就像在和宇宙的最終Boss戰斗,隨時可能有宇宙射線翻轉一個比特,毀掉一次梯度更新。"
團隊用122天時間,完成了別人需要18-24個月才能實現的目標。但這僅僅是開始,xAI已經在規劃五倍于當前規模的下一代計算集群。
最令人印象深刻的是團隊的終極愿景。正如他們所說:"讓我們一直努力下去的動力,就是能把Grok 3提供給所有人,用得越多越好,我們想讓更多人用它并享受它,這才是我們每天起床的理由“。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.