在試圖以 974 億美元收購 OpenAI 的提議被拒絕后, 世界首富馬斯克又搞了一個大動作 ——
剛剛,他發布了 號稱“地球最聰明的 AI” ,Grok3,其由一個包含約 20 萬個 GPU 的數據中心訓練,計算能力是上一代模型 Grok 2 的“10 倍”,且使用了擴大的訓練數據集。
據此前介紹,Grok 3 是在合成數據的基礎上進行訓練的,它能夠通過重讀數據來反思所犯的錯誤,從而達到邏輯上的一致性。
評測結果方面 ,Grok3 在 AIME'24(美國數學競賽)、GPQA(研究生水平科學知識問答能力的基準測試)等測試中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。
尤其在推理方面 ,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等測試中取得了壓倒性的優勢,最高分達到 96 分,超過了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。
甚至, 在最新的 AIME 2025 評測中 ,Grok3 推理系列模型更是達到了 90 及以上的分數,稍微領先 o3 mini(high) 的 87 分。
基于 Grok3 推理模型,Grok app 上線了 DeepSearch 功能,DeepSearch 可以表達其理解查詢的過程以及計劃響應的方式,會掃描互聯網和 X,分析信息,并針對問題提供摘要。據現場演示 ,DeepSearch 包括研究、頭腦風暴和數據分析等選項。
此外,在 Chatbot Arena 評估中,Grok-3 的得分達到了 1400 分,同樣超過了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。
此外,馬斯克在直播中透露,未來——最快一周后——Grok 應用程序將具備“語音模式”,這將為 Grok 模型提供合成語音。幾個月后,xAI 將開源上一代模型 Grok 2。“我們的一般做法是,當下一個版本完全推出時,我們將開源上一個版本(Grok)。”
馬斯克曾多次警告說,人工智能會給人類文明帶來風險,但他仍在極力推動加大對這一領域的投資。
xAI 于 12 月表示,它在新一輪融資中籌集了 60 億美元,投資者包括美國風險資本家、芯片制造商英偉達和 AMD,以及沙特阿拉伯和卡塔爾的投資基金等。去年 5 月,該公司首次融資便獲得了高達 60 億美元的資金。
作者:學術君
如需轉載或投稿,請直接在公眾號內留言
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.