起猛了,差點分不清馬斯克和奧特曼。
北京時間2月18日中午,馬斯克旗下人工智能公司xAI搞了一場直播,進行新一代模型Grok 3的介紹和現場演示。
氣氛很輕松,馬斯克和xAI團隊的三名成員,圍坐在一張小桌前,背后是用來展示的大屏幕。不管是這個形式,還是這個畫面,都讓人聯想到OpenAI。只不過xAI走的是暗黑極客風,OpenAI則是溫馨家居風。
這倒也不奇怪,畢竟馬斯克從創辦xAI伊始,就死死盯住OpenAI的背影狂追。
而看起來小小的發布會,在一個小時的時間里實則殺機滿滿:
*Grok 3在多項基準測試中,擊敗了競爭對手,包括DeepSeek的V3和OpenAI的GPT-4o;
*推出名為“DeepSearch”的智能搜索引擎,由推理模型Grok 3 Reasoning和Grok 3 mini Reasoning驅動;
*Grok 3將顯示詳細的思維鏈,和DeepSeek R1和OpenAI的o3-mini相似;
*將“盡快”加入語音模式。
xAI的發展迅猛,2023年7月成立,11月就發布了首個大模型Grok。次年5月,xAI完成60億美元B輪融資,12月又宣布完成60億美元C輪融資,估值超過400億美元。
從去年9月,xAI建成包含10萬張英偉達H100的集群Colossus開始,外界就在期待xAI的下一代大模型的發布。從去年年底,“跳票”到今年年初,外界又多了新的變數,一邊是OpenAI開啟算力基礎建設的“星際之門”,一邊是DeepSeek掀起低成本推理模型熱潮,Grok 3的發布頂著巨大的壓力。
在Grok 3發布之前,馬斯克做足了預熱,稱其“聰明得嚇人”“(是)最聰明的AI”,但從發布會來看,xAI尚未結束追趕態。馬斯克的AI路,還未到一馬平川之境。
就在馬斯克鼓足熱情發布Grok 3之際,奧特曼也暗戳戳來搶熱度,在X(推特前身)上發起投票,詢問網友對于OpenAI下一個開源項目的看法,是做一個相當小但仍需要在GPU上運行的o3-mini級模型更有用,還是做一個能做得最好的手機大小的端側模型更有用。
超3萬名參與投票的網友中,超過一半的票投向了端側模型。畢竟,趕在奧特曼前面,大熱的DeepSeek,已經搶先掀起了一波在智能手機和新能源汽車等終端,部署端側模型的浪潮。
Grok 3發布會之前,外界也很關心特斯拉汽車是否會接入Grok。1月初,馬斯克曾經給出肯定的回答,稱Grok會登陸特斯拉。但可惜的是,本次發布會中,馬斯克并未回應特斯拉接入Grok的相關問題。
A
發布會一開始,xAI就著重談了談Grok 3背后的Colossus超算。
該超算包含10萬張英偉達H100芯片,建立僅用三個月,是馬斯克的一大“偉業”。連黃仁勛都表示,這堪稱“奇跡”。
在發布會上,xAI表示訓練進行到第92天時,集群的規模拓展到了20萬張芯片。這是該消息首次被披露。
得益于新計算集群,馬斯克在直播演講表示:“Grok 3 的能力比 Grok 2 高出10倍。”
據xAI介紹,Grok 3 在包括 AIME(評估模型在數學問題樣本上的表現)和 GPQA(使用博士級物理、生物和化學問題評估模型)在內的基準測試中勝過 GPT-4o。此外,Grok 3的早期版本在Chatbot Arena中也獲得了有競爭力的分數,是有史以來第一個突破1400分的模型。這是一項眾包測試,讓不同的 AI 模型相互競爭,并讓用戶投票選出他們喜歡的答案。
準確地說,Grok 3是一系列模型。
Grok 3的較小版本Grok 3 mini可以更快地回答問題,但會犧牲一些準確性。
另外兩個版本 Grok 3 Reasoning和Grok 3 mini Reasoning,旨在仔細“思考”問題然后再提供解決方案,類似于OpenAI的o3-mini和DeepSeek 的 R1 等“推理”模型。
推理模型在給出結果之前會徹底檢查自己,這有助于它們避免通常會絆倒模型的一些陷阱。
xAI表示,Grok 3 Reasoning在幾個流行的基準測試中超越了OpenAI的o3-mini 的最佳版本——o3-mini-high,其中包括一個名為 AIME 2025的較新的數學基準測試。
推理模型可通過 Grok 應用程序訪問。用戶可以要求 Grok 3“思考(Think)”,或者利用“大腦(Big Brain)”模式進行推理,該模式需要額外的計算。xAI 認為推理模型最適合數學、科學和編程相關的問題。
另一個明顯沖著OpenAI和DeepSeek來的是“DeepSearch”,直譯是“深度搜索”。這是一個AI代理,由xAI的推理模型驅動,掃描互聯網和X平臺來分析信息。演示顯示,DeepSearch包含研究、頭腦風暴和數據分析等選項,會展示“思考”過程和計劃響應的方式。
就在兩周前,OpenAI推出AI代理“DeepResearch”,直譯“深度研究”。
與 DeepSeek R1和現在的OpenAI o3-mini 一樣,Grok 3將顯示詳細的思維鏈,讓用戶可以看到聊天機器人是如何思考問題的。馬斯克證實,xAI 會稍微模糊思維,這樣其他公司就不能直接復制xAI的聊天機器人。
順帶一提,馬斯克表示,在 Grok 應用中,推理模型的一些“想法”被模糊化,以防止“蒸餾”,即AI模型開發人員從另一個模型中提取知識的方法。最近,DeepSeek 被指控蒸餾 OpenAI 的模型來創建自己的模型。
當然啦,新產品還是得“會員搶先用”。
X的Premium+級別的訂戶將首先獲得 Grok 3,其他功能則由xAI的新計劃SuperGrok提供。SuperGrok 的價格為每月30美元或每年300美元,可解鎖額外的推理和 DeepSearch 查詢,并提供無限的圖像生成。
馬斯克表示,未來(最快一周后),Grok 將獲得“語音模式”,這將為 Grok 提供合成語音。幾周后,Grok 3 模型將與 DeepSearch 功能一起出現在xAI 的企業API中。幾個月后,馬斯克表示,xAI 將開源 Grok 2。
“我們的一般做法是,當下一個版本完全發布時,我們將開源最后一個版本(Grok)。”馬斯克說。“當 Grok 3 成熟穩定時,可能在幾個月內,我們就會開源 Grok 2。”
B
從演示及xAI給出的基準測試結果來看,Grok 3確實實力不俗,但這場發布會還是略有“倉促”之感。
一向樂于畫餅、擅長于把80分宣傳成101分的馬斯克,也在這次發布會時給用戶“打預防針”:“這只是一個測試版本,剛開始可能會有些不完美。如果你想要更完善的版本,可能需要等上一周。”
此外,語音模式沒有發布也值得注意。發布前的幾個小時,希馮·齊利斯(Shivon Zilis)——Neuralink高管,同時也是和馬斯克育有一對雙胞胎的孩子媽,在X上大贊和Grok 3進行的對話,稱“是我一生中最出乎意料、最值得的時光之一”,公開了Grok 3有語音功能。
但隨后馬斯克回復稱語音模式還有一些問題,還需要一周左右時間才能發布。在發布會上,結束時壓軸的也是一小段Grok 3語音對話的畫面,看起來語音模式是被臨時從這次發布會中取消的。
大家都明白這次發布對馬斯克和xAI來說都很重要,Grok 3必須支棱。
Grok 3原本定于去年年底推出,但被推遲。根據馬斯克的說法,Grok 3在今年一月初完成了訓練。
按理說這樣的推遲并不算久,但剛跨進新年,今年一月接連發生兩件大事:一是OpenAI宣布攜手軟銀和甲骨文,共建“星際之門”,預計投入5000億美元夯實AI基建。二是中國殺出個DeepSeek,其推理模型R1因低成本高性能表現驚艷大洋彼岸的硅谷。
可能也正因如此,馬斯克這次硬是整出了蘋果發布會的排場,在Grok 3發布之前就預熱不斷。馬斯克在各個場合以及X上都大贊新一代模型,以視頻接入迪拜世界政府峰會時稱“Grok 3 的表現優于我們所知的任何已發布產品”,周末在X上宣稱Grok 3是“地球上最聰明的AI”。
這也可以解釋為什么這次語音模式沒有完全準備好、Grok 3也尚處于測試階段,xAI就急著隆重召開發布會——同行的獠牙,八成已經閃得馬斯克睡不著覺了。
C
馬斯克不停地強調“再等一周”,但一周之內世界會發生什么真不好講。
在DeepSeek于1月底開始打出知名度之后,OpenAI的應對措施就火速跟上,先是給免費用戶開放o3-mini,又發布DeepResearch深度研究的功能。此外,OpenAI的CEO山姆·奧特曼(Sam Altman)前不久還發布長推文,公布GPT-5的計劃。
在更大的競爭場中,中國的科技大廠如騰訊、百度等,以及出海的中國初創AI公司如MiniMax,都紛紛接入DeepSeek的模型,眼瞅著有打造“技術共同體”之態,形成競爭合力。
好在馬斯克也有打造“馬斯克共同體”的潛力。其名下企業眾多,借由xAI正在加速彼此打通的進程。
圖源:AI制作
一開始,似乎是馬斯克名下其他幾個企業當“扶弟魔”,喂養xAI。陸續傳出過特斯拉顯卡、X平臺數據被xAI使用的消息。如今xAI也有了回饋的趨勢。
Grok從一開始就是X(前推特)訂閱用戶的“特權”,在去年底,Grok開始提供給X的免費用戶,甚至是未注冊用戶,只是模型選擇與提問數量的限制有高低之分。今年1月,Grok的獨立應用也在蘋果商店上線,正式和ChatGPT展開角逐。
本次直播期間,打開X的APP,相關入口在頂部高亮顯示。托X的福,這場直播在進行半個小時后就已經有200萬次觀看,一小時后這個數字達到300萬。從前期宣傳、發布會直播到后期嵌入,馬斯克算是把X玩明白了。
要知道,據X官方消息,2024年3月時平臺日活2.5億,月活5.5億。相比而言,據《紐約時報》,ChatGPT去年6月的月活為3.5億。X對于xAI來說,是一個巨大的流量池。
此次發布會之前,外界也很關心特斯拉汽車是否會接入Grok。還是在1月初,馬斯克曾經給出肯定的回答,稱Grok會登陸特斯拉,你可以和特斯拉對話,提出任何要求。
但可惜的是,本次發布會中沒有涉及特斯拉接入Grok的問題,倒是有一名xAI的工作人員問馬斯克Grok何時會被接入SpaceX的火箭,馬斯克回答“兩年”。
不管怎樣,xAI接下來一周,都得祈禱AI界不要再有“炸場”的同行。再稍久一些的未來,則得期待Grok 3的表現足以打動華爾街,畢竟xAI正在考慮以750億美元估值融資100億美元,而與此同時,OpenAI據傳正在進行一輪400億美元的融資,目標估值沖著3400億美元而去。
Grok 3是否是“地球上最聰明的AI”,又是否能長久成為“地球上最聰明的AI”,好戲還在后頭。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.