還真讓DeepSeek頭號黑粉美到了。
北京時間2月25日,Anthropic傳來兩個好消息。
第一個好消息是,Anthropic發布首個“混合模型”Claude 3.7 Sonnet。在騰訊、阿里、xAI等紛紛跟上DeepSeek的腳步,推出推理模型的時候,Anthropic說“我都要”,將及時應答和深度思考結合,拋棄了多模型堆砌的做法。
第二個好消息是,在Claude 3.7 Sonnet發布的幾乎同時,《華爾街日報》稱Anthropic接近完成35億美元的新一輪融資,估值可能達到615億美元,是此前180億美元估值的3倍有余。
Anthropic有很多頭銜。這家公司是OpenAI“叛軍”代表,是硅谷明星人工智能初創公司。同時,在近一個月,該公司還成為了“DeepSeek頭號黑粉”,不僅質疑V3的600萬美元訓練成本,還由聯合創始人之一親自上陣撰寫檄文,呼吁加強美國的芯片出口管制。
如今新模型發布,再加上融資即將超額完成的消息,Anthropic暫時頂住了DeepSeek帶來的壓力。
這不僅是屬于Anthropic的好消息,實際上,在華爾街和大眾都因DeepSeek質疑硅谷的高支出AI戰略時,Anthropic的表現證明著神話還未破滅。對OpenAI等也在融資的企業來說,也無疑是一個積極的信號。
DeepSeek R1推理模型的推動下,OpenAI火速上線o3 mini,馬斯克的xAI也在上周發布Grok 3時帶上了Grok Reasoning。
而Anthropic此時選擇:來個混合大招。
此前一直傳聞Claude 4即將發布,但Anthropic這次實際上發布的是Claude 3.7 Sonnet。
Anthropic稱,Claude 3.7 Sonnet是市面上首款“混合模型”,并將立即投入使用。
此“混合”,指的是業界首個在單一架構上整合實時應答(Fast Thinking)和深度思考(Slow Thinking)的模型。相比而言,不管是DeepSeek的R1模型,還是OpenAI的o3-mini,都是嚴格的推理模型。
在使用R1和o3-mini時,思考過程是強制的,用戶只能等待,由此拖慢獲取答案的時長。但有的問題實際上并不需要長時間地思考,這時候需要用戶來判斷并切換到及時應答的模型。
但在Claude 3.7 Sonnet這種混合模型中,用戶不必切換即可獲取實時應答或者深度思考。
“這個模型融合了所有功能——我們的目標是擁有一個統一的AI,能適用于各種場景。這樣對我們的客戶而言會更簡單一些。”Anthropic聯合創始人兼首席科學家賈雷德·卡普蘭(Jared Kaplan)表示。
卡普蘭將其比作人類大腦的運行方式:有的問題需要深度思考,有的問題需要快速作答。Claude 3.7 Sonnet將這兩種能力整合在同一個模型中,而不是完全分開。
除此之外,用戶可以利用“草稿”功能,在問題比較復雜時,指導模型進行更準確的思考;API用戶還可以精細控制Claude 3.7 Sonnet的思考時長,甚至控制思考的預算,如告訴Claude在回答時最多思考多少個tokens。
在模型表現上,相較于上一代Claude 3.5 Sonnet:“Claude 3.7 Sonnet 在遵循指令、一般推理、多模態能力和自主編碼方面表現出色,擴展思維在數學和科學方面提供了顯著提升。”值得一提的是,其數學、編碼能力提高10%。其中編碼能力尤為突出,在多個測試中有所展現。
根據SWE Bench測試數據,Claude 3.7的代碼能力大幅超越DeepSeek R1、OpenAI的o1、o3模型。專注AI編程的Cursor已經宣布集成Claude 3.7 Sonnet。
Claude 3.7 Sonnet已經全面上線,支持免費版、專業版、團隊版和企業版,此外可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。不過免費用戶目前無法使用擴展思考模式。
在定價方面,Claude Sonnet 3.7的價格為:輸入3美元/百萬tokens,輸出15美元/百萬tokens。這與前代模型保持一致,并顯著高于競爭對手的純推理模型,如OpenAI o3 mini(輸入1.1美元/百萬tokens,輸出4.4美元/百萬tokens)和DeepSeek R1(輸入0.55美元/百萬tokens,輸出2.19美元/百萬tokens)。
在此基礎之上,Anthropic也同步發布了專注于代碼的Agent Claude Code,可以直接在終端運行,幫開發者完成編程任務。
從搜索、閱讀代碼、編輯文件、編寫代碼、運行測試,一直到將代碼提交到GitHub。不過,目前Claude Code僅作為有限的研究預覽版提供。
在發布大模型的同時,Anthropic正在進行的融資也傳來好消息:
《華爾街日報》報道:“Claude背后的公司克服了因中國DeepSeek的成功引發的投資者擔憂,估值達到615億美元。”
據稱,Anthropic即將完成一輪35億美元的融資,估值將達到615億美元。最新一輪融資的投資者包括風投公司 Lightspeed Venture Partners、General Catalyst 和 Bessemer Venture Partners。總部位于阿布扎比的投資公司 MGX 也在洽談參與事宜。
這個數字雖然離OpenAI的1570億美元估值還有距離,但是超過了xAI去年底的400億美元估值。xAI也正在尋求融資,預計估值750億美元。
要知道,這次融資之前Anthropic的估值還只有180億美元。
知情人士向《華爾街日報》透露,Anthropic最初計劃籌集20億美元,但在和投資者談判期間成功提高了這一數額。
Anthropic迎頭趕上,甚至拿出“要超越你們所有人”的架勢,這并不令人意外。可以說,今天的兩個好消息,都在夯實Anthropic被貼在身上的標簽。
Anthropic自2021年成立之初,就因其由OpenAI前員工創辦,而喜提“OpenAI叛軍”的稱號。
之前Anthropic已經多次搶先OpenAI一步。如去年的“代理(Agent)”功能,OpenAI在Anthropic之后跟進。
這次發布混合模型,高舉“反多模型堆砌方案”的大旗,也不禁讓人想到了OpenAI CEO山姆·奧特曼(Sam Altman)前不久發布的GPT 5計劃。彼時奧特曼就表示,意識到模型和產品功能太復雜,未來將統一。不承想又被Anthropic搶先一步了。
Anthropic的聯合創始人卡普蘭和邁克·克里格 (Mike Krieger)都表示,預計競爭對手很快也會轉向這種混合模型的方向。
另一方面,在DeepSeek R1橫空出世之后,Anthropic儼然化身“DeepSeek頭號黑粉”。
對DeepSeek的態度,硅谷大佬們大多是贊許中帶著苦澀,但言語上還算客氣。
如馬斯克在Grok 3發布前,一邊贊許DeepSeek R1很強,給中國工程師點贊,但也表示DeepSeek帶來的不算AI領域的一次突破,并順勢夸贊了自家的模型。
奧特曼一邊大贊DeepSeek“無疑是令人印象深刻的模型”,一邊暗戳戳地表示DeepSeek用OpenAI專有模型訓練自己的模型,可能違反了其服務條款。后來又“大方”表示“沒有起訴DeepSeek的計劃”。
而Anthropic就很不客氣了,不僅壓根不相信DeepSeek V3的訓練成本僅有600萬美元,甚至創始人之一的達里奧·阿莫迪(Dario Amodei)還發布了檄文《關于DeepSeek和出口控制》。
文章的核心思想就是,由于DeepSeek V3不可能只花了600萬美元成本,而咱們又聽說他們走私了芯片,因此咱們得好好管制一下芯片出口。之前只管H100和H800這些高端芯片顯然是不夠的,咱得把H20也管起來。
Anthropic當然不愿意認,雖叫“OpenAI叛軍”,但背靠巨頭燒錢這方面,二者如出一轍。OpenAI前有微軟后有軟銀,而Anthropic則抱上了谷歌和亞馬遜的大腿。
尤其是亞馬遜,2023年就向Anthropic投資了40億美元,2024年又承諾投資40億美元。
而DeepSeek的大火又恰逢Anthropic進行新一輪融資之時,著急上火也是情理之中的(雖然手段有點讓人不齒)。左手檄文打壓DeepSeek,右手發布及時應答+深度思考的混合模型,總算穩住了局面,如果不出意外,這一輪Anthropic將超額完成融資目標。
Anthropic的兩個好消息,也可以讓硅谷暫時松口氣了。
正在融資的不止有Anthropic。
據《華爾街日報》等媒體,OpenAI正在洽談巨額融資,擬融資額至多400億美元,估值可能被推高至3000億美元。此外,xAI也在進行新一輪融資,以750億美元估值尋求100億美元融資。他們無疑也都感受到了DeepSeek帶來的投資者擔憂。
Anthropic至少證明了,在當下硅谷搞投入的AI路徑尚未神話破滅,“大力出奇跡”在某種程度上依然可以打動人心,雖然可能需要付出比之前多的游說成本。
但戰爭遠沒有結束。
一方面,Anthropic依然面臨著商業化難題,而這一點在后DeepSeek時代顯得更加刺眼。Anthropic此前估值和收入比達到68.6倍,而OpenAI大概在42.4倍的水平。
據The Information,Anthropic的收入預計將從2025年的22億美元激增到2027年的120億美元。挑戰在于開支,今年Anthropic預計“燒錢”30億美元,已經比前一年的56億美元低了。公司高層表示,預計到2027年可以停止赤字開支,實現盈利。
另一方面,自身商業化難解的同時,外部競爭也在加劇。
Grok 3剛剛發布,Anthropic發布混合模型,緊接著谷歌的視頻生成模型Veo 2 API也曾宣布在年初發布,還有OpenAI的GPT-4.5隨時可能降生,以及GPT-5預計在5月底發布。
開源的戰場也越來越熱鬧。馬斯克的xAI延續新代發布、開源上一代模型的做法,宣布將開源Grok 2。而OpenAI——此前和Anthropic一起被視為“閉源”的代表——也松了口,奧特曼面對DeepSeek的大火,直接坦言過去站在了“錯誤的一邊”,在社交媒體上發起投票,釋放將有一個“開源項目”的信號。
而眼下,DeepSeek也沒有坐以待斃,而是宣布啟動“開源周”,目前已經開源FlashMLA(直譯為快速多頭潛在注意力機制)的代碼,以及EP通信庫。
Anthropic頂住了DeepSeek的壓力,發布混合模型、傳出超目標融資的消息。但要讓好消息延續,仍有諸多挑戰。
歡迎在評論區留言~
如需開白請加小編微信:dongfangmark
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.