出品|虎嗅科技組
作者|宋思杭
編輯|苗正卿
頭圖|智譜Openday現場
那個在一個月內斬獲三輪國資的“國家隊”智譜,終于開啟與DeepSeek正面交鋒。
3月31日,智譜在中關村論壇閉幕式現場發出奇襲,這同時也是一場醞釀已久的反擊。
當天,智譜在智能體產品和基座模型兩大維度,分別推出“AutoGLM沉思模型”和推理模型GLM-Z1-Air(以下簡稱“Air”)。值得一提的是,智譜不僅再次上演“以小搏大”,其宣布在性能表現上,Air僅用32B參數即可比肩671B的DeepSeek R1模型;更重要的是,價格還僅是DeepSeek R1模型的1/30。
這是2025年以來,大模型六小虎中首個發布推理模型,并宣布能夠媲美DeepSeek的AI獨角獸。然而,性能比肩還不夠,DeepSeek的先發制人也不由得讓智譜需要給出更高的籌碼,才能達到反擊效果。所以在本次發布會上,智譜則是以每百萬tokens 0.5元的價格反擊DeepSeek,而且該模型也即將于2025年4月14日正式開源。
圍繞2025年的大模型圈,“預訓練”已經很難再次成為關鍵詞。最明顯的表現是,大模型六小虎中已經有兩家出現嚴重的戰略搖擺。其中,百川智能大批核心成員離職,并砍掉了包括在B端大模型商業化進程最快的金融業務和互聯網業務;而零一萬物則是主動放棄萬億參數賽道,全面轉向B端業務。此前,李開復曾在與彭博社采訪中談道,“未來的大模型將會收斂至DeepSeek、阿里巴巴、字節跳動三家。”
但也并非所有大模型廠商都在摒棄預訓練、擁抱DeepSeek。對此,智譜創始人兼CEO張鵬告訴虎嗅,“我們仍然會堅持預訓練,但更深一層的問題是,目前關于預訓練有很多沒有被關注到的點,比如預訓練的架構、數據使用效率等等。”
實際上,自2025開年以來,DeepSeek對所有基座模型形成的降維打擊,正在持續給整個行業帶來余震。“DeepSeek做得那么好,為什么還要投你?”類似這樣的靈魂拷問,卻從未在過去兩年從投資人的口中傳出。相反,“大模型六小虎”曾是他們摘不到的星星。
而從整個第一季度來看,資本正逐漸對大模型初創公司失去耐心。可以說,除了智譜連續拿到地方產投融資,目前并無市場化資本進入到其余大模型企業當中。
與此同時,這種降維打擊所暴露出的另一面是,即使是用百億元砸出來的預訓練,也沒能讓基座模型廠商形成護城河。
商業化難題,是大模型企業這三年來都沒能繞過去的檻。繼拿到多筆國資后,智譜也即將開啟新旅程。在今日的發布會現場,CEO張鵬首次正面回應:“智譜的確在為IPO鋪路,但目前并無具體計劃。”
隨之而來被擺到臺桌上的疑問是,在如今大模型商業化前景并不明朗之際,作為大模型六小虎之首(根據估值排名),這條路智譜能否順利走下去?
值得一提的是,在商業化布局方面,智譜正在以端側為切口,滲透到金融、教育、醫療、政務等七大行業。在海外方面,智譜還在本次發布會上正式宣布與東盟十國及“一帶一路”沿線國家共建“自主大模型共建聯盟”。
然而,在談及到智譜是否側重B端時,張鵬坦言道,“我討厭標簽,智譜也并不是一家做ToB的公司。我們只做自己認為有意義的事。”
實際上,關于究竟應該做ToB還是ToC,對于國內大模型公司而言并非是一道選擇題。甚至,有一個共識是,長遠而言,大模型的未來一定在C端應用上。只不過,短期來看,擺在所有大模型企業面前的,也只有一條路。
對于杭州、珠海、成都等地方產業而言,智譜的確能許他們一個動聽的故事。比如在浙江打造多個產業的垂直大模型示范項目,再比如與珠海龍頭企業打造城市級GLM大模型空間。但對于智譜這家估值百億元的大模型創業公司而言,其真正的星辰大海是一個MAU過億的C端應用,是一個能塑造出完整生態的大模型產品。
更毋庸置疑的是,這場商業博弈的底層邏輯,需建立在B端場景的短期盈利閉環之上。然而行業見證的是,價值體系重構戰役的全面爆發。
自2025年初DeepSeek以“成本優勢+開源”一套組合拳撕開市場缺口,頭部云廠商能夠依托生態優勢迅速卡位,而大模型創業公司也只能利用價格來力挽狂瀾。
也許,智譜希望通過制造這場奇襲,給DeepSeek造成“億點”沖擊。
以下是與智譜CEO張鵬對話實錄:
Q:如今DeepSeek給大模型公司造成了或多或少的沖擊,您剛剛也提到Air模型將于4月14日開源。智譜的開源策略和商業化如何形成互補?
張鵬:開源是我們智譜從第一天開始就堅持的事情。宣布2025年是我們的開源年,是考慮到當下,尤其是DeepSeek發布之后對于整個技術生態的影響,大家認知上的影響。我們覺得從開源角度可以加大一些力度。
當然從商業角度來說,肯定會對我們商業策略和服務模式會有一定影響,我們也做了及時的調整,內部也做了相應的調整。我們認為模型即服務(MaaS)會真正落地,變成用服務的模式把模型基礎設施的特征體現得更明確。因為過往的模式在于大家所有的關注點在模型本身上,但是企業或用戶不管是調API或者買模型也好,怎么使用好這個模型才是大家面臨最大的問題。
從這點來說,作為基座或模型的提供方,這些業務如何以創新的方式實現,需要雙方磨合出能夠落地的方案。在這樣的前提下,開源不開源、免費不免費,本身已經不是特別關鍵的問題。
Q:現在大家很少提預訓練大模型的能力,你怎么看預訓練大模型基礎的能力?另外RL、CoT這種后訓練的模型推理能力,讓推理模型能力逐漸提升,而且提升的性價比從用戶端感知可能是比較好的。你覺得推理模型的天花板在哪里?主要使用場景在哪里?
張鵬:對于預訓練這件事情,今天早晨我們在一個圈子里討論問題,也是不斷的學習。大家反共識的點在于什么呢?預訓練仍然很重要。為什么仍然很重要?預訓練雖然現在關注度不那么高,但是后面的RL或者各種方法也好,其實本質上還是依賴預訓練所帶來的基座模型天花板,無論是RL等等也好,都是在深度更大的程度挖掘、逼近這個天花板,這個天花板是隱形的。但是預訓練仍然很重要,當然預訓練里面的問題非常多,或者待研究的點非常多,預訓練的架構、數據使用效率甚至是訓練計劃怎么優化?就像我們說的智能體的學習一樣,是不是需要有易到難的過程,還是無序的進行預訓練?這里面還有很多問題需要去研究。
這一點上大家關注度沒有那么高,反過來講智能體包括推理模型的應用,是因為技術發展就是這樣。當某一項技術進入到所謂的穩定發展期后,大家的注意力會轉移到所謂的下一個爆發期的點上,這是很正常的事情。但是處于爆發期的技術,后面會不會也回到爆發期然后再穩定的發展,我相信大概率還是這樣。
當然目前來看,推理模型或者推理能力在更多的泛用性任務上表現上并不及預期,也是隨著我們研究的進展改變的。最早的推理模型只能解數學、物理這種明確標準答案反饋的任務。后來RL也證明,當你的RL的獎勵方式或優化策略有一定調整后,它也可以在其他的開放問題上,比如文字生成、文科類等問題上表現不錯。所以,每一個技術的改進,在原來的路徑上會產生新的可能性。
Q:智譜今年融資計劃主要有哪些方向?哪些地方需要大筆投?
張鵬:這和AGI目標有關系,我們判斷實現AGI的路程還很長,這個過程中需要很多技術探索和研究投入,成本非常可觀。要知道,從0到1的開拓和從1到10的復制,這兩個之間的成本不可同日而語。前者的試錯成本相對更高,這是不可避免的,我們不希望永遠走在別人后面,我們現在已經走在前面,而我們走在前面的這部分需要加大投入做這些事情。
Q:智譜在Agent領域已經有一定布局,本次新產品的推出是否意味著公司在這方面的調整?未來公司在Agent的規劃是怎樣的?
張鵬:我們對Agent領域的投資確實很早,2023年我們開始在這一塊投入,大家還在拼基座模型、訓練大模型和預訓練的時候,我們就在這里投入了。站在AGI實現路徑上,我們是從L1的預訓練到L2的對齊和推理,再到L3的工具使用包括Agent的使用,一級級延續上去的。所以,不能說今天的發布會表示著我們的Agent戰略有非常巨大的變化,只是到了當下這個階段,我們會認為進入到一個可以有更大規模應用和落地的階段。
Q:你認為下一代Agent的核心能力是什么?AutoGLM系列未來的迭代方向是否包括多模態或者是具身智能?
張鵬:Agent的的核心能力無非是兩種,第一個是模型本身能力,包括底層的語言能力、多模態能力和推理能力。第二點是感知環境和環境智能交互,也就是Agent強調的溝通交流能力。這兩點我認為是智能體能在應用層面爆發,能夠落地產生實際效果的兩個核心價值。
Q:現在大多數Agent都是在桌面端,智譜發布的也是在桌面端。您認為未來會不會有更多的入口?當前的話我們要在手機上,未來有沒有在AI眼鏡上調用Agent的能力,去實現我想達到的目標?現在要調用更多的入口還有哪些挑戰?
張鵬:其實這個事情我們已經在做了,只不過今天這個場合突出重點,我們拿了通用場景來說。包括更多的端,AutoGLM更早是手機端,今天只不過是把它移到PC上。其他智能上的硬件,眼鏡、汽車、平板等等的端側,都可以接。但是里面確實有一些問題,不同類型的設備,最終的交互方式不一樣,比如說眼鏡不可能有鍵盤,就得用語音交互,語音就引入了全新的模態。如果說產品里面有明顯的短板,這個事情就成不了,鏈條上缺了一環你就做不了,好在整體的能力是齊的,仍然是有高有低。
包括硬件本身也要適配新的技術,比如說我們中關村論壇這次是夸父機器人和我們合作,接了那個模型。但是它接的不是我們最新的模型,沒有辦法接。因為整體所有的控制和交互的模型只有一套,我們有一套體系,這兩者之間還是有一定區分的,想要打磨出完全契合的模式是要花很長時間的。所以,大家也不能忽視這個問題。未來我們期待是這樣的,很簡單有SDK或者有一個芯片放上去就接上了,這是未來的事情,現在做不到。
Q:智譜自己有想做具身智能嗎?
張鵬:我們會有相應的布局,這個事情可能還需要一點時間。
Q:您剛才提到現在堅持預訓練的模型,很多家企業已經放棄了。那現階段公司從戰略層面來講,技術和商業化戰略層次和人員、資源的分配大概是什么樣的情況?
張鵬:這是戰略層面問題。我們把自己定位成技術驅動的公司,另外一條腿是我們的商業化路徑。這兩條腿并不是互相矛盾的,也不是互相爭搶資源,我們是動態調整的過程。我們覺得技術的推進和演進,到了一個必須要深入到產業和應用當中去,吸取營養回饋我們技術研發的階段。所以才會在這個階段從去年開始大力推進產業化、商業化落地這件事情,會有資源投入。但是從整體的核心任務和資源投入角度來講,我們還是投入在技術研發、創新更高一些。
Q:很多投資人認為是今年傳統行業大規模應用爆發的一年,智譜也是最早做Agent。那么在落地層面,公司在2025年預期是怎樣的,Agent目前急需解決的問題有哪些?
張鵬:今天是Q1的最后一天,今年的很多事情還在計劃當中。拿去年來講,我們拉齊看了一下,還是很不錯的,整體實現了超過100%的增長速度,很多頭部行業已經打進去,有一定規模化的效果。今年我們會認為因為市場變化,會讓市場呈十倍以上的增長,機會是更大的,但是整個模式和商業路徑會有一些調整。但我們還是保持一貫穩定的商業化落地速度和效益,持續提升商業化落地的效果。因為作為一個企業來講,最終的目的還是要掙錢,不掙錢不行。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4184318.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.