如何證明自家的模型是行業一流水平?跟DeepSeek比一比。
隨著DeepSeek爆火,2025年的大模型市場,DeepSeek就像手機圈的iPhone一樣,成了各家模型廠商發布新品時的最新對標對象。
除了模型能力上號稱超過DeepSeek之外,上述對標更直觀的表現在價格上。
在今天百度文心大模型4.5 Turbo、文心大模型X1 Turbo發布時,百度創始人李彥宏就吐槽DeepSeek也不是萬能的。除了能力上只能處理文本,還不能理解和生成圖片、音頻、視頻等多媒體內容、幻覺率高外,李彥宏認為使用DeepSeek更大的問題是慢和貴,“中國市場上絕大多數的大模型API調用價格都比DeepSeek滿血版要低,而且速度也更快。”
當然,其中也包括最新發布的文心4.5 Turbo和文心X1 Turbo。官方數據顯示,文心4.5 Turbo每百萬token的輸入價格為0.8元,輸出價格3.2元。
作為對比,即便在打五折后的優惠時段(00:30-8:30),DeepSeek V3每百萬token的輸入價格也達到1元,輸出價格4元。
推理模型上,百度模型的性價比則進一步凸顯:文心大模型X1 Turbo每百萬token輸入價格1元,輸出價格4元,與DeepSeek R1優惠時段價格一致,但比DeepSeek R1標準時段(8:30-00:30)要便宜得多(R1每百萬token輸入8元,輸出16元)。
想用性價比頂住DeepSeek競爭壓力的不止百度一家。4月17日字節發布的豆包1.5·深度思考模型上,其每百萬token的輸入價格為4元,輸出價格16元,綜合成本上依然要比DeepSeek R1標準時段便宜。
這樣的性價比策略更是不止局限于國內大模型玩家。國外同樣如此。
4月份谷歌發布的首個混合推理模型Gemini 2.5 Flash,便主打一個低成本。在關閉思考模式下,Gemini 2.5 Flash每百萬token輸出成本暴降600%,可以達到0.6美元/百萬token,輸入價格0.15美元,也遠低于DeepSeek R1標準時段價格。
稍微偏離性價比策略的模型玩家是OpenAI。
2月底發布GPT-4.5后,其API價格達到75美元/百萬token輸入、150美元/token輸出,是GPT-4o的30倍,高昂價格令其飽受爭議。
但OpenAI很快糾正了自己的“錯誤”。2個月后的4月份,OpenAI專為開發者推出了三款全新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。最便宜的GPT4.1 nano,每百萬token輸入價格暴降至0.1美元,輸出價格0.4美元。
但只靠性價比顯然還不足以打開市場。DeepSeek之所以能夠出圈,除了低成本之外,其重要前提之一是模型能力有了創新,首次向外界免費展示了思維鏈的奇妙存在。
01
模型降本是趨勢,但國外比國內更貴
延續至今的大模型降本之爭,源頭便是DeepSeek。2024年5月,DeepSeek借助大模型價格戰一躍成名。當時,DeepSeek發布了DeepSeek V2開源模型,并在行業內率先降價,將推理成本降到每百萬token僅1塊錢,約等于GPT-4 Turbo的七十分之一。
隨后,字節、騰訊、百度、阿里等科技大廠紛紛降價跟進。中國大模型價格戰由此揭幕。
在接受“暗涌”采訪時,DeepSeek創始人梁文鋒解釋道,搶用戶并不是DeepSeek降價的主要目的。“我們降價一方面是因為我們在探索下一代模型的結構中,成本先降下來了,另一方面也覺得無論API,還是AI,都應該是普惠的、人人可以用得起的東西。”
此前,有云廠商高管曾向直面AI(ID:faceaibang)解釋:“降價一直存在,并且只要摩爾定律在,降低計算成本將一直是模型行業的趨勢。”
包括李彥宏在內的部分大佬更是認為,降本將是推動AI應用爆發的重要前提。
但在降本的全球趨勢之下,值得注意的不同現象是,國外同類型、同尺寸的模型,調用成本依然要比國內的更貴。
4月份剛剛發布的OpenAI o3新推理模型上,其每百萬token的輸入價格為10美元,輸出價格40美元。但以輸入價格論,o3是文心X1 Turbo的超70倍。
造成這種不同的原因之一,或許也跟國外模型廠商的多元化商業變現有關。
相比國內只能靠B端API調用收費,目前國外還有來自C端的銷售訂閱服務,甚至后者商業變現能力還要強于前者。The Information爆料,OpenAI今年訂閱銷售額有望達到80億美元,遠超銷售其API接口的約20億美元。
OpenAI CEO奧特曼近期在接受采訪時就談道,自己更感興趣的是,弄清楚如何為一個真正出色的自動化軟件工程師,或者其他類型的代理,向人們收取高額費用,而不是通過基于廣告的模式來賺取一些小錢。
此前,外界就曾爆出,OpenAI有望推出高達2000美元,乃至2萬美元的月度訂閱制。目前,OpenAI設有每月20美元和200美元兩檔訂閱模式。
02
只有性價比還不夠,關鍵在于模型是否有特色
商業變現受限之下,陷入價格戰之中的國內模型廠商,還可能迎來更大的成本壓力,甚至跌入互聯網時代燒錢補貼的競爭邏輯。
更大的挑戰還在于,僅靠性價比也并不能徹底留住用戶。
DeepSeek在去年開啟價格戰后,雖然在行業內開始嶄露頭角,但并未在大眾層面引發關注。直到DeepSeek R1模型的到來,DeepSeek才真正出圈,成為一款家喻戶曉的AI產品。
奧特曼在點評DeepSeek爆火現象時曾認為,模型的能力并不是真正讓DeepSeek獲得病毒式傳播的關鍵,關鍵在于DeepSeek免費開放了OpenAI隱藏起來的思維鏈。
但環顧當下的一眾新模型產品,除了在各項數據上比肩或者趕超DeepSeek,乃至OpenAI之外,它們尚未在產品體驗和功能上有創新之舉。
這方面從谷歌到豆包,都先后做過了反面示例。晚于DeepSeek R1近兩天發布的豆包1.5 Pro大模型,盡管在預訓練和推理成本上還要低于DeepSeek V3,但卻因為模型體驗不如前者,而未能在輿論場上激起太多水花。
同樣趕在DeepSeek R1之后發布的谷歌Gemini 2.0系列大模型,盡管其Gemini 2.0 Flash-Lite版本的調用價格,比DeepSeek V3更低,但僅靠價格優勢,也依然難以俘獲用戶的芳心。
這也從某種程度上解釋了,為什么頂著全球最貴大模型稱號的Claude,依然能俘獲一批開發者的芳心,如繼DeepSeek之后另一出圈的通用AI Agent產品Manus,便是基于Anthropic的Claude 3.5模型開發而來。
一切競爭的原點,都又回到了底層模型的技術創新和突破上。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.