大模型時代的“抖音”
撰文/陳鄧新
編輯/李覲麟
排版/Annalee
大模型之爭,進入關鍵時刻。
2024年,字節跳動旗下的豆包大模型實現了逆襲,憑借“更強模型、更低成本、更易落地”的打法迅速出圈。
以至于,資本熱捧“豆包概念”,賺足了2.2億股民的眼球。
特別是火山引擎Force冬季大會之后,豆包大模型全面升級,從感知信息走向感知世界,“豆包概念”一躍成為A股最靚的仔,引得字節跳動官方出面發布過度炒作的風險提示。
不難看出,豆包大模型正在成為大模型時代的“抖音”。
更強模型,嶄露頭角并非偶然
豆包大模型,上演了一場后發先至的好戲。
2020年5月15日,豆包大模型才正式下場,雖然姍姍來遲,卻迅速打開了局面,成為大模型賽道最大的“黑馬”。
關于此,從豆包的使用數據,就可見一斑。
官方資料顯示,豆包大模型5月的日均tokens使用量為1200億,到了12月日均tokens使用量超過4萬億,增長超過33倍。
而在2024年11月的AI產品全球月活躍排行榜上,豆包APP的MAU高達5998萬,僅次于OpenAI的ChatGPT,位居全球第二。
之所以如此,與模型能力強悍息息相關。
在權威機構智源研究院的最新評測中,豆包大模型在重點考察語言模型中文能力的主觀評測中排名第一,在多模態的視覺理解、視頻生成、圖像生成三個賽道均排名全球第二。
以豆包用戶青睞的AI語音為例,豆包大模型在ASR和超自然的TTS音色上下了狠功夫,通過超擬人達到類似和真人對話的效果,從而有了差異化競爭力。
豆包戰略研究負責人周昊表示:“英語口語練習是大家很喜歡的教育場景。用戶反饋說,豆包的發音、詞匯量、句型都遠遠超過他自己。通過豆包實時語音通話功能,和豆包一來一回練英語,毫不尷尬,也省了請老師輔導的開銷。”
由此可見,豆包大模型嶄露頭角,并非偶然。
這次全面煥新,豆包通用模型pro新版本全面對齊GPT-4o,使用價格僅為后者的1/8;綜合任務處理能力較5月提升32%,在推理上提升13%,在指令遵循上提升9%,在代碼上提升58%,在數學上提升43%,在專業知識領域能力提升54%。
此外,豆包音樂模型4.0版從生成60秒的片段迭代為生成3分鐘作品,具備制作一首完整音樂的能力;豆包文生圖模型2.1版,首次實現精準生成漢字和一句話P圖的能力。
簡而言之,豆包大模型的大模型能力更強了,可以滿足更多的復雜任務需求以及創新應用場景。
一名互聯網觀察人士告訴鋅刻度:“大模型是一個重資產賽道,考驗企業在資金、生態、技術、人才等方面的底蘊,Scaling Law之下強者恒強。”
通俗易懂地說,只要模型能力不斷迭代、不斷變強,豆包大模型就可以實現“一步領先,步步領先”。
于是乎,資本市場沸騰了。
機構踏破了“豆包概念”關聯的上市公司門檻,單單中科藍訊一家上市公司,2024年11月以來就累計接待了96家機構調研。
北京艾文智略投資管理有限公司首席投資官曹轍表示:“豆包的成功是字節跳動技術實力和市場定位的體現,隨著AI大模型在各領域的應用逐漸深入,市場對AI應用端的關注度也將不斷提升。”
更低成本,技術創新是關鍵
更強模型之外,更低成本是豆包大模型彎道超車的另外一個關鍵因素。
秉持“好的模型就是要讓每一家企業都用得起”的理念,豆包大模型上線之初,就將通用模型的行業定價降低了99%,拉開了大模型集體降價的序幕。
如此一來,豆包大模型走上了“高質低價”之路,成功占領用戶的心智。
嘗到甜頭之后,豆包大模型在新上架的視覺理解模型上,再次祭出降價打法:每千tokens的價格為0.003元,比行業平均定價低了85%,相當于一塊錢可以處理284張720P的圖片;同時,火山引擎額外提供更高的初始流量,RPM達到了15000次,TPM達到120萬。
這意味著,繼通用模型之后,豆包大模型推動視覺理解也進入了“厘時代”。
需要注意的是,價格戰并非豆包大模型的本意,只是技術創新帶來的結果,是一個正反饋的良性循環。
抖音集團副總裁李亮表示:“豆包大模型通過技術創新來降低成本,在算法、軟件工程和硬件方案上做了非常多優化,3厘/千tokens的定價也有可觀的毛利,而且這是一步到位的透明價格,并不是‘刊例價+折扣’的玩法。”
事實上,技術降本一直是豆包大模型的底色。
譬如,新一代的火山引擎GPU實例,通過vRDMA 網絡,支持大規模并行計算和P/D分離推理架構,顯著提升訓練和推理效率,降低成本。
再譬如,新推出的EIC彈性極速緩存,能夠實現GPU直連,使大模型推理時延降低至1/50;成本降低20%。
這么一來,豆包大模型才有了推動價格普惠的底氣。
火山引擎總裁譚待表示:“企業之所以用豆包更多,還是因為使用體驗較好,而不是沒有嘗試過其他的產品。這個市場就是要充分競爭,最關鍵的是能不能把自己的東西做好,能不能把成本做低,能不能把方案的落地應用性做好。”
換而言之,豆包大模型推崇的是良性競爭。
“對于企業級市場來說,商業模式是建立在可持續發展的基礎上,任何商品必須是盈利的,不能靠補貼來降價。如果降價是虧損的,規模越大虧得越多,這就不是合理的商業模式。”譚待如是說。
良性競爭之下,視覺理解進入大浪淘沙階段,由于門檻降低令更多開發者涌入,刺激更多的應用創新,從而催生繁榮的AICG生態。
出國旅游,可以快速看懂外文的菜單、標簽、指示牌、滾動顯示,可以識別著名地標建筑的背景知識等;家庭輔導,可以快速批改作文寫得好不好,可以數學題做得判斷對錯等;網購求知,可以拍照找同款快速進入相關的推薦界面……
以上可見,視覺理解可以全面賦能應用場景,進一步加速大模型落地。
更易落地,打通“最后一公里”
更低成本之外,更易落地是豆包大模型另外一個核心競爭力。
公開資料顯示,豆包大模型已經與八成主流汽車品牌合作,汽車行業日均tokens消耗增長了50倍,穩坐汽車行業大模型服務商第一梯隊;接入到多家手機、PC等智能終端,覆蓋終端設備約3億臺,來自智能終端的豆包大模型調用量在半年時間內增長100倍。
此外,一個好漢三個幫,豆包大模型落地離不開HiAgent、扣子、火山方舟三大平臺的支持,借此第三方企業才可以快速提升AI能力與AI應用開發效率。
以HiAgent為例,定位為低代碼平臺,大幅降低了基于大模型開發AI應用的門檻,擴大了受眾范圍,加速AI普惠。
火山引擎副總裁張鑫表示:“如果把豆包大模型比作 Android,那么HiAgent就是企業調度系統能力開發應用的SDK(軟件開發工具包)。”
通俗易懂地說,開發者可以像拼樂高一樣搭建AI應用。
此背景下,HiAgent上線7個月,成為火山引擎增長最快的企業服務產品之一,客戶涉及華泰證券、寧德時代、浙江大學等不同領域的佼佼者。
更為重要的是,迭代至1.5版之后,HiAgent提供100種行業的開發“樣板間”,企業一鍵復刻,可以使用模板輕而易舉地開發AI應用。
由此一來,解決了低代碼平臺“專業客戶看不上,小白客戶不會用”的傳統痛點。
一名業內人士告訴鋅刻度:“業務端與開發端往往需要深度溝通與反復交流,不然容易出現功能不完整、需求不匹配等情況,低代碼平臺可以讓業務端直接上手開發,省去煩瑣的中間過程,開發端也可以將工作重心轉向非標應用”。
另外,扣子平臺擁有100萬個活躍開發者,發布超過200萬個智能體;火山方舟的全域AI搜索,將企業的信息、業務和用戶需求緊密結合,幫助企業實現“發現更多,推薦更準,搜索無限可能”。
值得一提的是,豆包大模型也在對內賦能。
這其中,AIGC應用即夢表現得可圈可點,借助其制作的科幻短劇《覺醒》,成為首部單日點贊破40萬的AI短劇。
工信部信息通信經濟專家委員會委員盤和林在接受媒體采訪時表示:“即夢AI目前在國內(視頻)生成領域,還是比較領先的。”
這意味著,即夢大大降低了短劇的創作門檻以及影視創作的試錯成本。
總而言之,豆包大模型采用高舉高打的策略,圍繞“數據、場景、生態”全面迭代,一躍成為大模型時代的領先者。
因此,豆包大模型有了更大的盼頭。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.