3月26日,商湯科技發(fā)布2024年財(cái)報(bào),總體收入同比增長10.8%,虧損同比大幅收窄33.7%,其中生成式AI增長103.1%,營收占比從2023年的35%來到64%[1]。
考慮到時(shí)下生成式AI“退潮裸泳”的大背景,這種表現(xiàn)令人側(cè)目。新舊勢力紛紛遭遇“落地墻”圍堵,商湯卻像是每個(gè)班都有的學(xué)霸,別人還在回顧知識點(diǎn),ta已經(jīng)開始刷題了。
在AI公司中,商湯的學(xué)霸光環(huán)向來耀眼。提到中國AI產(chǎn)業(yè),商湯是絕不會(huì)忽略的一家公司。出道至今研發(fā)實(shí)力從未掉出過第一梯隊(duì),研發(fā)成果如數(shù)家珍。但光環(huán)背后,一度是面包和理想的長久拉鋸。
2018年—2022年間,商湯開始投入基礎(chǔ)設(shè)施建設(shè),研發(fā)費(fèi)用率由此飆升,背負(fù)起巨大的盈利壓力,但也由此生長出了獨(dú)一無二的商業(yè)模式。如今守得云開見月明,是科技產(chǎn)業(yè)對長期主義者的又一次褒獎(jiǎng)。
從“大裝置”開始
上海臨港,距離特斯拉超級工廠3公里,是商湯SenseCore AI大裝置所在地——商湯智算中心AIDC,后者是當(dāng)前亞洲最大的超算平臺之一[2]。
商湯智算中心AIDC
AIDC正式啟動(dòng)于2021年,SenseCore AI大裝置的打造則從更早之前就開始了,是商湯埋的最深的一個(gè)伏筆。
2017年,商湯創(chuàng)始人湯曉鷗在CCF青年精英大會(huì)提出深度學(xué)習(xí)的三大要素:算法設(shè)計(jì)、高性能的計(jì)算能力以及大數(shù)據(jù)[3]。同一時(shí)期,成為一個(gè)AI落地平臺的愿景也在商湯內(nèi)部逐步成型,自此開始了商湯對算力的前瞻性布局。
第二年,商湯開始在超算中心已有的6000張GPU的基礎(chǔ)上,著手建設(shè)SenseCore AI大裝置[2]。這是商湯研發(fā)費(fèi)用飆升的開始,也是其“大裝置+大模型”商業(yè)模式構(gòu)建的起點(diǎn)。
SenseCore AI大裝置并不只是一個(gè)單純的算力輸出設(shè)施,而是包含提供底層計(jì)算基礎(chǔ)設(shè)施服務(wù)(IaaS)與深度學(xué)習(xí)平臺服務(wù)(PaaS)、模型部署及推理服務(wù)(MaaS)三大部分的能力,旨在為模型的整個(gè)生產(chǎn)周期提供全套標(biāo)準(zhǔn)化的工具鏈,以降低模型開發(fā)的資金和時(shí)間成本。
軟硬件“兩條腿走路”,是SenseCore AI大裝置區(qū)別于目前大模型生產(chǎn)工具的差異化分界點(diǎn)。
硬件工具主要由計(jì)算基礎(chǔ)設(shè)施層提供。其中AIDC的算力規(guī)模是最直接的衡量指標(biāo)之一。截至2024年底,商湯通過運(yùn)營模式將算力總規(guī)模提升至23,000PetaFlops, 同比增長92%支撐起了在中國大模型應(yīng)用top3的市場規(guī)模。
商湯AIDC的差異化在于,訓(xùn)練上,采用了自動(dòng)化多維并行策略,并且優(yōu)化了通信和算子,明顯提高了集群的訓(xùn)練效率,每秒處理的Token數(shù)量(TGS)可達(dá)1600+,在未經(jīng)特別優(yōu)化的狀態(tài)下,要好于DeepSeek官方報(bào)告。推理上,系統(tǒng)支持開源和自研雙引擎的低比特量化推理,在內(nèi)測商湯自己的多模態(tài)模型時(shí),其推理能力比2024年7月日日新5.5發(fā)布的時(shí)候提升了50%。如果拿來跑DeepSeek R1,比如在推理吞吐性能關(guān)鍵指標(biāo)上,比業(yè)界平均成績要快25%,比頭部廠商效率也要高15%。
商湯AIDC的軟件部分涉及深度學(xué)習(xí)平臺層、模型層。深度學(xué)習(xí)平臺層可以理解為“模型生產(chǎn)流水線”,提供包括訓(xùn)練數(shù)據(jù)平臺、SenseParrots訓(xùn)練框架、模型壓縮工具及跨平臺模型部署工具;模型層類似于一個(gè)模型制造工廠,基于商湯自研的基模型和特定場景的衍生模型,向客戶直接提供模型產(chǎn)品。
軟硬件工具環(huán)環(huán)相扣、一應(yīng)俱全,使得客戶可以自由地選擇“套餐“,既可以租用流水線和工具構(gòu)建自家模型,也可以直接要求模型定制化服務(wù)。
就像一個(gè)超級賣場,消費(fèi)者可以購買工具,也可以直接購買產(chǎn)品,賣場不僅提供產(chǎn)品說明、使用指導(dǎo),還附帶送貨到家、上門安裝等保姆級服務(wù)。
這是商湯“大裝置-大模型-應(yīng)用”三位一體戰(zhàn)略的顯現(xiàn),構(gòu)建了從底層算力到終端應(yīng)用的極其完整的全產(chǎn)業(yè)生態(tài)鏈閉環(huán),形成了商湯獨(dú)特的競爭壁壘。
營收的增長標(biāo)志著這一商業(yè)模式的走通,背后助推的是商湯始終保持高位的研發(fā)投入和大膽的前瞻性布局,而多年所積累的工程經(jīng)驗(yàn),也加速了商湯的盈利兌現(xiàn),成為另一條護(hù)城河。
實(shí)踐出真知
“人工智能需要很多人工”,是上一波AI浪潮的“疑難雜癥”。模型不是建好就能用,部署環(huán)節(jié)往往意味著大量的人力內(nèi)耗,堵死了當(dāng)年許多初創(chuàng)AI公司的盈利通道。
生成式AI以“預(yù)訓(xùn)練->微調(diào)”的模式結(jié)構(gòu)性地解放了一部分人力,卻并沒有降低工程經(jīng)驗(yàn)的重要性,反而在諸多垂直領(lǐng)域,工程經(jīng)驗(yàn)的厚度直接決定了模型落地的效果。
以自動(dòng)駕駛為例,小鵬前自動(dòng)駕駛副總裁吳新宙就認(rèn)為自動(dòng)駕駛本質(zhì)是一個(gè)工程問題[4]。特斯拉入華不久的FSD,端到端在算法層面做到了頂級,但落地層面投入不足,面對國內(nèi)交規(guī)和路況水土不服。
商湯的工程能力經(jīng)歷過上一輪AI浪潮的檢驗(yàn),面對生成式AI的新業(yè)態(tài),一方面能夠?qū)ψ兓募夹g(shù)快速反應(yīng),一方面可以直接移植其行業(yè)沉淀,精確打擊痛點(diǎn)。
十幾年的行業(yè)實(shí)踐給商湯積累了深厚的行業(yè)知識和大量的真實(shí)數(shù)據(jù),得以快速建立龐大的模型矩陣,以日日新SenseNova大模型為基礎(chǔ),推出生成式AI應(yīng)用,以及針對B端企業(yè)級客戶的垂直行業(yè)推出深度定制行業(yè)大模型。
具體到應(yīng)用層面,商湯在企業(yè)級應(yīng)用構(gòu)建了“一基兩翼”的布局,“兩翼”分別為生產(chǎn)力工具、交互工具的應(yīng)用與產(chǎn)品,前者直接以企業(yè)助手、金融數(shù)據(jù)先兵、政務(wù)助手等形態(tài)為客戶提高工作效率;后者則是在智能陪伴、智能硬件交互、智能營銷上發(fā)揮作用,比如加速大模型在機(jī)器人、智能車艙等智能硬件的應(yīng)用布局,用大模型提高電商GMV等。
同時(shí),過去的工程經(jīng)驗(yàn)指導(dǎo)了工具層面的設(shè)置,使得商湯有足夠多的工具來應(yīng)答客戶不同層級的需求。完備的工具箱與洞悉需求的產(chǎn)品設(shè)計(jì)形成良性循環(huán),顯化為新客戶的增長和老客戶的留存。
例如在當(dāng)前競爭白熱化、最考驗(yàn)“模型+落地”綜合能力的智能駕駛領(lǐng)域,商湯絕影2024年新增定點(diǎn)車型41個(gè),新增定點(diǎn)車輛數(shù)超過1100萬輛;在商湯傳統(tǒng)優(yōu)勢視覺AI方面,客戶復(fù)購率按年提升了31個(gè)百分點(diǎn),合作超過3年的客戶中有約四成亦是生成式AI客戶。
這里隱含了商湯模型開發(fā)不同于主流的的思路:
相比于DeepSeek和OpenAI“拿著模型的錘子找應(yīng)用的釘子”,商湯的思路是直搗黃龍,直接從最終目標(biāo)應(yīng)用出發(fā),以應(yīng)用驅(qū)動(dòng)模型。
Deepseek應(yīng)用層面很大程度依賴其開源的生態(tài),但開源的背面缺乏穩(wěn)定的商業(yè)及技術(shù)支持與維護(hù)服務(wù)。反過來正是閉源模型的優(yōu)勢,能夠持續(xù)做針對性的性能調(diào)優(yōu)。比如商湯基于與手機(jī)廠商的深度合作,其端側(cè)大模型在高通旗艦平臺上推理速度小于1.5秒,比手機(jī)云端處理快10倍。
根據(jù)SuperCLUE《中文大模型基準(zhǔn)測評2024年度報(bào)告》,商湯“日日新”融合大模型以總分68.3與DeepSeek-V3一起并列國內(nèi)榜首。
根據(jù)SuperCLUE和OpenCompass榜單,商湯日日新5.5性能領(lǐng)先Gemini 2.0 Flash-Exp與GPT-4o,排名全國第一。而即將于4月10日發(fā)布的6.0版本據(jù)悉性能預(yù)期對標(biāo)Gemini 2.0 Pro。
OpenCompass榜單
尾聲
商湯董事會(huì)執(zhí)行主席兼CEO徐立說,通用模型的能力比單純的規(guī)模更重要。性能參數(shù)的堆砌之下,模型競爭更加實(shí)際的一面已經(jīng)顯露,其仍然遵循衡量技術(shù)的最高標(biāo)尺,即是否切實(shí)改善了人們的生產(chǎn)生活。
Deepseek的出現(xiàn)是一種信號,無論是新晉明星公司,還是歷經(jīng)浮沉的老玩家,都開始面臨商業(yè)化的靈魂拷問。其背面是對勝利者的重新定義:誰先跑出一條成功的商業(yè)化路徑,誰才是生成式AI的最終贏家。
在AI的賽道上,商湯一度是孤獨(dú)的長跑者,被質(zhì)疑過,卻從未迷茫過。持續(xù)的研發(fā)投入、落地能力的反復(fù)打磨,修煉出了獨(dú)一無二的商業(yè)模式,和應(yīng)對生成式AI最快的反應(yīng)能力,讓如今的厚積薄發(fā)來得順理成章。
生成式AI不僅僅是技術(shù)變革,其不同于以往的產(chǎn)業(yè)邏輯正在改寫科技行業(yè)成功學(xué)新范式,商湯已率先落筆,為中國AI提供了商業(yè)落地實(shí)踐的最新成功樣本。
參考資料
[1]商湯科技2024年財(cái)報(bào)
[2]AI時(shí)代領(lǐng)先者,大裝置+大模型推動(dòng)AGI落地,中銀證券
[3]湯曉鷗談AI的明天:深度學(xué)習(xí)的三大核心要素,以及在中國創(chuàng)業(yè)要像百米賽跑,黑智
[4]小鵬吳新宙:對手如何出牌,不會(huì)打亂我們的節(jié)奏,晚點(diǎn)Auto
作者:何律衡
編輯:李墨天
責(zé)任編輯:何律衡
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.