孤獨(dú)的長跑者“商湯”，被質(zhì)疑過，從未迷茫過

2025-04-02 11:14:54　來源: 遠(yuǎn)川研究所

上海舉報(bào)

分享至

3月26日，商湯科技發(fā)布2024年財(cái)報(bào)，總體收入同比增長10.8%，虧損同比大幅收窄33.7%，其中生成式AI增長103.1%，營收占比從2023年的35%來到64%[1]。

考慮到時(shí)下生成式AI“退潮裸泳”的大背景，這種表現(xiàn)令人側(cè)目。新舊勢力紛紛遭遇“落地墻”圍堵，商湯卻像是每個(gè)班都有的學(xué)霸，別人還在回顧知識點(diǎn)，ta已經(jīng)開始刷題了。

在AI公司中，商湯的學(xué)霸光環(huán)向來耀眼。提到中國AI產(chǎn)業(yè)，商湯是絕不會(huì)忽略的一家公司。出道至今研發(fā)實(shí)力從未掉出過第一梯隊(duì)，研發(fā)成果如數(shù)家珍。但光環(huán)背后，一度是面包和理想的長久拉鋸。

2018年—2022年間，商湯開始投入基礎(chǔ)設(shè)施建設(shè)，研發(fā)費(fèi)用率由此飆升，背負(fù)起巨大的盈利壓力，但也由此生長出了獨(dú)一無二的商業(yè)模式。如今守得云開見月明，是科技產(chǎn)業(yè)對長期主義者的又一次褒獎(jiǎng)。

從“大裝置”開始

上海臨港，距離特斯拉超級工廠3公里，是商湯SenseCore AI大裝置所在地——商湯智算中心AIDC，后者是當(dāng)前亞洲最大的超算平臺之一[2]。

商湯智算中心AIDC

AIDC正式啟動(dòng)于2021年，SenseCore AI大裝置的打造則從更早之前就開始了，是商湯埋的最深的一個(gè)伏筆。

2017年，商湯創(chuàng)始人湯曉鷗在CCF青年精英大會(huì)提出深度學(xué)習(xí)的三大要素：算法設(shè)計(jì)、高性能的計(jì)算能力以及大數(shù)據(jù)[3]。同一時(shí)期，成為一個(gè)AI落地平臺的愿景也在商湯內(nèi)部逐步成型，自此開始了商湯對算力的前瞻性布局。

第二年，商湯開始在超算中心已有的6000張GPU的基礎(chǔ)上，著手建設(shè)SenseCore AI大裝置[2]。這是商湯研發(fā)費(fèi)用飆升的開始，也是其“大裝置+大模型”商業(yè)模式構(gòu)建的起點(diǎn)。

SenseCore AI大裝置并不只是一個(gè)單純的算力輸出設(shè)施，而是包含提供底層計(jì)算基礎(chǔ)設(shè)施服務(wù)（IaaS）與深度學(xué)習(xí)平臺服務(wù)（PaaS）、模型部署及推理服務(wù)（MaaS）三大部分的能力，旨在為模型的整個(gè)生產(chǎn)周期提供全套標(biāo)準(zhǔn)化的工具鏈，以降低模型開發(fā)的資金和時(shí)間成本。

軟硬件“兩條腿走路”，是SenseCore AI大裝置區(qū)別于目前大模型生產(chǎn)工具的差異化分界點(diǎn)。

硬件工具主要由計(jì)算基礎(chǔ)設(shè)施層提供。其中AIDC的算力規(guī)模是最直接的衡量指標(biāo)之一。截至2024年底，商湯通過運(yùn)營模式將算力總規(guī)模提升至23,000PetaFlops, 同比增長92%支撐起了在中國大模型應(yīng)用top3的市場規(guī)模。

商湯AIDC的差異化在于，訓(xùn)練上，采用了自動(dòng)化多維并行策略，并且優(yōu)化了通信和算子，明顯提高了集群的訓(xùn)練效率，每秒處理的Token數(shù)量（TGS）可達(dá)1600+，在未經(jīng)特別優(yōu)化的狀態(tài)下，要好于DeepSeek官方報(bào)告。推理上，系統(tǒng)支持開源和自研雙引擎的低比特量化推理，在內(nèi)測商湯自己的多模態(tài)模型時(shí)，其推理能力比2024年7月日日新5.5發(fā)布的時(shí)候提升了50%。如果拿來跑DeepSeek R1，比如在推理吞吐性能關(guān)鍵指標(biāo)上，比業(yè)界平均成績要快25%，比頭部廠商效率也要高15%。

商湯AIDC的軟件部分涉及深度學(xué)習(xí)平臺層、模型層。深度學(xué)習(xí)平臺層可以理解為“模型生產(chǎn)流水線”，提供包括訓(xùn)練數(shù)據(jù)平臺、SenseParrots訓(xùn)練框架、模型壓縮工具及跨平臺模型部署工具；模型層類似于一個(gè)模型制造工廠，基于商湯自研的基模型和特定場景的衍生模型，向客戶直接提供模型產(chǎn)品。

軟硬件工具環(huán)環(huán)相扣、一應(yīng)俱全，使得客戶可以自由地選擇“套餐“，既可以租用流水線和工具構(gòu)建自家模型，也可以直接要求模型定制化服務(wù)。

就像一個(gè)超級賣場，消費(fèi)者可以購買工具，也可以直接購買產(chǎn)品，賣場不僅提供產(chǎn)品說明、使用指導(dǎo)，還附帶送貨到家、上門安裝等保姆級服務(wù)。

這是商湯“大裝置-大模型-應(yīng)用”三位一體戰(zhàn)略的顯現(xiàn)，構(gòu)建了從底層算力到終端應(yīng)用的極其完整的全產(chǎn)業(yè)生態(tài)鏈閉環(huán)，形成了商湯獨(dú)特的競爭壁壘。

營收的增長標(biāo)志著這一商業(yè)模式的走通，背后助推的是商湯始終保持高位的研發(fā)投入和大膽的前瞻性布局，而多年所積累的工程經(jīng)驗(yàn)，也加速了商湯的盈利兌現(xiàn)，成為另一條護(hù)城河。

實(shí)踐出真知

“人工智能需要很多人工”，是上一波AI浪潮的“疑難雜癥”。模型不是建好就能用，部署環(huán)節(jié)往往意味著大量的人力內(nèi)耗，堵死了當(dāng)年許多初創(chuàng)AI公司的盈利通道。

生成式AI以“預(yù)訓(xùn)練->微調(diào)”的模式結(jié)構(gòu)性地解放了一部分人力，卻并沒有降低工程經(jīng)驗(yàn)的重要性，反而在諸多垂直領(lǐng)域，工程經(jīng)驗(yàn)的厚度直接決定了模型落地的效果。

以自動(dòng)駕駛為例，小鵬前自動(dòng)駕駛副總裁吳新宙就認(rèn)為自動(dòng)駕駛本質(zhì)是一個(gè)工程問題[4]。特斯拉入華不久的FSD，端到端在算法層面做到了頂級，但落地層面投入不足，面對國內(nèi)交規(guī)和路況水土不服。

商湯的工程能力經(jīng)歷過上一輪AI浪潮的檢驗(yàn)，面對生成式AI的新業(yè)態(tài)，一方面能夠?qū)ψ兓募夹g(shù)快速反應(yīng)，一方面可以直接移植其行業(yè)沉淀，精確打擊痛點(diǎn)。

十幾年的行業(yè)實(shí)踐給商湯積累了深厚的行業(yè)知識和大量的真實(shí)數(shù)據(jù)，得以快速建立龐大的模型矩陣，以日日新SenseNova大模型為基礎(chǔ)，推出生成式AI應(yīng)用，以及針對B端企業(yè)級客戶的垂直行業(yè)推出深度定制行業(yè)大模型。

具體到應(yīng)用層面，商湯在企業(yè)級應(yīng)用構(gòu)建了“一基兩翼”的布局，“兩翼”分別為生產(chǎn)力工具、交互工具的應(yīng)用與產(chǎn)品，前者直接以企業(yè)助手、金融數(shù)據(jù)先兵、政務(wù)助手等形態(tài)為客戶提高工作效率；后者則是在智能陪伴、智能硬件交互、智能營銷上發(fā)揮作用，比如加速大模型在機(jī)器人、智能車艙等智能硬件的應(yīng)用布局，用大模型提高電商GMV等。

同時(shí)，過去的工程經(jīng)驗(yàn)指導(dǎo)了工具層面的設(shè)置，使得商湯有足夠多的工具來應(yīng)答客戶不同層級的需求。完備的工具箱與洞悉需求的產(chǎn)品設(shè)計(jì)形成良性循環(huán)，顯化為新客戶的增長和老客戶的留存。

例如在當(dāng)前競爭白熱化、最考驗(yàn)“模型+落地”綜合能力的智能駕駛領(lǐng)域，商湯絕影2024年新增定點(diǎn)車型41個(gè)，新增定點(diǎn)車輛數(shù)超過1100萬輛；在商湯傳統(tǒng)優(yōu)勢視覺AI方面，客戶復(fù)購率按年提升了31個(gè)百分點(diǎn)，合作超過3年的客戶中有約四成亦是生成式AI客戶。

這里隱含了商湯模型開發(fā)不同于主流的的思路：

相比于DeepSeek和OpenAI“拿著模型的錘子找應(yīng)用的釘子”，商湯的思路是直搗黃龍，直接從最終目標(biāo)應(yīng)用出發(fā)，以應(yīng)用驅(qū)動(dòng)模型。

Deepseek應(yīng)用層面很大程度依賴其開源的生態(tài)，但開源的背面缺乏穩(wěn)定的商業(yè)及技術(shù)支持與維護(hù)服務(wù)。反過來正是閉源模型的優(yōu)勢，能夠持續(xù)做針對性的性能調(diào)優(yōu)。比如商湯基于與手機(jī)廠商的深度合作，其端側(cè)大模型在高通旗艦平臺上推理速度小于1.5秒，比手機(jī)云端處理快10倍。

根據(jù)SuperCLUE《中文大模型基準(zhǔn)測評2024年度報(bào)告》，商湯“日日新”融合大模型以總分68.3與DeepSeek-V3一起并列國內(nèi)榜首。

根據(jù)SuperCLUE和OpenCompass榜單，商湯日日新5.5性能領(lǐng)先Gemini 2.0 Flash-Exp與GPT-4o，排名全國第一。而即將于4月10日發(fā)布的6.0版本據(jù)悉性能預(yù)期對標(biāo)Gemini 2.0 Pro。

OpenCompass榜單

尾聲

商湯董事會(huì)執(zhí)行主席兼CEO徐立說，通用模型的能力比單純的規(guī)模更重要。性能參數(shù)的堆砌之下，模型競爭更加實(shí)際的一面已經(jīng)顯露，其仍然遵循衡量技術(shù)的最高標(biāo)尺，即是否切實(shí)改善了人們的生產(chǎn)生活。

Deepseek的出現(xiàn)是一種信號，無論是新晉明星公司，還是歷經(jīng)浮沉的老玩家，都開始面臨商業(yè)化的靈魂拷問。其背面是對勝利者的重新定義：誰先跑出一條成功的商業(yè)化路徑，誰才是生成式AI的最終贏家。

在AI的賽道上，商湯一度是孤獨(dú)的長跑者，被質(zhì)疑過，卻從未迷茫過。持續(xù)的研發(fā)投入、落地能力的反復(fù)打磨，修煉出了獨(dú)一無二的商業(yè)模式，和應(yīng)對生成式AI最快的反應(yīng)能力，讓如今的厚積薄發(fā)來得順理成章。

生成式AI不僅僅是技術(shù)變革，其不同于以往的產(chǎn)業(yè)邏輯正在改寫科技行業(yè)成功學(xué)新范式，商湯已率先落筆，為中國AI提供了商業(yè)落地實(shí)踐的最新成功樣本。

參考資料

[1]商湯科技2024年財(cái)報(bào)

[2]AI時(shí)代領(lǐng)先者，大裝置+大模型推動(dòng)AGI落地，中銀證券

[3]湯曉鷗談AI的明天：深度學(xué)習(xí)的三大核心要素，以及在中國創(chuàng)業(yè)要像百米賽跑，黑智

[4]小鵬吳新宙：對手如何出牌，不會(huì)打亂我們的節(jié)奏，晚點(diǎn)Auto

作者：何律衡

編輯：李墨天

責(zé)任編輯：何律衡

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.