3月26日,商湯發(fā)布2024年全年業(yè)績財(cái)報(bào)。2024年,商湯集團(tuán)的總體收入同比增長10.8%,達(dá)到37.7億元人民幣;其中,生成式AI收入突破24.0億元人民幣,同比增長103.1%,這是生成式AI連續(xù)兩年保持三位數(shù)增速,已成為集團(tuán)最大業(yè)務(wù)。
大模型面世兩年多時間以來,從前期的一味追求大模型Scaling Law,到如今算力效率、訓(xùn)練轉(zhuǎn)推理,應(yīng)用落地等被接連質(zhì)疑,大模型已經(jīng)全面來到新的發(fā)展階段。
這是產(chǎn)業(yè)逐步成熟的標(biāo)志,但同樣也在堆疊算力之外,對工程技術(shù)以及場景協(xié)同能力提出了更高的要求。
在眾多傳統(tǒng)大模型廠商之外,作為第一代“AI原生”企業(yè),商湯在AI基礎(chǔ)設(shè)施上的投入早于幾年前便開始布局,此后戰(zhàn)略升級為“大裝置-大模型-應(yīng)用”的三位一體核心戰(zhàn)略,而這一戰(zhàn)略正顯現(xiàn)出其在AI產(chǎn)業(yè)的前瞻性。
“大裝置”是指商湯的AI基礎(chǔ)設(shè)施,為大模型提供強(qiáng)大的算力支撐,大模型驅(qū)動技術(shù)創(chuàng)新,應(yīng)用端推動AI商業(yè)化落地——過去三年,商湯已經(jīng)形成了“大裝置-大模型-應(yīng)用”三者協(xié)同的良性生態(tài)閉環(huán),賦能千行百業(yè)。
我們看到的是,歷經(jīng)過多次技術(shù)周期起伏,商湯的技術(shù)積淀正迎來爆發(fā)。
2024年5月,國內(nèi)權(quán)威大模型測評機(jī)構(gòu)SuperCLUE榜單出爐。商湯“日日新5.0”(SenseChat V5)的中文基準(zhǔn)測評結(jié)果排名第一,以總分80.03分的成績刷新國內(nèi)最好成績,并且在中文綜合成績上超越GPT-4 Turbo,這是國內(nèi)大模型首次在SuperCLUE中文基準(zhǔn)測試中超越GPT-4 Turbo實(shí)現(xiàn)登頂。
之所以能夠斬獲如此成績,與商湯在AI基礎(chǔ)設(shè)施上的提早布局至關(guān)重要。
眾所周知,2024年以來,全國智算中心的建設(shè)高速推進(jìn)。從訓(xùn)練到推理,算力的資源屬性愈發(fā)顯現(xiàn),而且市場仍面臨算力資源分散且標(biāo)準(zhǔn)不統(tǒng)一、使用起來效率不高的問題。
商湯正是針對這一痛點(diǎn),布局算力運(yùn)營,將不同標(biāo)準(zhǔn)的卡連接起來,適配不同需求,滿足不同類型的客戶。
商湯科技董事長兼CEO徐立認(rèn)為,一些科技巨頭的重心在于自己的生態(tài),包括自研芯片和云平臺等,但當(dāng)下AI領(lǐng)域要搶占先機(jī),什么資源更快更好用就先用起來,不局限于一家的產(chǎn)品和平臺,“商湯提供的基礎(chǔ)服務(wù)更貼近AI發(fā)展現(xiàn)狀。”
過去三年,商湯持續(xù)投入建設(shè)AIDC基礎(chǔ)設(shè)施。據(jù)悉,商湯自持的全國首個5A級智算中心——上海臨港AIDC,通過運(yùn)營模式將算力規(guī)模提升至了23,000PetaFlops。
通過與大模型迭代的聯(lián)合調(diào)優(yōu),商湯大裝置的目標(biāo)是成為“最懂大模型的AI基礎(chǔ)設(shè)施”,不僅服務(wù)于日日新大模型的訓(xùn)練與推理,還服務(wù)于包括互聯(lián)網(wǎng)、金融、能源等成熟行業(yè),還拓展性服務(wù)了具身智能、AIGC、AI4S(AI For Science)等高潛行業(yè)的客戶。
徐立曾表示,商湯是最懂模型的算力服務(wù)商,最懂算力的模型服務(wù)商。
算力只是生態(tài)其中一環(huán)。大模型產(chǎn)業(yè)能夠高效運(yùn)轉(zhuǎn),還需要靠上下游協(xié)同發(fā)力。
“今天人工智能的商業(yè)模式不管是訓(xùn)練模型,還是用模型對外服務(wù),本質(zhì)意義上都是在消耗資源,付的是資源的費(fèi)用。所有的商業(yè)模式最后都和計(jì)算資源消耗劃了一個等號,就是通過‘三位一體’,把資源以最有效的方式整合使用起來。”徐立表示。
“三位一體”是2024年10月商湯確立的戰(zhàn)略方向,是商湯以大裝置作為AI基礎(chǔ)設(shè)施為底座,實(shí)現(xiàn)“大裝置-大模型-應(yīng)用”三位一體、聯(lián)合優(yōu)化的戰(zhàn)略。
算力與模型的雙向優(yōu)化,進(jìn)一步提升了大模型的訓(xùn)練和推理效率。在提升訓(xùn)練效率方面,商湯通過采用自動化多維并行策略顯著提升了訓(xùn)練效率,并且實(shí)現(xiàn)了FP8混合精度訓(xùn)練,特別是對類似于DeepSeek的優(yōu)秀第三方開源模型,大裝置做到高于官方報(bào)告的訓(xùn)練效率,形成行業(yè)標(biāo)桿。
在提升推理效率方面,商湯的推理系統(tǒng)進(jìn)行低比特量化推理,支持開源vLLM及自研l(wèi)ightLLM雙推理引擎,以DeepSeek R1為例,商湯的推理吞吐性能比業(yè)界頭部廠商高15%以上。通過模型蒸餾技術(shù)、鍵值緩存、PD(Prefill-decode)分離、多模態(tài)信息壓縮等技術(shù),商湯在基本保持模型性能的前提下將推理成本壓低了一個數(shù)量級。
因此,即使是同樣一個模型,在不同的算力底座上,會有完全不同的訓(xùn)練及推理效率。
隨著向生成式AI演進(jìn)的穩(wěn)步推進(jìn),“三位一體”進(jìn)一步整合了商湯的資源優(yōu)勢,使其在大模型時代的內(nèi)卷競爭中打出差異化。
商湯科技日日新大模型重點(diǎn)打磨生產(chǎn)力工具與交互工具兩個方向的應(yīng)用與產(chǎn)品。生產(chǎn)力工具直接為企業(yè)辦公、金融、政務(wù)等場景提高生產(chǎn)效率,以訂單金額為代表的客戶付費(fèi)意愿較2023年增長6倍;交互工具通過2B2C的方式賦能業(yè)務(wù)伙伴,提升用戶體驗(yàn),滿足智能陪伴、智能硬件交互、智能營銷等多場景需求,月均用戶使用量較2023年增長8倍。
日日新大模型在保持領(lǐng)先的市場應(yīng)用占有率和客戶服務(wù)粘性的基礎(chǔ)上,在模型技術(shù)上始終保持領(lǐng)先的位置。2023年4月商湯首次推出商湯日日新SenseNova大模型體系,至2024年7月完成5大版本迭代。其中,2024年7月發(fā)布的日日新5.5版本在多模態(tài)能力上顯著提升,為國內(nèi)首個對標(biāo)GPT-4o的多模態(tài)實(shí)時交互大模型,實(shí)現(xiàn)語音、視頻和語言模型的原生融合。值得期待的是,商湯日日新6.0將于2025年4月10日發(fā)布,性能預(yù)期對標(biāo)Gemini 2.0 Pro。
此外,基礎(chǔ)設(shè)施搭建好后,商湯同樣及早布局應(yīng)用。
生成式AI爆發(fā)后,多模態(tài)大模型早已成為人們追求的方向。然而,市面上很多應(yīng)用中接觸到的多模態(tài)模型并不能說是“完全體”。
就像谷歌所認(rèn)為的,只有從頭開始的多模態(tài)才能構(gòu)建出超越前代的先進(jìn)模型。這意味著它天生地可以讀取和輸出不同模態(tài)內(nèi)容,還具備強(qiáng)大的多模態(tài)推理能力和跨模態(tài)遷移能力。
技術(shù)上,這被稱為“原生融合多模態(tài)技術(shù)”,被認(rèn)為是AI未來發(fā)展的必由之路,也是商湯當(dāng)下重點(diǎn)投入的研究領(lǐng)域。
與傳統(tǒng)的多模態(tài)模型不同,商湯的技術(shù)并非簡單地將不同模態(tài)內(nèi)容轉(zhuǎn)換為語言token輸入,而是從數(shù)據(jù)層、模型架構(gòu)層進(jìn)行全流程融合,涵蓋感知、思考到輸出的完整過程。
在2024年全球CVPR大會上,商湯科技共有50篇論文入選,研究成果聚焦于視覺語言基礎(chǔ)模型,涉及自動駕駛、機(jī)器人等前沿領(lǐng)域。
商湯的多元化AI產(chǎn)品均已有所應(yīng)用成效。據(jù)悉,目前商湯“小浣熊家族”已為數(shù)十萬用戶提供數(shù)十億次智能輔助服務(wù)。而商湯絕影在行業(yè)內(nèi)也率先實(shí)現(xiàn)了原生多模態(tài)大模型的車端部署。
在AI的新階段,商湯前瞻性地布局了硬件基礎(chǔ)設(shè)施和應(yīng)用端,通過底層和上層的協(xié)同優(yōu)化構(gòu)建起了技術(shù)壁壘。
在基礎(chǔ)設(shè)施端,商湯自建AI數(shù)據(jù)中心(AIDC)和規(guī)模化研發(fā)服務(wù),確保公司在傳統(tǒng)基礎(chǔ)設(shè)施廠商和AI原生公司中脫穎而出。在應(yīng)用端,商湯擁有全棧體系A(chǔ)I應(yīng)用,覆蓋行業(yè)廣泛,大模型聚焦于原生融合多模態(tài)發(fā)展。
可以預(yù)見,商湯的“儲備”有望在AI應(yīng)用爆發(fā)后為公司帶來巨大發(fā)展空間。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.