出品 | 虎嗅科技組
作者 | 房曉楠
編輯 | 苗正卿
頭圖 | 視覺中國
2025年開年以來,以DeepSeek、宇樹科技為代表的科技新貴正在重塑AI圈的競爭格局,風(fēng)起云涌,激戰(zhàn)正酣,而對于那些曾經(jīng)在上一個時代破浪的AI選手來說,如何擠身新浪潮,顯得尤為迫切。
4月10日下午,上海西岸,一艘又一艘的船駛過黃埔江,風(fēng)起時,沿著滾滾江水急速順流而下。與此同時,位于岸邊的西岸大劇院內(nèi),上一代老牌AI選手代表——商湯科技,正在舉辦“商湯2025技術(shù)交流日”活動。活動現(xiàn)場,商湯發(fā)布了新版本“商湯日日新 SenseNovaV6”多模態(tài)融合大模型,這是一款具備最長64K思維鏈、數(shù)理分析、多模態(tài)深度推理、全局記憶等能力的多模態(tài)大模型,而多模態(tài)正是2024年以來商湯主要的發(fā)力方向之一。同時,商湯還推出了“商湯大裝置 SenseCore 2.0”,這是自2021年大裝置發(fā)布以來首次全新升級。(虎嗅注:商湯大裝置,即提供包括底層計算基礎(chǔ)設(shè)施服務(wù)IaaS、深度學(xué)習(xí)平臺服務(wù)PaaS,以及模型部署及推理服務(wù)MaaS在內(nèi)的三大服務(wù)。簡單來說就是它通過整合算力、算法、數(shù)據(jù),提供一個基礎(chǔ)設(shè)施解決方案,以降低模型開發(fā)和應(yīng)用的門檻。)
從時間節(jié)點來看,這次是商湯科技減重瘦身、轉(zhuǎn)型重組后的首次技術(shù)交流。
回顧過去近一年的時間,商湯科技很忙。
作為一家AI原生公司,商湯科技在上一波AI浪潮中,憑借計算機視覺識別構(gòu)建起來的護城墻,在這新一輪的AI競爭格局中,顯得有些吃力。新的敘事方式下,如何拿到新時代的船票,商湯科技也一直在思考、摸索,做了不少嘗試。
先是2023年,商湯科技開始把業(yè)務(wù)重心轉(zhuǎn)向生成式AI,并將業(yè)務(wù)重組調(diào)整為生成式AI、傳統(tǒng)AI和智能汽車三個板塊。
去年10月,商湯科技正式發(fā)布“大裝置-大模型-應(yīng)用”三位一體戰(zhàn)略,并同步構(gòu)建更為集中和高效的組織結(jié)構(gòu)。
緊接著一個月后,商湯科技董事長兼CEO徐立又在內(nèi)部信中,再次減重瘦身,重申生成式AI的重要性,建立“1+X”架構(gòu),業(yè)務(wù)重組為生成式AI、智能汽車及視覺AI。
而商湯科技的生成式AI相關(guān)業(yè)務(wù),包括提供算力的“大裝置”、AI基礎(chǔ)模型和應(yīng)用。其中,商湯的大裝置是在2021年底投入使用,這也是它區(qū)別于其他AI公司的一大重要特點,其實在過去很長一段時間里,AI公司是否需要自建基礎(chǔ)設(shè)施都是一個非共識,而商湯也因此走出了一條獨特的商業(yè)道路。
據(jù)商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆透露,依靠商湯大裝置,商湯的多模態(tài)推理應(yīng)用的成本大幅降低。毋庸置疑的是,新一波AI浪潮中,大模型的技術(shù)迭代、場景化的落地應(yīng)用,都離不開一個好的AI Infra的支撐。(虎嗅注:AI Infra即將AI三要素“算力、算法、數(shù)據(jù)”都進(jìn)行基礎(chǔ)設(shè)施化,為模型整個生產(chǎn)周期提供全套標(biāo)準(zhǔn)化的工具鏈,以降低模型開發(fā)應(yīng)用成本,提高效率。)
虎嗅與楊帆進(jìn)行了交流,他分享了關(guān)于商湯大裝置技術(shù)發(fā)展與迭代的路徑以及對于行業(yè)的思考。以下為交流實錄,部分內(nèi)容略有刪減:
虎嗅:當(dāng)前在算力基礎(chǔ)設(shè)施這一塊,一些大廠巨頭也在進(jìn)行千億級別的投入,那在這樣的競爭格局中,商湯科技想怎么做?
楊帆:商湯的優(yōu)勢就在于我們懂模型、懂客戶。這幾年一個很強烈的感受是,包括我們從2023年下半年到2024年年初開始提出輕重資產(chǎn)的比例,要加大輕資產(chǎn)運營,之所以這樣做原因很明顯,就是當(dāng)前芯片硬件大概3年一迭代,而下游用戶的模型大概是三個月一迭代,一線用戶肯定期待用更新的硬件資源去迭代最新的技術(shù)。
從這個角度上可以看出,資產(chǎn)的輕量化其實對客戶來說是沒有包袱的,所以我們試著在把輕資產(chǎn)的比例加大。
而供給端的變化是,下游需求端模型的技術(shù)、應(yīng)用迭代速度非常快,而上游的供應(yīng)鏈,不管是英偉達(dá)還是國產(chǎn)芯片,從產(chǎn)能到成本再到市場供應(yīng)水平也都在一個高速變化中。
當(dāng)市場,特別是上下游同時都在多變的時候,保持系統(tǒng)的靈活性,以及針對不同類型的客戶做出更清晰化的肖像描述,并且給客戶提供一個更符合他訴求的方案。
我認(rèn)為這件事情的重要性是要高過于整個的資產(chǎn)規(guī)模的。
虎嗅:商湯科技的大裝置是從2021年就開始做的,中間也有一些升級,但為何是在今年這一時間點進(jìn)行這樣一個大的量級的升級?
楊帆:這確實是因為我們在系統(tǒng)架構(gòu)上做了一個比較大的升級。
我們是2021年開始做(大裝置),但是市場真正起規(guī)模是生成AI起來之后。當(dāng)時的狀態(tài)其實是整個市場都沒有特別好的、成熟的產(chǎn)品和方案,包括商湯自己也是,雖然很早就做了一些千卡的實驗,但是在服務(wù)過程中還是會有很多的問題,因為芯片也在迭代,真正在實用場景上跑起來,會有很多意想不到的問題。所以,在那個點上我們?nèi)プ龅臅r候,更多就是跟著用戶的需求去迭代產(chǎn)品功能。
而如今的局面有很大的不同了,這兩年整個市場趨勢發(fā)生了很大的改變。
虎嗅:具體是哪些改變?體現(xiàn)在哪些方面?
楊帆:我覺得主要有兩點,第一個就是開源會越來越成為主流,或者說有越來越大的影響力。這種開源不僅僅是模型的開源,還會帶動各種各樣的中間件和工具的開源組件的出現(xiàn)。
所以當(dāng)我們看到這成為一種趨勢的時候,或者說我們在一年前早于市場的時候就看到這種趨勢的時候,我們做的一個重要決策就是要讓整個體系的框架具備一個更好的融合系統(tǒng),對于整個開源體系的兼容,這是很重要的。
第二個是,AI中越來越多的訓(xùn)練,前置的生產(chǎn)環(huán)節(jié)進(jìn)入到應(yīng)用環(huán)節(jié),對于Infra推出了很多新的挑戰(zhàn),像是一些彈性、快速部署、性能優(yōu)化等。其實這樣的事情我們之前也都做了,但是永遠(yuǎn)是這樣的,技術(shù)迭代只有當(dāng)你有足夠多的用戶(才會發(fā)生),就是當(dāng)他的業(yè)務(wù)規(guī)模、用戶數(shù)量都起來的時候,你會發(fā)現(xiàn)他會給你提出更多的需求,這些需求會引導(dǎo)你的核心技術(shù)進(jìn)行迭代。
其實我們的SenseCore 2.0大概是從大半年前開始做的,我們在那個時間點上看到了這兩個趨勢,認(rèn)為接下來三年整個市場會與過去三年有很大不一樣,那我們的整個產(chǎn)品體系就要應(yīng)對這一趨勢做出比較大的改變。
虎嗅:其實在很長一段時間內(nèi),對于AI公司是否要自建算力基礎(chǔ)設(shè)施,都是一種非共識,而商湯科技是其中比較典型的一個案例,那你覺得現(xiàn)在這還是一種非共識嗎?或者說達(dá)到一種怎樣的共識?
楊帆:共識就是不應(yīng)該自建(笑),只有足夠大的廠商才會去自建。或者更重要的問題在于怎么定義AI 公司,比如商湯成立10年,過去大家有很多做得好的地方,也有很多做得不好的地方。
虎嗅:那你認(rèn)為該如何定義AI公司,或者說下一代更健康的AI公司應(yīng)該長成什么樣?
楊帆:我覺得反而應(yīng)該是像我們的一些客戶一樣,更貼某一個行業(yè)、某一個場景,因為只有這樣他的商業(yè)模式才更容易確定下來,從而更大程度上解決盈利問題,這是大部分公司都存在的挑戰(zhàn)。
AI是個通用技術(shù),所以AI公司的定義如果從商業(yè)化的角度長期來看,更健康的應(yīng)該是有更多、更小、更專注在某一個細(xì)分場景,去提供一個以AI為關(guān)鍵能力的產(chǎn)品和服務(wù)的公司,且這樣的公司大量存在,這才是整個行業(yè)五年或者十年之后該有的樣子。
而對于這些人而言,毫無疑問,他們沒有必要或者說沒有極強的訴求去自建基礎(chǔ)設(shè)施,因為他更重要的事情是給他的客戶提供一個更好的產(chǎn)品和服務(wù)。
這個過程中AI可能是關(guān)鍵能力,但不一定是他的出發(fā)點,而對于AI本身的技術(shù)迭代來說,比如如今模型的迭代、數(shù)據(jù)的積累,他們對資源的需求是在持續(xù)增長的,那越是這種情況,他就越應(yīng)該采用第三方的服務(wù)形式去降低成本,因為這不是他的核心。
他的核心在于如何把AI的這一點點創(chuàng)新或者優(yōu)勢能力嵌入到他的產(chǎn)品和解決方案中,整個未來會是市場的主流。
當(dāng)然,對于一些頭部大廠,包括一些創(chuàng)新龍頭公司來說,他們確實會更加傾向于自建,因為規(guī)模足夠大,在這件事情上可以帶來足夠多的(收益)。
而從我國未來的經(jīng)濟發(fā)展上看,整體上需要往高質(zhì)量發(fā)展轉(zhuǎn)型,核心的抓手在于科技創(chuàng)新,那如果中間最重要、最有效的一個元素是AI的話,那五年、十年之后市場上100家公司里面應(yīng)該99家真正的AI公司,那我們的目標(biāo)就是去服務(wù)這些公司。
虎嗅:去年商湯提出“大裝置-大模型-應(yīng)用”三位一體戰(zhàn)略,那可以結(jié)合這次的產(chǎn)品更新升級做一個解釋,它們彼此之間如何聯(lián)動?
楊帆:首先它們相互促進(jìn)。
比如站在大裝置的角度來看,如果我想要提供一個好的AI Infra,那我就要知道用戶是有什么需求,那在商湯自己的模型研究迭代中,就像前面提到的,會給你提出各種需求,而在這種需求中,如果把很多東西標(biāo)準(zhǔn)化之后,就會成為市場化的東西。
應(yīng)用也是一樣,模型可能更多的是涉及模型的訓(xùn)練、研發(fā)、生產(chǎn),那模型的使用階段其實就與應(yīng)用密切相關(guān)。
比如當(dāng)我們?nèi)ヌ剿饕粋€新的細(xì)分場景——文生圖,我們會先用商湯自己的文生圖產(chǎn)品,根據(jù)他們的數(shù)據(jù)、調(diào)用量的變化情況等,去看如何給客戶提供一個更好的服務(wù)。
反過來,更好的AI Infra也肯定會支撐(我們自身)的模型技術(shù)研發(fā)、衡量應(yīng)用的場景化等。
虎嗅:從商湯整體的AGI目標(biāo)來看,大裝置的戰(zhàn)略意義是什么?
楊帆:首先,我們對于模型、應(yīng)用的認(rèn)知和Know-How,其實是能夠幫助大裝置形成更好的差異化優(yōu)勢,這種差異化優(yōu)勢在市場上的表現(xiàn)就是能掙更多的錢,因為大家都知道搞模型研發(fā)投入是非常巨大,那大裝置的利潤越好,就越能支持商湯整體持續(xù)的技術(shù)研發(fā)和迭代,這是一定的。
反過來,單純從技術(shù)上來看,模型的迭代也需要一個好的Infra配合、支撐。我們在模型訓(xùn)練過程中,有時會需要一些針對性,甚至是定制化的Infra改進(jìn),那只有當(dāng)你有一個更大的平臺的時候,對這樣的改進(jìn)響應(yīng)也會更好。
而如今大模型的應(yīng)用,我覺得很多場景都沒有過性價比的生死線,所以會看到很多應(yīng)用,有一類是砸錢拉流量,因為可能是面向C端的,砸得起錢,不追求性價比、算力。
但如果回到B端服務(wù)市場,你會發(fā)現(xiàn)今天的很多應(yīng)用都還處于早期迭代階段,技術(shù)可能達(dá)到60分或80分,但性價比都還沒有做到一個比較好的狀態(tài)。
那我們做大裝置其實很重要的一個價值就是,我們能給客戶提供好的性價比,那當(dāng)然也能給商湯自己的模型應(yīng)用提供好的性價比的支撐,這件事情對于未來它在B端市場的競爭力會有一個很大的保障。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4230102.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.