智東西
作者 GenAICon 2025
4月1日-2日,一場全場干貨爆棚的生成式AI盛會,在北京圓滿舉行。
開年以來,DeepSeek的異軍突起,改寫了中西大模型競爭敘事。生成式AI似乎猛然沖進一個全新征程中,中國企業(yè)更是斗志昂揚地踴躍創(chuàng)新,不僅領(lǐng)銜AI開源盛世,還掀起了新一輪模型部署與AI應(yīng)用研發(fā)熱潮,在這千載難逢的歷史機遇期全速沖鋒。
為此,我們發(fā)起了一場聚焦前沿技術(shù)與產(chǎn)業(yè)趨勢的春日AI聚會——2025中國生成式AI大會(北京站)。
大會以“大拐點 新征程”為主題,兩天之內(nèi),超過50位產(chǎn)學(xué)研嘉賓密集輸出高濃度、高質(zhì)量的干貨信息,深度解構(gòu)DeepSeek引發(fā)的變革狂潮,全面展示覆蓋深度推理模型、多模態(tài)模型與世界模型、AI Infra(AI基礎(chǔ)設(shè)施)、AIGC應(yīng)用、Agents(智能體)、具身智能等領(lǐng)域的生成式AI最新進展。
▲中國生成式AI大會主會場開幕式、GenAI應(yīng)用論壇、大模型峰會、分會場技術(shù)研討會、展區(qū)人流密集
本屆大會主會場舉辦開幕式、GenAI應(yīng)用論壇、大模型峰會,分會場舉辦3場以DeepSeek R1與推理、AI智能體、具身智能大模型為主題的技術(shù)研討會,期間既有同頻共振,又有激烈觀點交鋒,現(xiàn)場參會觀眾超過1500人。
展區(qū)亦是人頭攢動,從早到晚充斥著熱切的交流聲,Alluxio、Zenlayer、DriveNets、澳鵬數(shù)據(jù)、晴數(shù)智慧、中昊芯英、GMI Cloud、焱融科技、英博數(shù)科、華為云、研惠通、新晧誠科技、楓清科技、科華數(shù)據(jù)、首都在線、清智圖靈等16家企業(yè)帶來最新技術(shù)產(chǎn)品展示。
這已經(jīng)是智一科技旗下智猩猩、智東西共同發(fā)起中國生成式AI大會的第四屆,也是AI青年學(xué)者密度最高的一屆。自2023年以來,大會累計吸引了數(shù)千人線下參會,線上觀看人次更是超過1000萬,成為國內(nèi)AI領(lǐng)域最具影響力的產(chǎn)業(yè)峰會之一。
▲聯(lián)想集團Game of AI科普視頻在大會展播:聯(lián)想工廠制造控制塔MCT2.0,生成式AI在制造業(yè)首次落地
智一科技聯(lián)合創(chuàng)始人、CEO龔倫常在致辭環(huán)節(jié)宣布:今年,中國生成式AI大會正式升級為“智領(lǐng)未來”北京人工智能系列品牌活動之一。
“智領(lǐng)未來”是北京市科委、中關(guān)村管委會打造的北京市人工智能領(lǐng)域的活動品牌。此外,同樣作為“智領(lǐng)未來”北京人工智能系列品牌活動之一的中國AI算力峰會將于今年6月在北京舉辦。
龔倫常還預(yù)告了將于今年舉辦的多個主題會議:4月底,中國汽車智能化創(chuàng)新峰會將在上海車展期間同步舉辦;9月,全球AI芯片峰會將在上海舉辦;11月,中國具身智能機器人大會將在深圳舉辦。歡迎感興趣的朋友們關(guān)注。
▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常致辭
一、開幕式:突破大模型預(yù)訓(xùn)練瓶頸,為AI應(yīng)用爆發(fā)掃清障礙
進入2025年,AI領(lǐng)域涌現(xiàn)哪些新關(guān)鍵詞?慢思考推理技術(shù)如何緩解大模型預(yù)訓(xùn)練瓶頸?怎樣讓機器人操作交互像跳舞一樣絲滑?Agents(智能體)落地企業(yè)需攻克哪些挑戰(zhàn)?國產(chǎn)算力怎么解鎖萬卡集群難關(guān)?
在大會首日開幕式上,產(chǎn)學(xué)研嘉賓圍繞深度推理模型、具身智能機器人、AI智能體、AI算力基礎(chǔ)設(shè)施、AI應(yīng)用,分享了對最新技術(shù)思路與推動落地的觀察與思考。
1、人大趙鑫:慢思考推理技術(shù)如何緩解大模型預(yù)訓(xùn)練瓶頸?
中國人民大學(xué)高瓴人工智能學(xué)院教授趙鑫談道,大模型本質(zhì)上是一個條件概率生成模型,思維鏈會提升預(yù)測正確的可能性。
當(dāng)前訓(xùn)練模型性能增長會出現(xiàn)邊際效益遞減,其中數(shù)據(jù)和算力是探索擴展法則的主要限制,這也是為何當(dāng)下需要慢思考推理技術(shù)。
慢思考推理技術(shù)的基本思路是“搜索+學(xué)習(xí)”的結(jié)合,具體來看,包括基于多次采樣的方法、基于樹搜索的方法、基于SFT(監(jiān)督微調(diào))的方法、基于RL(強化學(xué)習(xí))的方法。
趙鑫教授團隊在慢思考技術(shù)方面進行了大量研究。在RL技術(shù)領(lǐng)域,找到可驗證的訓(xùn)練數(shù)據(jù)非常重要,團隊系統(tǒng)探索了類R1模型的復(fù)現(xiàn)方法。
推理模型本質(zhì)上可以認為是一個具備逐步推理/動作規(guī)劃的“大腦”,未來推理模型可能會深刻影響現(xiàn)有智能體的設(shè)計模式。
▲中國人民大學(xué)高瓴人工智能學(xué)院教授趙鑫
2、清華許華哲:如何讓機器人的操作交互像跳舞一樣“絲滑”?
清華大學(xué)交叉學(xué)院助理教授、博導(dǎo)、星海圖聯(lián)合創(chuàng)始人許華哲談道,當(dāng)前機器人做跳舞、跑步、扭秧歌這類事已經(jīng)很嫻熟了,有大量數(shù)據(jù)支撐,但在操作交互方面數(shù)據(jù)十分匱乏,還有很長的路要走。
解決數(shù)據(jù)難題,讓機器人有觸覺是非常關(guān)鍵的,這樣數(shù)據(jù)才能更豐富,團隊設(shè)計了仿真手套,可以讓機器人同步人手的操作。
有了數(shù)據(jù)還不夠,數(shù)據(jù)量也非常關(guān)鍵,為此,團隊通過DemoGen的方式豐富數(shù)據(jù)量,借此機器人的泛化能力可以得到進一步提升。相比傳統(tǒng)方式,通過DemoGen的方式獲得數(shù)據(jù)的速度快了上萬倍。
未來讓機器人能夠泛化地去做更多的柔性操作,是團隊努力的方向。
▲清華大學(xué)交叉學(xué)院助理教授、博導(dǎo)、星海圖聯(lián)合創(chuàng)始人許華哲
3、PINE AI李博杰:AI原生團隊是組織形態(tài)的一場重大變革
PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰認為,AI Agent在爆火的同時,也面臨著企業(yè)知識孤島、GUI使用困難、缺少獨立測試環(huán)境、無法長時間運行等問題。
要打造AI原生團隊,讓AI真正成為“數(shù)字員工”,需要為Agent打造類似開源社區(qū)的溝通文化,實現(xiàn)開放透明的信息共享,并配備AI友好的團隊協(xié)作工具接口、完善的測試環(huán)境與測試用例,同時讓每個員工都擁有AI助理。
從技術(shù)層面來看,未來Agent還需要在明晰需求、主動溝通、主動協(xié)作、長期記憶、自我反思回溯與高精度內(nèi)部知識庫搜索等方面實現(xiàn)突破,才能真正實現(xiàn)從工具到團隊成員的轉(zhuǎn)變。
▲PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰
4、壁仞科技丁云帆:64卡4TB顯存訓(xùn)練滿血DeepSeek-V3,異構(gòu)混訓(xùn)逐步邁向萬卡集群
DeepSeek引爆了大模型落地元年。壁仞科技AI軟件首席架構(gòu)師丁云帆認為,大模型落地需要工程和算法的協(xié)同創(chuàng)新,數(shù)據(jù)是燃料,算法是引擎,算力是加速器。
壁仞科技目前有萬卡集群整體解決方案和智算生態(tài),希望通過軟硬協(xié)同&算法與工程協(xié)同,系統(tǒng)性地破解大模型算力難題:硬件集群算力方面,壁仞科技自主原創(chuàng)了GPU芯片架構(gòu),引領(lǐng)Chiplet技術(shù)趨勢;軟件有效算力方面,有大模型訓(xùn)推一體平臺,業(yè)界首次實現(xiàn)大模型訓(xùn)練自動彈性擴縮容。業(yè)界首創(chuàng)三級異步checkpoint,千卡集群千億參數(shù)可以實現(xiàn)自動斷點續(xù)訓(xùn)小于5分鐘,大幅提升集群穩(wěn)定性。
大規(guī)模分布式優(yōu)化方面,壁仞科技針對國產(chǎn)GPU高效適配DeepSeek進行了一系列技術(shù)優(yōu)化創(chuàng)新,64卡4096GB顯存即可支持DeepSeek-V3滿血版高效全參訓(xùn)練,而其他已公布方案至少需要256卡。
此外異構(gòu)聚合算力方面,壁仞科技自主原創(chuàng)了異構(gòu)GPU協(xié)同訓(xùn)練方案HGCT,支持4種及以上異構(gòu)GPU協(xié)同訓(xùn)練同一個大模型,解決了異構(gòu)混訓(xùn)的關(guān)鍵技術(shù)挑戰(zhàn),已實現(xiàn)數(shù)千卡規(guī)模混訓(xùn),下一步將突破萬卡混訓(xùn)。
▲壁仞科技AI軟件首席架構(gòu)師丁云帆
5、英諾天使基金王晟:AI應(yīng)用爆發(fā),需要新終端設(shè)備的出現(xiàn)
英諾天使基金合伙人王晟談道,2023年是大語言模型的爆發(fā)期,2024年則轉(zhuǎn)向多模態(tài)技術(shù),但2024年被寄予厚望的“AI應(yīng)用元年”并未如期而至,主要原因是缺乏新終端設(shè)備和新場景定義,當(dāng)前既有設(shè)備的場景需求已接近飽和。
▲英諾天使基金合伙人王晟
未來,AI應(yīng)用的爆發(fā)可能需要于新終端設(shè)備、新計算能力的出現(xiàn)。能夠提供情緒價值的AI玩具和陪伴類產(chǎn)品也擁有巨大的潛力,因為人類為情緒價值買單的意愿非常強烈。
此外,AI公司的發(fā)展方向正從工具提供轉(zhuǎn)向智能代理,未來會成為“造人”的公司,讓AI能夠承擔(dān)更復(fù)雜的任務(wù),甚至取代人類從事多種職業(yè)。2025年,AI領(lǐng)域的關(guān)鍵詞包括應(yīng)用、AI硬件、具身智能和世界模型,這些方向?qū)⒍x未來的技術(shù)和市場格局。
二、高端對話:中國AGI新征程全速起航,全產(chǎn)業(yè)鏈迎巨大發(fā)展機會
以《DeepSeek開啟大模型下半場 中國AGI新征程全速起航》為主題的高端對話,由智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁主持,彩云科技創(chuàng)始人兼CEO袁行遠,GMI Cloud創(chuàng)始人兼CEO Alex Yeh,PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰,智澄AI創(chuàng)始人及CEO胡魯輝,四位嘉賓分別作為AI應(yīng)用、算力云、Agent、具身智能企業(yè)代表進行分享。
智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁談道,今年春節(jié)以來,從DeepSeek、人形機器人到通用Agent產(chǎn)品Manus,中國團隊不斷造出現(xiàn)象級AI產(chǎn)品,2025年AI發(fā)展似乎進入了“中國時刻”,隨著中國AGI新征程全速起航,中國市場、中國公司在全球AI格局扮演的角色和發(fā)展特征都備受關(guān)注。
▲智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁
1、DeepSeek顯著提升成本效益
PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰認為,DeepSeek-R1揭示了大模型訓(xùn)練的真實成本,讓世界了解到只要方法得當(dāng),便能訓(xùn)練出優(yōu)秀的模型。
GMI Cloud創(chuàng)始人兼CEO Alex Yeh談道,DeepSeek的開源模型顯著降低了企業(yè)的部署成本,使企業(yè)能夠以低成本快速構(gòu)建應(yīng)用。
彩云科技創(chuàng)始人兼CEO袁行遠更是用事實說話,提到彩云科技旗下產(chǎn)品在切換到DeepSeek后,成本降低了90%,毛利率轉(zhuǎn)正。
▲彩云科技創(chuàng)始人兼CEO袁行遠
2、中國開源活躍度高,年輕人展現(xiàn)出后發(fā)優(yōu)勢
談及中美AI發(fā)展的差異,Alex Yeh觀察到,中國在開源社區(qū)的活躍度和快速落地能力顯著優(yōu)于美國,這也意味著中國在AI應(yīng)用爆發(fā)上會有巨大的機會。
▲GMI Cloud創(chuàng)始人兼CEO Alex Yeh
彩云科技旗下的產(chǎn)品正在出海。袁行遠分享說,海外用戶對數(shù)據(jù)、隱私等問題的關(guān)注度較高,與國內(nèi)用戶區(qū)別明顯。他認為中國有望通過大量高質(zhì)量的人才儲備,在中美AI對決中取勝。
在李博杰看來,AI行業(yè)領(lǐng)域知識獲取更便捷,對經(jīng)驗的要求相對較少,使許多年輕的中國企業(yè)和研究者能展現(xiàn)出后發(fā)優(yōu)勢。
3、做基礎(chǔ)模型還是AI應(yīng)用?
針對做基礎(chǔ)模型還是AI應(yīng)用的選擇問題,Alex Yeh認為大廠偏重基礎(chǔ)模型的訓(xùn)練,而中小企業(yè)則應(yīng)專注于快速落地和應(yīng)用開發(fā)。
AI訓(xùn)練需要消耗海量的數(shù)據(jù)與算力。智澄AI創(chuàng)始人及CEO胡魯輝相信,未來的創(chuàng)新將圍繞如何更高效地利用數(shù)據(jù)和算力展開,創(chuàng)業(yè)公司在未來十年也仍將有巨大的發(fā)展空間。
▲智澄AI創(chuàng)始人及CEO胡魯輝
彩云科技既做AI基礎(chǔ)研究,又開發(fā)了彩云天氣、彩云小夢等AI應(yīng)用。在袁行遠看來,在AI應(yīng)用落地的過程中,高性能底層模型已如“電力”般廣泛可及,行業(yè)重點逐漸從基礎(chǔ)算法轉(zhuǎn)變?yōu)閷?yīng)用細節(jié)的極致追求。以天氣預(yù)報為例,通用AI模型無法敏銳地識別云圖中的細微變化和噪音,需要運用大量的一線行業(yè)知識才能完美勝任。
4、未來兩年是垂直領(lǐng)域Agent的關(guān)鍵突破口
PINE AI正在打造能聽、能看、能說、能操作電腦的通用AI Agent,未來希望成為數(shù)字員工和個人助理。
李博杰說,Agent的形態(tài)正在變化,決策能力、通用性不斷增強,未來兩年是垂直領(lǐng)域Agent的關(guān)鍵突破口,企業(yè)需要在這一階段積累品牌聲譽與網(wǎng)絡(luò)效應(yīng),為2027年左右通用Agent爆發(fā)做好準備。
▲PINE AI聯(lián)合創(chuàng)始人、首席科學(xué)家李博杰
除了完成單一任務(wù)之外,通用Agent的價值還在于并行完成大量重復(fù)性工作,為生產(chǎn)、生活節(jié)省時間,提供便利。在李博杰看來,這類Agent有望在2025年初步落地,產(chǎn)生價值。
5、具身智能可能在五年內(nèi)實現(xiàn)
胡魯輝談道,大模型可能只是AI發(fā)展的一個階段性成果,AI發(fā)展正從生成式AI邁向物理智能,最終實現(xiàn)通用人工智能(AGI)。
李博杰也認為,具身智能很有可能是AI到達甚至超過AGI的路徑。具身智能在與現(xiàn)實世界交互的過程中,獲得大量知識與數(shù)據(jù),助力模型能力持續(xù)提升。
Alex Yeh預(yù)測具身智能將在未來五年內(nèi)實現(xiàn),特別是在工業(yè)領(lǐng)域的應(yīng)用。
他提到多模態(tài)數(shù)據(jù)的整合將推動AI向更高維度發(fā)展,為AGI的實現(xiàn)提供新的路徑。AI目前還缺少物理數(shù)據(jù),通過VR、AR等技術(shù)收集,并結(jié)合虛擬場景訓(xùn)練,可加速具身智能的發(fā)展。
針對近期資本退出人形機器人公司的爭議,胡魯輝相信行業(yè)共識能夠推動科技發(fā)展、人類進步,堅持長期主義很重要,亞馬遜、微軟等大公司的成功都源于長期堅持。因此,投資應(yīng)注重長期價值。
三、GenAI應(yīng)用論壇:從生活到企業(yè),如何用AI掀起生產(chǎn)效率變革?
伴隨著前沿模型快速迭代突破,AI應(yīng)用迎來前所未有的繁榮期,快速將AI技術(shù)轉(zhuǎn)化成能夠解決消費級、生產(chǎn)級問題,帶來實際價值的賦能工具。
在大會首日GenAI應(yīng)用論壇上,AI平臺、視頻生成、智算云、AI PPT、AI搜索、AI動漫、端側(cè)芯片領(lǐng)域的嘉賓代表各抒己見,剖析產(chǎn)業(yè)問題,暢談落地思路,分享他們在真實應(yīng)用場景中的實踐經(jīng)驗和對未來趨勢的研判。
1、楓清科技高雪峰:單一模型無法解決生產(chǎn)級問題,AI落地產(chǎn)業(yè)有三要素
楓清科技Fabarta創(chuàng)始人兼CEO高雪峰認為,單一產(chǎn)品、技術(shù)或模型難以解決復(fù)雜的生產(chǎn)級問題,只有將各類AI技術(shù)落地在企業(yè)、產(chǎn)業(yè)之中,帶來真正的高價值場景,融合為生態(tài)系統(tǒng),才能讓AI技術(shù)更富有生命力、更繁榮。
AI技術(shù)在產(chǎn)業(yè)中落地,有三個關(guān)鍵要素:知識引擎、行業(yè)大模型、智能體平臺。要把生成式AI技術(shù)應(yīng)用到產(chǎn)業(yè)端,最需要實現(xiàn)決策智能。
楓清科技采取了以數(shù)據(jù)為中心的AI平臺架構(gòu)落地的范式,還推出知識引擎和行業(yè)大模型雙輪驅(qū)動的智能體平臺,幫助企業(yè)實現(xiàn)多場景價值落地。該平臺通過多模態(tài)數(shù)據(jù)存儲和計算,智能化構(gòu)建企業(yè)知識庫,支持精準推理和復(fù)雜推理能力。
▲楓清科技Fabarta創(chuàng)始人兼CEO高雪峰
2、愛詩科技孫偉哲:視頻模型需兼顧趣味與速度,幫每個人成為生活的導(dǎo)演
愛詩科技是全球最早訓(xùn)練視頻生成大模型的團隊之一,正以高頻的技術(shù)研發(fā)節(jié)奏,進行底層模型的迭代。愛詩科技企服負責(zé)人孫偉哲分享說,針對短視頻時代用戶習(xí)慣的特點,打造視頻生成模型需要兼顧趣味與速度,前者能促進用戶的關(guān)注與傳播,而后者則是提升用戶體驗的關(guān)鍵。
語言曾經(jīng)是傳遞信息的最好介質(zhì),但目前我們接受的大部分信息都來自于視頻。全球視頻創(chuàng)作需求已大量涌現(xiàn),日均視頻播放量達800億次,企業(yè)也需要通過AI技術(shù)實現(xiàn)視頻內(nèi)容生產(chǎn)的降本增效。愛詩科技希望通過視頻生成技術(shù),實現(xiàn)創(chuàng)作平權(quán),幫助每個人成為生活的導(dǎo)演。
愛詩科技的PixVerse是全球最早實現(xiàn)千萬級MAU的視頻生成產(chǎn)品,并同步發(fā)力B端業(yè)務(wù),利用視頻生成技術(shù),為企業(yè)客戶在數(shù)字營銷、信息流廣告、短劇創(chuàng)作與出海、游戲設(shè)計與開發(fā)等領(lǐng)域提供助力,并提供了持續(xù)、精準的運營服務(wù)。
▲愛詩科技企服負責(zé)人孫偉哲
3、GMI Cloud King Cui:推理服務(wù)成AI出海關(guān)鍵支撐,及時彈性擴容是核心性能
GMI Cloud亞太區(qū)總裁King Cui談道,基礎(chǔ)模型能力提升和開源生態(tài)的豐富,為AI應(yīng)用爆發(fā)提供了核心必要條件,這背后,為中國AI產(chǎn)品出海提供關(guān)鍵支撐的就是推理算力。
AI應(yīng)用往往會出現(xiàn)用戶規(guī)模和訪問量短期暴漲等現(xiàn)象,因此提供及時性、擴展性、穩(wěn)定性的推理服務(wù)至關(guān)重要。
GMI Cloud的目標是打造更高性能的GPU推理云服務(wù),支持全球范圍自動擴縮容、一鍵部署推理模型、搭載自動容錯機制等。
▲GMI Cloud亞太區(qū)總裁King Cui
4、像素綻放PixelBloom蒲世林:AI帶來的效率革新符合發(fā)展趨勢,需理性擁抱
像素綻放PixelBloom(AiPPT.com)聯(lián)合創(chuàng)始人蒲世林談道,隨著底層算力和模型層成本的顯著下降,AI應(yīng)用層迎來全面爆發(fā)的機遇。
像素綻放PixelBloom在AI PPT領(lǐng)域,通過ToC、To Partner ToC、ToB三種商業(yè)化路徑,既直接服務(wù)消費者,也與頭部企業(yè)合作提升辦公效率;同時還開放API能力,與聯(lián)想、釘釘?shù)扔布蛙浖S商深度集成,構(gòu)建開放生態(tài),覆蓋辦公人群。
在進軍海外市場時,AiPPT.com注重做好本土化,提供多語言版本和本地化模板,滿足不同國家的市場需求,還通過孵化和并購來擴展產(chǎn)品矩陣。
在蒲世林看來,AI技術(shù)帶來的效率革新符合人類發(fā)展趨勢,企業(yè)需理性擁抱AI,不低估但也別期待過高,通過實際應(yīng)用探索能力邊界,以抓住未來十年的AI紅利。
▲像素綻放PixelBloom(AiPPT.com)聯(lián)合創(chuàng)始人蒲世林
5、博查AI翁柔瑩:AI比人類更需要搜索引擎
博查AI搜索聯(lián)合創(chuàng)始人兼CTO翁柔瑩認為,AI時代,用戶的搜索習(xí)慣已由“關(guān)鍵詞搜索”轉(zhuǎn)變?yōu)椤白匀徽Z言對話”,內(nèi)容的生產(chǎn)、流動、消費也在發(fā)生變化,在AI為用戶整理、總結(jié)信息的過程中,內(nèi)容的消費主體已經(jīng)變成了AI。
AI大模型的訓(xùn)練數(shù)據(jù)存在滯后性,必須通過聯(lián)網(wǎng)搜索來獲取最新的內(nèi)容,才能為用戶提供更好的信息服務(wù),從這一角度來看,AI比人類更需要搜索引擎。
為AI打造的搜索引擎與傳統(tǒng)搜索引擎在架構(gòu)上有相似之處,依舊需要實時獲取高質(zhì)量信息。博查采用多模態(tài)混合搜索和語義排序技術(shù),能突破傳統(tǒng)搜索引擎的技術(shù)瓶頸,滿足大模型對于高質(zhì)量世界知識的需求,還打造了全球首個多Agent架構(gòu)的智能體搜索,為AI提供專業(yè)領(lǐng)域知識。
▲博查AI搜索聯(lián)合創(chuàng)始人兼CTO翁柔瑩
6、中文在線周立強:AI降低動漫短劇門檻,制作成本降低50%
中文在線AI動漫部總經(jīng)理周立強談道,中國AIGC應(yīng)用市場正在加速發(fā)展,預(yù)計2024年至2028年年均復(fù)合增長率將超過30%。作為勞動密集型行業(yè),動漫領(lǐng)域正受到AIGC相關(guān)工具的深刻影響。
傳統(tǒng)動漫短劇制作通常包含原文理解、劇本改寫等11個環(huán)節(jié),而AI已將流程壓縮至設(shè)定理解、生圖合成、后期處理等5個步驟。AI動漫短劇的優(yōu)勢在于具備跨國傳播能力、支持工業(yè)化量產(chǎn),且制作成本顯著下降——單部作品的制作周期可縮短70%,成本降低約50%。
周立強指出,AI動漫短劇已逐步突破單一流量變現(xiàn)階段。預(yù)計未來三年,掌握AIGC全鏈路能力的團隊有望占據(jù)全球短劇市場30%以上的份額。
▲中文在線AI動漫部總經(jīng)理周立強
7、光羽芯辰周強:端側(cè)AI的發(fā)展促使手機架構(gòu)變革,可能孕育出新的大型公司
光羽芯辰創(chuàng)始人兼董事長周強談道,過去幾年,AI經(jīng)歷了從低谷到高峰的周期,AI創(chuàng)新的核心在于實用性,只有當(dāng)技術(shù)可用且有價值時,市場關(guān)注度才會提升。
早期AI應(yīng)用多局限于云端,而端側(cè)AI的興起使AI能夠深入生產(chǎn)生活各領(lǐng)域,比如應(yīng)用到工廠的機器人上,顯著提升生產(chǎn)力。大模型的出現(xiàn)增強了AI能力,但也暴露了硬件性能不足的問題。
端側(cè)AI需要新的技術(shù)架構(gòu)以降低功耗、提升性能和帶寬。以手機為例,隨著AI未來的發(fā)展趨勢,智能手機將進化為AI手機,將集成更多端側(cè)數(shù)據(jù),成為所有智能終端的中心,光羽芯辰的端側(cè)芯片以及創(chuàng)新的解決方案和架構(gòu)將極大的助力這一變革。
▲光羽芯辰創(chuàng)始人兼董事長周強
8、Zilliz郭人通:對于Agent構(gòu)建,我們?nèi)绾斡行еС趾A繑?shù)據(jù)檢索,挖掘隱藏于長尾的高價值信息?
Zilliz關(guān)注如何有效檢索海量數(shù)據(jù),發(fā)掘隱藏于長尾的高價值信息。在OpenAI發(fā)布Deep Research功能之后,Zilliz也嘗試了復(fù)刻。
據(jù)Zilliz合伙人、產(chǎn)品總監(jiān)郭人通分享,對于Deep Research這類Agent系統(tǒng),在數(shù)據(jù)基礎(chǔ)設(shè)施層面需要在數(shù)據(jù)建模、部署、緩存、多租、冷熱數(shù)據(jù)處理等方面做好優(yōu)化,聚焦信息檢索質(zhì)量,提高單位成本可支撐的檢索迭代輪次,以保證 Agent 對問題的理解度以及對信息的挖掘深度。Zilliz目前已提供系統(tǒng)性解決方案。
對于提高查詢質(zhì)量,目前有一系列經(jīng)過生產(chǎn)驗證的方法,包括查詢改寫,如多查詢條件生成、查詢拆解、意圖識別等,這有助于突破傳統(tǒng)RAG技術(shù)的搜索局限性。此外,帶正負樣本的查詢增強、多模態(tài)搜索也能有效提升搜索質(zhì)量。
目前,許多企業(yè)已切入垂直Agent方向,海量領(lǐng)域數(shù)據(jù)也引發(fā)數(shù)據(jù)Infra的變革,基于S3構(gòu)建的數(shù)據(jù)Infra正逐漸獲得更多企業(yè)用戶的選用。今年下半年,Zilliz將推出面向AI應(yīng)用的數(shù)據(jù)湖解決方案,從五月開始,Zilliz會面向業(yè)界進行介紹,敬請關(guān)注。
▲Zilliz合伙人、產(chǎn)品總監(jiān)郭人通
四、大模型峰會:判趨勢,剖解法,全面直擊算法、算力、數(shù)據(jù)挑戰(zhàn)
大會第二天舉行的大模型峰會,更加聚焦于大模型產(chǎn)業(yè)鏈底層技術(shù),從模型、中間件、云服務(wù)、知識圖譜、存儲、網(wǎng)絡(luò)、芯片、數(shù)據(jù)平臺等多維度切入,探討突破大模型算法、算力、數(shù)據(jù)關(guān)鍵瓶頸的可行路徑。
現(xiàn)場,焱融科技首次發(fā)布了KV Cache在推理場景性能優(yōu)化數(shù)據(jù)。實測數(shù)據(jù)顯示:在長上下文場景中,使用YRCloudFile KVCache可實現(xiàn)高達13倍的TTFT性能提升,延時縮短超4倍。
1、上交大戴國浩:全面直擊云邊端不同場景推理需求挑戰(zhàn),半分離式方案下周開源
上海交通大學(xué)副教授、無問芯穹聯(lián)合創(chuàng)始人戴國浩談道,真正能模仿人類智力的模型往往是推理需求,但現(xiàn)有云側(cè)和端側(cè)很難滿足模型推理需求。
云側(cè)有PD融合式、PD分離式兩種技術(shù)路線,其中,PD融合式的技術(shù)路線將計算和存儲進行融合的好處是內(nèi)存利用率更高、無需傳遞KV cache,但缺點是不同任務(wù)間干擾大;PD分離式技術(shù)路線,將計算和存儲資源分離的好處是計算單元容易隔離、抗干擾,但存儲冗余和不均衡會帶來額外開銷。
因此,無問芯穹取長補短打造半分離式方案Semi-PD,實現(xiàn)計算分離存儲融合,Semi-PD將于一周后開源整體代碼,月底開源整個集群代碼,Semi-PD在一體機和分布式集群推理等場景下將帶來顯著性能提升。
其端側(cè)思路是通過輕量化方式讓終端負載變小,SpecEE技術(shù)引入機器學(xué)習(xí)、模型自適應(yīng)等,可以判斷是否在級聯(lián)結(jié)構(gòu)當(dāng)前層輸出了正確結(jié)果。該技術(shù)能無感兼容任何端側(cè)輕量化方案,整套代碼將在本月開源。
▲上海交通大學(xué)副教授、無問芯穹聯(lián)合創(chuàng)始人戴國浩
2、智澄AI胡魯輝:人形機器人“不好用”,與大模型數(shù)據(jù)挑戰(zhàn)有差別
智澄AI創(chuàng)始人兼CEO胡魯輝認為,機器人將是未來AI生態(tài)中的重要組成部分,物理智能有望成為AI的下一波浪潮,實現(xiàn)更廣泛的通用人工智能。目前人形機器人泛化能力較差,直接導(dǎo)致成本高昂,歸根結(jié)底就是“不好用”。
與大模型一樣,物理智能面臨著數(shù)據(jù)、模型、環(huán)境、算力等方面的挑戰(zhàn),但挑戰(zhàn)的內(nèi)核有所區(qū)別。物理智能可用的數(shù)據(jù)量更少,需要在“機器人訓(xùn)練場”中采集數(shù)據(jù),機器人端側(cè)算力限制也對模型能效提出了要求。
智澄AI從世界模型的研發(fā)與人形機器人本體的打造兩個角度切入,打造的TR4機器人能以視覺+力度感知的方案實現(xiàn)物體抓握,無需依賴觸覺。
▲智澄AI創(chuàng)始人兼CEO胡魯輝
3、焱融科技張文濤:高性能全閃存儲在訓(xùn)練與推理中如何破解AI算力瓶頸?
焱融科技CTO張文濤分享說,針對大模型訓(xùn)練和推理的存儲解決方案,焱融科技通過Multi-Channel技術(shù)聚合多個網(wǎng)卡、帶寬等,提供高性能內(nèi)核私有客戶端,能夠滿足高性能元數(shù)據(jù)訪問需求,為企業(yè)提供高效、靈活的存儲支持。
焱融科技在數(shù)據(jù)管理方面,采取智能分層和數(shù)據(jù)加載功能來優(yōu)化管理流程。此外,焱融科技順勢推出的DataInsight數(shù)據(jù)編排管理平臺,幫助企業(yè)解決其應(yīng)用AI大模型中的海量歷史業(yè)務(wù)數(shù)據(jù)管理難題;支持多維度組合查詢,實現(xiàn)百億級數(shù)據(jù)秒級檢索。通過自研DataFlow技術(shù),用戶可自定義數(shù)據(jù)流動策略,確保數(shù)據(jù)按需、快速嵌入業(yè)務(wù)流程。平臺還具備增量數(shù)據(jù)自動感知能力,保障用戶從知識庫平臺訪問時獲取最新數(shù)據(jù),進一步提升數(shù)據(jù)流動效率。
在運維方面,焱融科技通過提供目錄集來做好多租戶管理和隔離,并設(shè)置了彈性數(shù)據(jù)網(wǎng)絡(luò),使一套存儲能夠支持多種網(wǎng)絡(luò)平面,并幫助管理員簡化基礎(chǔ)設(shè)施建設(shè)。
其產(chǎn)品性能出色,依托于分布式元數(shù)據(jù)集群能夠支撐千億級海量文件,能夠支持高速無損網(wǎng)絡(luò)及多種接口,還適配多個國產(chǎn)化平臺。在本屆大會上,焱融科技還首次發(fā)布了KV Cache在推理場景性能優(yōu)化數(shù)據(jù)。
實測數(shù)據(jù)顯示:在長上下文場景中,使用YRCloudFile KVCache可實現(xiàn)高達13倍的TTFT性能提升。在TTFT≤2秒的嚴苛約束下,其支持的并發(fā)數(shù)提升達8倍,且在高并發(fā)負載中延遲可降低4倍以上。張文濤談到Y(jié)RCloudFile KVCache可構(gòu)建PB級KVCache緩存層,有效突破GPU顯存限制,顯著提升緩存命中率與推理上下文長度。
▲焱融科技CTO張文濤
4、Zenlayer陳秀忠:token洪流下算力網(wǎng)絡(luò)三大趨勢,實時交互、分布式推理、高效IDC
Zenlayer行業(yè)拓展總監(jiān)陳秀忠談道,token是大模型世界的基礎(chǔ)單位,過去8個月,token使得整個網(wǎng)絡(luò)世界流量增長,達到移動互聯(lián)網(wǎng)時代的3~4倍。
token的整個生命周期包括AI工廠生產(chǎn),再經(jīng)網(wǎng)絡(luò)傳輸給用戶,其在生產(chǎn)過程需要大量算力和電力,在傳輸和消費環(huán)節(jié)需要靠近用戶的推理節(jié)點實現(xiàn)即時交互。
在token洪流下,未來的三個演進趨勢包括實時交互的全球網(wǎng)絡(luò)、分布式推理的易用模型服務(wù)、高效的IDC。基于此,Zenlayer構(gòu)建了覆蓋全球的專線網(wǎng)絡(luò)、覆蓋亞太地區(qū)的AI機房、在現(xiàn)有邊緣節(jié)點推出模型服務(wù)等。
▲Zenlayer行業(yè)拓展總監(jiān)陳秀忠
5、清程極智師天麾:如何打造國產(chǎn)模型與國產(chǎn)算力間的橋梁?
清程極智聯(lián)合創(chuàng)始人、產(chǎn)品副總裁師天麾分享說,在DeepSeek、QwQ等國產(chǎn)推理模型爆火之后,大模型私有化部署需求大幅度增加。在國外算力獲取困難、國產(chǎn)顯卡軟件生態(tài)不完善的背景下,打造連接國產(chǎn)模型與國產(chǎn)算力的橋梁尤為迫切。
清程極智已聯(lián)合清華大學(xué)開源了赤兔推理引擎,支持在非Hopper架構(gòu)設(shè)備(如早期大部分英偉達GPU和大部分國產(chǎn)芯片)上原生運行FP8模型,打破硬件綁定,提升算力使用效率,并能有效保留模型原有精度。
目前清程極智基于赤兔引擎推出多款大模型私有化部署方案,可根據(jù)不同場景需求提供針對性解決方案,結(jié)合企業(yè)業(yè)務(wù),提供從私有化部署到智能體開發(fā)的一站式服務(wù)。
▲清程極智聯(lián)合創(chuàng)始人、產(chǎn)品副總裁師天麾
6、首都在線張振宇:以全棧國產(chǎn)化為特色,助攻生成式AI規(guī)模化落地
首都在線集團智算產(chǎn)品總經(jīng)理張振宇談道,隨著DeepSeek爆火,AI大模型國產(chǎn)化趨勢正在加速,推理市場將迎來大規(guī)模增長。首都在線后續(xù)也會更聚焦于推理算力的布局。
此前首都在線智算云已成功應(yīng)用于多個生成式AI場景,如自然語言處理、圖像生成、視頻生成等,公司今年將持續(xù)優(yōu)化“一云多模、一云多芯、一云多池”的戰(zhàn)略布局,去構(gòu)建高度靈活的AI服務(wù)平臺,我們的平臺不斷拓展支持的模型種類,為用戶提供更豐富的選擇,滿足不同場景需求。
首都在線Maas云平臺通過構(gòu)建云端協(xié)同調(diào)優(yōu)體系,以算力效能優(yōu)化為基礎(chǔ)、模型即服務(wù)(MaaS)平臺為核心,為AI開發(fā)者及算力伙伴帶來創(chuàng)新性升級,形成了閉環(huán)式技術(shù)解決方案,不僅有效提升了GPU利用率,降低了訓(xùn)練成本,能夠為客戶提供更加高效、靈活、低成本的算力服務(wù),還為大模型從實驗室走向產(chǎn)業(yè)化提供了關(guān)鍵技術(shù)支撐。
▲首都在線集團智算產(chǎn)品總經(jīng)理張振宇
7、海致科技李思宇:以圖為核心,打通大模型與多模態(tài)行業(yè)知識
海致科技技術(shù)總監(jiān)李思宇談道,大模型實際項目落地的Prompt提示詞工程,RAG檢索召回增強、Agent Function/Tool Call、SFT監(jiān)督微調(diào)訓(xùn)練四種基本方法,其關(guān)鍵是讓大模型結(jié)合多模態(tài)行業(yè)知識。
針對此,海致科技的思路是統(tǒng)一知識與數(shù)據(jù)認知,其解決方案以圖為核心,結(jié)合工具將標量數(shù)據(jù)和向量數(shù)據(jù)打通形成有機整體。
通過將大模型與知識圖譜融合,海致科技形成了基礎(chǔ)模型層、語義知識層、邏輯圖譜層、智能體應(yīng)用層,可基于基礎(chǔ)模型、元數(shù)據(jù)知識體系,在應(yīng)用層之上構(gòu)建智能體、工作流。
實際落地中,其解決方案接入警情案件等五情數(shù)據(jù),可融合跨不同事件、不同情報數(shù)據(jù),形成完整事件對象關(guān)系圖再以此進行信息挖掘,實現(xiàn)匯聚非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)的整體圖譜。
▲海致科技技術(shù)總監(jiān)李思宇
8、中昊芯英朱國梁:Scaling Law延續(xù)下的AI芯片軟件棧重構(gòu)
中昊芯英軟件研發(fā)負責(zé)人朱國梁介紹,目前,Scaling Law正沿著測試時計算、強化學(xué)習(xí)與預(yù)訓(xùn)練三條路徑延續(xù)。需要不斷重構(gòu)AI芯片軟件棧來滿足新的算力挑戰(zhàn)。
對大部分廠商而言,超大Batch-Size依舊是優(yōu)先事項,下一個Transformer級別的架構(gòu)尚未出現(xiàn)。
目前在推理方向優(yōu)化,探索方向包括KV緩存卸載、PD分離、稀疏注意力和MoE通信優(yōu)化等。
強化學(xué)習(xí)方面,隨著強化學(xué)習(xí)兩階段訓(xùn)練的范式形成,訓(xùn)練和推理協(xié)同調(diào)度需求不斷增長。
預(yù)訓(xùn)練方面,需要在訓(xùn)練通信特征、訓(xùn)練通算重疊與訓(xùn)練容錯等方面對現(xiàn)有軟件棧做出修改。
▲中昊芯英軟件研發(fā)負責(zé)人朱國梁
9、澳鵬董成:大模型愈往垂類應(yīng)用端發(fā)力,對數(shù)據(jù)質(zhì)量要求愈高
澳鵬Appen中國及韓國區(qū)副總裁董成通過澳鵬在各領(lǐng)域大模型部署中數(shù)據(jù)訓(xùn)練的最佳實踐,重點分享了對大模型應(yīng)用趨勢的觀察。以AI Agent為代表,未來,大模型必定應(yīng)用到具體的垂直領(lǐng)域中,比如金融、醫(yī)療、代碼、音樂、文學(xué)等。
這一趨勢對數(shù)據(jù)的高質(zhì)量、專業(yè)度、多垂類提出了越來越高的要求。對此,澳鵬提供了多種AI輔助的前沿數(shù)據(jù)采標工具和方案,包括文本對話、多模態(tài)交互、思維鏈推理工具等。
董成認為,AI大模型行業(yè)正經(jīng)歷顯著變化,Llama和DeepSeek等開源模型在性能上逐漸趕上甚至超過閉源模型,一些企業(yè)也從閉源向著開源方向轉(zhuǎn)變。同時,大模型企業(yè)的研發(fā)越來越關(guān)注復(fù)雜任務(wù)方向,從最初的簡單對話向模型推理、垂直領(lǐng)域應(yīng)用、多模態(tài)等方向發(fā)展。
▲澳鵬Appen中國及韓國區(qū)副總裁董成
10、云軸科技王為:AI實踐應(yīng)用分四級,基礎(chǔ)設(shè)施構(gòu)建面臨四大挑戰(zhàn)
云軸科技CTO王為解讀了當(dāng)前AI基礎(chǔ)設(shè)施構(gòu)建面臨的挑戰(zhàn),包括模型尺寸增加、上下文窗口增加、全模態(tài)支持、多品牌算力支持等。
類比自動駕駛,AI實踐可對應(yīng)作為工具、作為參考建議、主導(dǎo)到端到端實踐的L1~L4級別。云軸科技已在AI輔助售后、代碼、文檔等方面有所應(yīng)用。其中AI輔助售后、代碼輔助處于參考建議階段,輔助文檔為主導(dǎo)階段,這背后凸顯出諸多基礎(chǔ)設(shè)施的構(gòu)建難題。
AI賦能企業(yè)內(nèi)部的技術(shù)架構(gòu)需要穩(wěn)固的智算底座、模型層,以及包含易用開發(fā)、性能評測等工具的運營與應(yīng)用層。模型層的資源管理員主要關(guān)注底層資源使用情況,開發(fā)者只需直接導(dǎo)入模型做精調(diào)、推理等賦能業(yè)務(wù)。
▲云軸科技CTO王為
11、Alluxio湯文軍:AI時代,高性能分布式緩存如何實現(xiàn)極致I/O優(yōu)化?
Alluxio解決方案架構(gòu)師湯文軍分享說,企業(yè)在搭建和優(yōu)化AI高性能數(shù)據(jù)訪問平臺時,面臨著數(shù)據(jù)方面的業(yè)務(wù)壓力、GPU稀缺昂貴且利用率不高、數(shù)據(jù)解決方案復(fù)雜等問題。針對這些問題,Alluxio推出了去中心化的Alluxio Enterprise AI產(chǎn)品方案。
具體來看,針對ML/AI GPU訓(xùn)練對I/O提出的諸多要求,Alluxio使用一致性哈希在worker節(jié)點上緩存數(shù)據(jù)與元數(shù)據(jù),這顯著減少了I/O RPC長度,減少單點故障并降低了Master節(jié)點性能瓶頸;優(yōu)化性能時,使用零拷貝優(yōu)化、并行與隨機讀優(yōu)化,解決了讀放大問題。
最終,Alluxio實現(xiàn)了高性能、低延遲、高可用、容量線性擴展等優(yōu)化效果,這套方案可應(yīng)用于數(shù)據(jù)預(yù)處理、模型訓(xùn)練、部署、推理等環(huán)節(jié),已在眾多場景實際落地,帶來GPU利用率、運維成本等方面的顯著收益。
▲Alluxio解決方案架構(gòu)師湯文軍
12、澎峰科技張先軼:解讀AI算力部署進階路,從一體機到專線模式
澎峰科技創(chuàng)始人&CEO張先軼分享說,用戶在AI算力部署上的策略通常從單機部署開始,例如使用一體機。隨著需求的增長,用戶會逐步擴展到私有化部署,通過MaaS平臺納管更多硬件設(shè)備,并分批建設(shè)算力資源,還可以將現(xiàn)有服務(wù)器納入管理,形成一種類似擴容的方案。
為了進一步提升算力利用率和數(shù)據(jù)隱私安全性,用戶可以借助國產(chǎn)智算中心的模型的專線模式進行混合部署。這種模式不僅能提高計算中心的資源利用率,還能在保障數(shù)據(jù)隱私的同時,支持更多應(yīng)用場景。從商業(yè)模式上看,專線部署采用ToB性質(zhì)的計費方式。未來,用戶可以在此基礎(chǔ)上進行私有模型的微調(diào)部署,支持更多應(yīng)用的開發(fā)與擴展。
▲澎峰科技創(chuàng)始人&CEO張先軼
五、圓桌討論:DeepSeek給AI Infra帶來新機會,國產(chǎn)軟硬件發(fā)展正當(dāng)時
圓桌討論環(huán)節(jié)以《DeepSeek給AI Infra帶來的啟示與機會》 為主題,由騰訊云專有云及智算首席架構(gòu)師方天戟主持,回顧了過去兩個月AI從業(yè)者們圍繞DeepSeek、具身智能等展開的一系列技術(shù)攻關(guān),北京智源人工智能研究院AI框架研究負責(zé)人敖玉龍、澎峰科技創(chuàng)始人兼CEO張先軼、沐冰數(shù)據(jù)CTO邸澤民、云軸科技CTO王為分享了對最新產(chǎn)業(yè)趨勢的觀察與思考。
1、DeepSeek開源帶來震撼,一體機可滿足基礎(chǔ)需求
騰訊云專有云及智算首席架構(gòu)師方天戟強調(diào)DeepSeek具有技術(shù)創(chuàng)新性,基于H800在卡間通信受限的情況下,大幅壓縮了大模型成本,使模型本地部署成為現(xiàn)實。
沐冰數(shù)據(jù)CTO邸澤民認為DeepSeek在開源周中一系列開源工作的最大的震撼在于展現(xiàn)了如何在資源受限的約束下,實現(xiàn)最優(yōu)解的工程能力,充分挖掘了現(xiàn)有算力的潛力。DeepSeek團隊不僅想到了精妙的優(yōu)化技巧與方案,還完成了代碼與工程實現(xiàn),并將其完全開源,十分令人尊敬。
▲騰訊云專有云及智算首席架構(gòu)師方天戟
談及近期銷售火爆的DeepSeek一體機,方天戟認為這有助于企業(yè)在保護數(shù)據(jù)安全的情況下快速用上DeepSeek,北京智源人工智能研究院AI框架研究負責(zé)人敖玉龍指出用戶需要關(guān)注DeepSeek一體機部署后的軟硬件更新問題。
云軸科技CTO王為提到DeepSeek一體機為客戶提供了入門的解決方案,通過預(yù)裝模型和應(yīng)用降低了部署門檻,能夠快速滿足基礎(chǔ)需求。但隨著需求增長,客戶可能需要更復(fù)雜的算力調(diào)度和混合部署方案。
2、國產(chǎn)芯片軟硬件可用性提升,如何繞開CUDA護城河?
敖玉龍記得在2017年-2018年,他嘗試將大規(guī)模并行技術(shù)運用到AI計算中,但當(dāng)時相關(guān)技術(shù)尚未完善。過去幾年AI Infra快速發(fā)展,有力地支持了大模型的技術(shù)進步。
在智源研究院的工作過程中,他接觸到了端側(cè)與服務(wù)器側(cè)的大量國產(chǎn)芯片。目前,國產(chǎn)芯片的硬件、軟件都已具備一定可用性,主要挑戰(zhàn)在于生態(tài)還相對落后,為此智源打造了開源開放統(tǒng)一軟件生態(tài)FlagOS來推動國產(chǎn)芯片生態(tài)發(fā)展。
▲北京智源人工智能研究院AI框架研究負責(zé)人敖玉龍
在ChatGPT爆火之后,關(guān)于DSA特定領(lǐng)域芯片或ASIC專用芯片是否會消亡的討論不絕于耳。
邸澤民認為,對于特定領(lǐng)域的計算負載而言,與GPGPU相比,DSA具有性能,成本與能效優(yōu)勢。從目前趨勢來看,Transformer這個模型架構(gòu)的有效性經(jīng)過了驗證,短期內(nèi)出現(xiàn)顛覆性變化的概率不高,那么一定會有對Transformer架構(gòu)計算特點更有針對性設(shè)計的專用芯片出現(xiàn),不論是采用TPU的脈動陣列、存算一體或者別的什么技術(shù)路線,ASIC夠有效降低推理計算成本,只有不斷降低推理成本,才更能讓大模型的應(yīng)用實現(xiàn)普惠。
▲沐冰數(shù)據(jù)CTO邸澤民
王為也提到一些優(yōu)化技術(shù)在GPGPU上效率不是特別高,所以AI推理往ASIC上發(fā)展的可能性非常大。國產(chǎn)算力在推理上替代能力很強,在訓(xùn)練上還需要一定時間追趕,但應(yīng)該不會太久。
王為認為,在AI訓(xùn)練方面,英偉達目前優(yōu)勢比較突出,因為通信性能、通信庫等技術(shù)壁壘很高,但現(xiàn)在也有國產(chǎn)卡訓(xùn)練較大大參數(shù)模型的案例,因此假以時日還是可以趕上的。英偉達如今在數(shù)據(jù)發(fā)布上選擇性披露,著重在低精度上、稀疏算力上等,近年披露的數(shù)據(jù)逐漸偏向商業(yè)宣傳性質(zhì),詳細的技術(shù)披露較少,這使得評估其真實性能需要更多測試。
▲云軸科技CTO王為
邸澤民預(yù)測在AI訓(xùn)練場景,GPGPU依舊將會繼續(xù)占據(jù)主導(dǎo)地位。在他看來,國產(chǎn)算力如果要通過對PyTorch、TensorFlow等框架兼容,并覆蓋數(shù)千個長尾算子,以實現(xiàn)與英偉達的CUDA護城河的競爭甚至替換,在短期內(nèi)是不現(xiàn)實的。但如果將這種兼容與替換目標進一步收斂、聚焦到特定的模型或者特定領(lǐng)域的模型訓(xùn)練,比如DeepSeek這樣的語言模型,國產(chǎn)廠商是有適配能力與突破空間的。除了框架與算子適配外,另一個難點在于進一步提升通信庫的效率。
3、混合推理系統(tǒng)是必然趨勢,具身智能將催化AI Infra演進
澎峰科技創(chuàng)始人兼CEO張先軼談道,英偉達在硬件創(chuàng)新上的持續(xù)投入,使其在AI領(lǐng)域保持領(lǐng)先;英偉達在精度上的創(chuàng)新不斷提升了性能峰值,也為其他芯片公司設(shè)立了競爭壁壘。
他判斷未來在大規(guī)模部署的情況下,混合推理系統(tǒng)是必然的,能結(jié)合不同硬件的優(yōu)勢以實現(xiàn)更高的性價比和性能。
▲澎峰科技創(chuàng)始人兼CEO張先軼
在混合云部署的實踐方面,張先軼認為當(dāng)前對數(shù)字隱私要求不是特別高的客戶比較容易接受,可以利用智算中心的算力進行補充,比如一些學(xué)校或中小B端。大B端通常對私有化要求會更高。當(dāng)前做AI機器人的企業(yè),基本采用的是邊緣與云端結(jié)合的方式。
方天戟預(yù)測,從長遠來看,相比大語言模型,具身智能可能會成為進一步促進未來AI Infra演進的新應(yīng)用領(lǐng)域。
敖玉龍?zhí)岬骄呱碇悄軝C器人對端云協(xié)同、通信等方面提出了新要求,目前機器人的大腦模型往往部署在云端,控制運動的小腦模型部署在機器人本體,如何實現(xiàn)低延遲的協(xié)同需要進一步探索。
結(jié)語:中國生成式AI浪潮波濤洶涌
中國生成式AI的每一次突破,從來不是某家企業(yè)的獨角戲,而是產(chǎn)學(xué)研用協(xié)同攻堅的交響曲。
開年DeepSeek的爆火,成為中國乃至世界生成式AI產(chǎn)業(yè)的關(guān)鍵拐點。它顛覆了“堆砌算力”的固有路徑,開辟出一條“效率優(yōu)先”的創(chuàng)新路徑,催化開源、推理模型與AI Infra研發(fā)熱潮,更為端側(cè)AI與國產(chǎn)AI算力基礎(chǔ)設(shè)施的落地應(yīng)用注入了新動能。
站在技術(shù)與產(chǎn)業(yè)共振的歷史節(jié)點,我們每一個人,都正在見證和參與一場激動人心的技術(shù)躍遷。
春天來了,生成式AI的浪潮更加波濤洶涌,未來正呼嘯而至。
下一站,也許是基礎(chǔ)模型的飛躍式進化,也許是AI超級應(yīng)用橫空出世,也許是人形機器人的覺醒,也許是商業(yè)價值的裂變,也許是AGI新路徑的曙光。
生成式AI正以摧枯拉朽之勢重塑傳統(tǒng)產(chǎn)業(yè),創(chuàng)新火種從未如此燎原,我們無比期待看到,中國科技企業(yè)在時代的浪尖揚帆起航。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.