3月29日-30日,2025正和島案例共學(xué)大課·安徽站在合肥舉辦,本次大會以“贏在AI+,與趨勢共舞”為主題,300余位企業(yè)家齊聚合肥,共同探討企業(yè)家如何馭勢而上,企業(yè)如何借AI實現(xiàn)價值躍遷。
在大會上,科大訊飛董事長劉慶峰做了分享,“如果今天不讓自己的企業(yè)和生命運行在大模型之上,大概率現(xiàn)在所有靠人力和市場的商業(yè)模式都會在一兩年內(nèi)被徹底顛覆掉。”
他從大模型的發(fā)展階段出發(fā),提出目前大模型還有很大的增長空間,并分享了科大訊飛作為唯一國產(chǎn)范圍構(gòu)建的自主可控大模型如今的發(fā)展情況,以及未來準(zhǔn)備為企業(yè)提供的服務(wù)。
以下內(nèi)容為本次演講內(nèi)容精編,希望對你有所啟發(fā)。
口 述:劉慶峰 科大訊飛董事長
編 輯:一厘米
來 源:正和島(ID:zhenghedao)
各位企業(yè)家朋友,大家好。我將從兩個角度做個分享。
首先,我們?nèi)绾慰创?dāng)前技術(shù)發(fā)展的趨勢,以及下一步產(chǎn)業(yè)可能帶來的變革性影響。其次,企業(yè)如何抱團(tuán),如何發(fā)展AI。
一、AI大模型離天花板還很遠(yuǎn)
今天的底座大模型實際上還有很大的增長空間。
大家都知道,DeepSeek在春節(jié)前出圈,隨后OpenAI o1將其升級為o3-mini,最近又出了GPT-4o的升級版本,對圖片的理解、邏輯推理與創(chuàng)造力都有所提升。
在硅谷,其實還有一個比OpenAI更難進(jìn)的公司Anthropic,它有很多物理學(xué)博士,那些天才們都特別想加入。
它的CEO Dario Amodei發(fā)了一篇長文,大膽預(yù)言:兩年內(nèi),“強(qiáng)大AI”將達(dá)到諾獎級智商水平。
目前大家對通用人工智能發(fā)展大致分為幾個階段,雖然各個角度不同,但是基本認(rèn)知相對一致。
第一步是對話者。通過對話控制人工智能,只要進(jìn)行語言提示,就可以激發(fā)他們學(xué)習(xí)、記憶、訓(xùn)練內(nèi)容。
第二步是智能行動者,可以完成相關(guān)指令的工作。
第三步是智能體,它可以自動聽懂你的指令,并將其分解成相關(guān)任務(wù),找到每個任務(wù)完成所需的工具,之后再對接內(nèi)部和外部信源,將它們組合起來完成任務(wù)。
第四步是創(chuàng)新者,不僅可以完成既定工作,還可以自己創(chuàng)意和創(chuàng)新。
第五步是組織者,到后期它就具備整合社會要素資源整和調(diào)度能力,大致分為這幾個階段。
目前,我們基于大模型,為央國企業(yè)做了很多智能體平臺。
他們不需要編程,只需要理解場景并提出要求,我們會自動幫助他申請相關(guān)工具。中國能源通過這種方式已經(jīng)有50多個非常優(yōu)秀的智能體工具在全集團(tuán)內(nèi)部使用。
其最大意義在于隨著大模型語言理解能力和編程能力的提升,我們已經(jīng)擁有越來越多專項的人工智能技術(shù)。因此,智能體平臺在下一個階段對各企業(yè)非常關(guān)鍵。
在第四個階段中,創(chuàng)新者是什么概念?前年中央經(jīng)濟(jì)工作會議上明確提出,要將科技、人才、教育三位一體,并在經(jīng)濟(jì)工作中排名第一的是創(chuàng)新。
目前全球范圍內(nèi)非常清楚的是,AI for science大模型是未來創(chuàng)新的最重要的助推器和底座支撐。去年諾貝爾化學(xué)獎和物理學(xué)獎分別頒發(fā)給了大模型與人工智能相關(guān)的科學(xué)家。
我給大家舉個例子,中國科學(xué)技術(shù)大學(xué)生命學(xué)院的劉海燕教授團(tuán)隊,要做蛋白質(zhì)的結(jié)構(gòu)預(yù)測,生成活性蛋白質(zhì)。原來需要6個月做的實驗,現(xiàn)在借助科研大模型一天就做完了,已經(jīng)做出48個活性蛋白質(zhì),并且在《Nature》上發(fā)表文章。
再比如合肥的“人造小太陽”,它通過技術(shù)途徑解決能源的問題。原來做模擬實驗時,要把粒子加速到一定速度,產(chǎn)生聚變反應(yīng)發(fā)出能量,達(dá)到一定高度可以留存1000秒。
原來做模擬實驗需要10-20天,現(xiàn)在用AI幫它做一次實驗只用一個小時,原來10-20天的實驗成功率93%,現(xiàn)在一個小時成功率97%,極大提升了科研效率。
所以有人說今天如果科研不用新的人工智能工具,就是原來的農(nóng)業(yè)水平階段。
到工業(yè)階段,會將大量優(yōu)秀的、有創(chuàng)新能力的年輕人從簡單、重復(fù)的科研活動中釋放出來,就像我們原來做天體研究一樣,如果發(fā)現(xiàn)一個新的行星,那導(dǎo)師招博士時不敢招太多人,因為那有很大的運氣成分,你可能一輩子都沒找到一個,那博士就畢業(yè)不了。
現(xiàn)在大模型可以把大海撈針變成茶壺里倒茶葉,利用人工智能可以加速現(xiàn)有科研從農(nóng)業(yè)到工業(yè)階段。
但這還是用現(xiàn)有的技術(shù),加速科研方式,減少重復(fù)性的科研勞動,仍然屬于人工智能的第二和第三階段。
第四階段就是創(chuàng)新,雖然我不清楚路徑,但是我可以給很多新的關(guān)于科研的啟發(fā)。這些科研是腦洞大開的,有可能都沒有人做,很多時候是我們自己都沒想到的。
目前我們正在與中國科學(xué)院大連物理化學(xué)所和中科院非常有名的院士合作,與他們做化工大模型,不僅將現(xiàn)有技術(shù)路線明確為相對清晰的科研方向,使研發(fā)效率大幅提升,同時幫助他們創(chuàng)造更多可能的創(chuàng)新方法。
最后一個階段就是組織者,現(xiàn)在有一點小苗頭,雖然不能完全替代人類,但是兩個機(jī)器人協(xié)同工作,能夠組織社會資源,開始組織協(xié)同性工作,更復(fù)雜地構(gòu)建整個任務(wù)體系。
在這條發(fā)展的路上,大模型的天花板仍然被持續(xù)打開。所以Anthropic的CEO表示到2026年,有可能達(dá)到諾獎級。
從第二個階段的智能者到第四個階段的創(chuàng)新者,正在不斷進(jìn)步,這個進(jìn)步并不需要依靠新的不可預(yù)知的算法或者腦機(jī)接口、類腦計算等,而是用預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)兩種方法。
強(qiáng)化學(xué)習(xí)是針對已有的學(xué)完的內(nèi)容,在特定任務(wù)中自己相互PK,有的是人參與,有的是完全依靠自己。例如AlphaGo下圍棋,要學(xué)幾千萬張棋譜,后來自己與跟自己對弈,一周后就能擊敗所有世界冠軍。
所以通過預(yù)訓(xùn)練和強(qiáng)化訓(xùn)練兩種方法,大模型的自主進(jìn)化在未來2-3年內(nèi)還有巨大的提升空間,天花板非常之高。
二、科大訊飛堅持國產(chǎn)大模型
去年底有人說今天不用做底座大模型,而是要做行業(yè)落地。科大訊飛一直強(qiáng)調(diào)我們必須在底座模型上繼續(xù)前進(jìn),因為它的空間潛力巨大。
在這個底座上,中國的基本架構(gòu)相當(dāng)清晰,大概頭部就是幾家公司。
現(xiàn)在最火出圈的是DeepSeek,在工程化上有很多積累,他們專注做語言模型,而且開源,做的確實相當(dāng)不錯。訊飛主要是在語音、圖片、視頻、多模態(tài)上。
國內(nèi)還有像豆包、騰訊元寶等也都做得很好。
但今天大模型落地實際上已經(jīng)開始出現(xiàn)了不同的戰(zhàn)略角度,有的專注于娛樂、電商、開源,有的專注于其他領(lǐng)域。
我們在2023年5月6日推出訊飛星火1.0,我們的口號就是解放生產(chǎn)力,釋放生產(chǎn)力,我們是“1+N”,底座模型必須自己掌控,才能不斷地在上面做更好的強(qiáng)化訓(xùn)練,更好的升級,然后“N”是我們落地的。
我們現(xiàn)在與教育、醫(yī)療、司法、央國企、汽車、金融、能源等的落地都是行業(yè)第一。
去年我們央國企招標(biāo)數(shù)比前年多了15個億,招標(biāo)金額多了7.2倍,我們是中標(biāo)第一,超過第二名到第六名加起來的水平。
為什么?因為今天主流的全民可下載的通用大模型,除了星火以外,其他全是由英偉達(dá)的卡訓(xùn)練的。
2022年美國規(guī)定中國的卡要限高限寬,所以美國人用A100,中國只能用閹割后的A800,結(jié)果2023年美國的政策更加嚴(yán)格,不光中國買不了,可能給中國做中間地帶輸送算力的四十幾個國家業(yè)全被堵死了。特朗普上臺以后,可能這些智算的訓(xùn)練卡全部會被限制。
芯片方面,原來我們可以使用12納米、16納米的芯片,例如三星、臺積電,生產(chǎn)完成后,可以利用芯片堆疊技術(shù)堆到7納米以下的性能。
目前這條路從今年一二月份開始已經(jīng)被堵死。
因此在這個背景下,中國是否有自主可控的國產(chǎn)算力支撐大模型訓(xùn)練非常關(guān)鍵。
大模型對算力最重要的兩個地方,一是訓(xùn)練,二是推理。訓(xùn)練就像我們學(xué)習(xí),學(xué)會后參加高考,參加博士考試,然后工作。學(xué)的過程中訓(xùn)練的難度極大,訓(xùn)練完成后對外提供服務(wù)的推理相對簡單。
2023年10月24日,我們在合肥建了中國首個萬卡的國產(chǎn)算力,華為910B,當(dāng)時對標(biāo)美國的算力只有百分之二十幾的效率,人家三個月而我們要一年多,所以2023年一年我們在國產(chǎn)算力上發(fā)力,把它從對標(biāo)美國A800做到A100的能力從百分之二十幾提升到90%。
我們?nèi)ツ?月30日推出中國首個用國產(chǎn)算力訓(xùn)練出來的千億大模型,訊飛星火3.5。
為什么大家都不愿意用國產(chǎn)卡?英偉達(dá)每一個新的工具出來,在國產(chǎn)上少則一周,多則需要一個半月做各種適配。
其實我們?nèi)ツ?0月份就跑通了深度推理和長思維鏈的模式,但是在國產(chǎn)算力上整整花了兩個月把各種工具匹配好,才能夠進(jìn)行訓(xùn)練。
2025年1月15日,訊飛星火X1發(fā)布,是首個用國產(chǎn)算力訓(xùn)練出來的長思維鏈模型,但是R1是671B,我們只有13B,因為時間太短,國產(chǎn)算力剛剛把數(shù)據(jù)調(diào)完。
到了3月3日,我們用70B在數(shù)學(xué)上已經(jīng)達(dá)到R1的效果,比它低一個數(shù)量級,數(shù)學(xué)跑通了,長思維鏈的邏輯就全通了。
但我想說的是這個事情在國產(chǎn)算力上要把它跑通,有特別多的坑。如果中國沒有一家企業(yè)做,我們的大模型又會回到當(dāng)年和英特爾CPU一樣,龍芯出來了,可是誰都不用,中國芯就永遠(yuǎn)發(fā)展不起來。
因此在國產(chǎn)戰(zhàn)略上,我們必須認(rèn)真對待,無論多困難,耗費多大的算力,都必須堅定不移地繼續(xù)前進(jìn)。
三、企業(yè)如何擁抱AI?
在當(dāng)前的態(tài)勢下,我認(rèn)為大家應(yīng)該特別關(guān)注底座大模型的快速發(fā)展。如果現(xiàn)在底座模型達(dá)到70分、80分,那么兩年后可能達(dá)到80分、90分,甚至可能達(dá)到諾獎級別,在專業(yè)領(lǐng)域進(jìn)行科研。
再到場景定制,在提升5到10個點,達(dá)到95分、100分,到時候它就可以獨立完成任務(wù)。
原本人機(jī)協(xié)同需要1萬人完成,現(xiàn)在只要100人就能完成。
但是只靠通用大模型還不夠,幻覺問題解決不了,最近有第三方機(jī)構(gòu)測的,比如大家都知道的DS,我覺得它提升了中國社會各階層對自主創(chuàng)新的自信心。
但是拿DS作為例子來說,V3的幻覺是百分之三點幾,R1是百分之十幾,因為它用強(qiáng)化學(xué)習(xí)用的訓(xùn)練數(shù)據(jù)更少。所以必須要在大模型底座能力上結(jié)合專業(yè)行業(yè)數(shù)據(jù),而且能夠外掛企業(yè)自己的實時產(chǎn)生的各種數(shù)據(jù)和支持,才能把幻覺降到能用的門檻,否則沒法使用。
所謂的第一眼驚艷到我們企業(yè)的研產(chǎn)供銷服管產(chǎn)品落地,必須要做定制化。
今天的大模型在C端的用戶數(shù)量春節(jié)前后已經(jīng)達(dá)到2.49億,已經(jīng)跨越技術(shù)規(guī)模化應(yīng)用的鴻溝。
早期創(chuàng)新者的占比為2.5%,探索型早期嘗鮮者占比是13.5%,跨越16%后就可以進(jìn)入規(guī)模化爆發(fā)階段。
所以2025被稱為全民AI的時代,成為全行業(yè)AI應(yīng)用的拐點。
那么在這個時候,大家如果不讓自己的企業(yè)和生意運行在大模型之上,大概率現(xiàn)在所有靠堆人力和時長的商業(yè)模式都會在一兩年內(nèi)被徹底顛覆掉。
關(guān)注這個變化不應(yīng)該盲目地被焦慮感推動,而是要客觀地分析自己的每一個業(yè)務(wù)環(huán)節(jié),研產(chǎn)供銷服務(wù)各個場景,認(rèn)認(rèn)真真地去構(gòu)建平臺,因為業(yè)界開源越來越多,有非常多的單點的整合的各種工具,大家可以去嘗試。
現(xiàn)在底座模型7大方面已經(jīng)有1000多個細(xì)分的維度,雖然應(yīng)用場景我們自己的探索不如全行業(yè)在開源上做的多,但是科大訊飛今天必須是運行在AI之上的微軟公司。
原來我們給央國企、金融與汽車這些行業(yè)龍頭做方案,下一步我們要把這些能力開放給所有人使用,你不用自己建算力,直接租用服務(wù)就行。
甚至我們跟工業(yè)園區(qū)聯(lián)合部署大模型,根據(jù)大模型成效合作分潤。
所以我覺得我們第一,大家要關(guān)注這個業(yè)務(wù),找到切入點。第二,我們正在與許多城市合作構(gòu)建智算生態(tài),例如成都、武漢、無錫、蘇州和溫州。
訊飛是唯一國產(chǎn)算力構(gòu)建的自主可控大模型,未來中國的城市生態(tài)既服務(wù)于本地的創(chuàng)業(yè),又服務(wù)于本地產(chǎn)業(yè)發(fā)展,他們都需要構(gòu)建以算力和底座大模型算力支撐的產(chǎn)業(yè)生態(tài)。
如果大家利用算力,要借助這些生態(tài),這些城市會發(fā)放優(yōu)惠券并且打折,有公共平臺吸引大家。我認(rèn)為我們可以通過這方面拓展技術(shù)賦能和行業(yè)經(jīng)驗,共同站在AI的平臺上共同發(fā)展。
謝謝大家。
排版| 椰子| 允允主編| 孫允廣
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.