近期,中國AI初創企業深度求索(DeepSeek)發布的開源模型DeepSeek-R1,以破圈之勢在全球范圍內爆火,受到了廣泛關注。在中美科技戰的背景下,社會對我國科技創新的關注達到了前所未有的高度。為深入分析和探討DeepSeek爆火對中國創新路徑的影響及如何借鑒其成功經驗,盤古智庫于2月12日舉辦“DeepSeek之爆對中國創新路徑的啟發”研討會。現特將會上專家、業內權威人士的觀點整理提煉,供大家參考。
一、
背景
春節前夕,中國AI初創公司DeepSeek發布的開源模型DeepSeek-R1,以較低的訓練成本,達到與OpenAI的頂尖模型o1接近的性能,并實現開源,顛覆了AI行業認知。而這家初創公司脫胎于一家以量化交易為主的對沖基金,公司85后創始人梁文峰成長于“廣東一個五線城市”,浙大碩士學歷出身,其團隊成員均為本土研究人員。
不在外面融資、不是正規的學術機構,幻方量化創始人梁文鋒用量化基金的利潤,根據自己的愛好,做成了爆火全球的DeepSeek-R1,低成本做出了一個原理接近ChatGPT o1的模型并且開源給了全世界。算力低成本、類o1原理、開源這三個關鍵點,是它產生巨大反響的原因。
二、
DeepSeek的創新點
1. DeepSeek成功地進行了非常系統的再創新。DeepSeek的亮點,按實際價值其實依次是強化學習、混合專家模型MoE、知識與模型蒸餾、多頭注意力、多Token預測、混合精度訓練和PTX等,排序越往前對模型水準的技術價值越大,排序越往后對成本效率的工程價值越高。實質上準確地講,這些技術沒有一項是DeepSeek自己完全原創,但是DeepSeek成功地進行了非常系統的再創新。再創新也是非常重要的創新角度。不管是強化學習還是MoE架構,在每一個方面DeepSeek都有新的突破,這些系統的再創新,使得DeepSeek模型在推理能力方面大大提升,并實現了降本增效,也讓模型能力的展開成為可能。
2. DeepSeek的成功是工程學優化的證明。在目前AI領域幾乎很難有從0到1的原創,OpenAI第一個走出來,利用算力、數據、算法作出了智能涌現。DeepSeek則是把每一個環節做到極致,達到了高質量、低成本的效果。它的成功證明了,以工程學的路徑達到整個系統優化是完全可行的。
三、
DeepSeek產生的影響
1. DeepSeek對人工智能大模型第二階段的產業發展速度有極大的貢獻。OPEN AI 做出了成果卻沒有告訴大家如何實現,還發了一篇論文說過程性激勵和獎勵非常重要,把大家都誤導了。DeepSeek做了一件事情,它發現極簡單:直接給一個結果獎勵,最后推理的路徑就涌現出來了,它對人工智能大模型第二階段的產業發展速度有極大的貢獻——全世界都被OPEN AI帶歪了,而DeepSeek把大家帶回來了,這是特別巨大的貢獻。
2. DeepSeek引起了美西方對中國創新能力的認識轉變,引起了國際資本市場對中國戰略性投資的再思考。
3. DeepSeek給中國在科技領域的形象帶來了很好的改觀。中國在人工智能領域給世界的印象一直是跟隨,諸多人工智能重大貢獻當中來自中國的較少。這次中國公司以“開源”的形式把最好的東西拿出來,顯著提升了中國在人工智能領域的國際形象,展現了中國在科技創新中的主動貢獻。
4. DeepSeek給了整個行業很大的信心。DeepSeek的出現,讓走向最終AGI的信心被確認了。因為系統效率和質量的提高,單位Token的成本急劇下降,一定會導致智算產業的爆發,“杰文斯悖論”再現。DeepSeek給了整個行業很大的信心,無論是政府、投資人,還是上下游鏈條。DeepSeek提振了資本市場信心。DeepSeek對于加大一級市場、二級市場對AI 2.0的信心,對后市場、腰部市場、長尾市場的信心非常重要。
5. DeepSeek出圈提振了各方信心。DeepSeek事件超越了一般的技術創新范疇,產生了極大的影響。DeepSeek的出現讓我們看到中國企業的競爭力不差,甚至可能是在提高的。政府、企業、百姓等各方的信心都有了提升。
6. 對現在DeepSeek的成績,可以感到振奮,但是也不要太高估。因為在歷史上,作為跟隨者、后發者,以更快的速度、更低的成本趕上、甚至某些領域有所超越,這類事情并不少見。對這方面的成績一方面要高興,另一方面要保持清醒的頭腦。
7. 預計很快DeepSeek就會被無數的創新淹沒。如果把DeepSeek爆火這件事放回人工智能2.0發展的時間軸上看,它的影響力可能是有限的,預計很快,這件事在國際上的影響力就會被無數的創新淹沒掉了。DeepSeek是開源的,一旦方向指明了就會有人前赴后繼。未來幾個月的時間里,國際上就會有多款產品超過它,國內也是。
8. 三個“沒有變”使我們在思維上不能過于樂觀。第一,AI發展的大方向沒有變。我們預計在“十五五”末期會看到AGI的更多成果,今天DeepSeek在這個領域取得的成績只是我們在人工智能發展長河當中的一步。第二,中美戰略競爭的位置并沒有根本轉變,我們仍然處在主流跟隨、局部突破的位置。第三,人工智能創新發展的底層邏輯沒有變,就是算力、算法、數據。這三個“沒有變”使得我們在思維上不能過于樂觀。長遠看,包括如何突破算力的芯片,如何突破云計算算力服務的普惠性,依然有很多的工作需要做。
9. DeepSeek帶來了對于創新進行多角度思考的氣象。DeepSeek讓人們對于中國什么樣的地方、什么樣的體系有可能出現創新有了多角度的思考。DeepSeek事件在中國企業創新思想上,可能帶來“文藝復興”的影響力,最近出現了各個角度的探索、分析,的確有這樣的氣象。
三、
關于目前及后續的一些判斷
1. 現在是一個生態涌現時刻,是中國AI 2.0產業市場開始起飛的狀態。從生態涌現角度講,AI大模型會出現一個體量龐大的后市場,大家會用開源模型包括基于閉源模型的API做許許多多的事情,每個開源模型會有成千上萬個分身,各個方面的開發者都會利用這種能力。總體來講,現在是一個生態涌現時刻,是中國AI 2.0產業市場開始起飛的狀態。
2. 各行各業都將做出頂尖的成果,世界將發生巨大的改變。DeepSeek只是我們走向AGI的高峰之一,不是終極的喜馬拉雅山,很快會出現更多的“DeepSeek”。按照目前的方法論和工程學的優化,很多企業也能做出DeepSeek-R1甚至比R1更好的版本。甚至,大家用它的方法論或者工程學,可以在模型、基礎設施、芯片、軟件等各行各業都做出頂尖的成果,這個時候世界就將發生巨大的改變。
四、
關于目前及后續的一些判斷
(一)城市發展
1. 有專家認為,DeepSeek的成功與城市無關。關于“哪個城市更適合于創新”這個話題,DeepSeek這件事跟這些沒有關系——DeepSeek大部分的人是在北京招的,梁文鋒在杭州。DeepSeek對城市、地點這個話題沒有任何啟發,沒有必要花太多時間在地點上。城市應該多思考自己有什么特長,而不是希望重復另外城市的成功經驗。
2. 也有專家認為,DeepSeek和《哪吒2》的成功與城市環境高度相關。從城市發展的角度來看,最近爆火的DeepSeek和《哪吒2》背后的成都和杭州兩個城市有比較類似的特點,一是有很多小微企業,二是親近小微。這兩個地方產生兩個震驚中國和世界的成績不是偶然的。這兩座城市都有類似的注重生態、親近小微和柔性治理的特點,這可能對我們未來的創新路徑和政府在其中應該扮演什么角色有很大的借鑒意義。此外,無論是可可豆還是阿里,從創新到引起關注都走過了差不多10年的歷程,提示我們要有耐心培養環境。
3. DeepSeek這件事引發了一些地方政府的反思,以某城市為例。該城市原來的創新資金投入更多的是和硬件、供應鏈結合在一起,純軟件方向根本無人支持。原來更多的把錢投在高校和科研機構,以后可能要分出一部錢給中小企業,讓土壤更加肥厚,讓更多的小草長大。政府開始注重個性化服務,特別成立了AI的專班,正在研究推出新的政策。
4. 各城市要避免在“比較”中的過度投資。DeepSeek的出現引發了廣泛討論,各地紛紛相互“比較”,探討如何培育類似企業。在此過程中,應避免重蹈覆轍:過去國家主導某些產業政策時,部分城市盲目跟風,導致過度投資和產能過剩,最終依賴低價競爭,損害行業和自身利益。導致我們在許多領域雖有頂尖技術,卻未能實現盈利,如光伏和電動汽車。若不改變這種模式,未來新領域的突破也可能陷入同樣困境。
5. 不要迷信DeepSeek。AI產業每天都有讓人眼前一亮的進展。DeepSeek的成功是曇花一現還是“哪吒問世”依然需要時間來驗證。過早總結和固化DeepSeek的發展模式,并按照這個模式制定監管規則、產業政策,或是投入公共資金遴選、資助特定項目或是公司都將是短視和狹視的行為。
(二)政策與監管
1. 把握好政府的角色。在不同產業和不同發展階段,政府與市場所扮演的角色是不太一樣的。以芯片和AI為例,在芯片領域,我們目前處于明顯的追趕階段,且這一領域的主要挑戰并非來自科學理論,而是工程實踐中的經驗積累。因此,在這一領域,政府的作用較為重要。相比之下,在AI等前沿顛覆性創新領域,政府應更多地扮演“園丁”的角色,專注于營造良好的市場環境,讓創新自然生長。特別是80后、90后和00后,他們往往能夠基于興趣和理想進行創新研究,未來的顛覆性創新有望在這一群體中不斷涌現。
2. 營造更好的創新環境,政府要做好服務,減少不必要的干預。創新的涌現依賴于良好的生態,政府對創新企業最好的支持是在合法前提下減少干預。對初創企業應避免過度監管和大量補貼,容忍類似“千團大戰”的競爭“亂”象,自然競爭有助于市場自我規范。提供包容審慎的監管環境,讓企業在健康生態中成長,而非拔苗助長。
3. 創新點需要慢慢培養。依靠興趣驅動的項目更容易百花齊放、孕育創新點。這些點滴積累為國家實現原創性突破、尤其是從0到1的創新至關重要。它們可以逐步成長,借助創投和企業力量,最終形成具有前沿性和原創性的成果。
4. 要重視企業的主體地位。當前企業的主體地位越來越明顯但政策尚未配套,科研經費和科技力量如何向企業轉移仍需機制支持。盡管高校、院所和國家實驗室成果顯著,但如何賦能企業仍是短板。此外,國企與民企的定位與合作也需進一步明確,以充分發揮各自優勢。
5. 當前形勢對創投提出了更高要求,其能否跟上并發揮作用至關重要。以歐盟為例,其報告指出,歐盟缺乏足夠創投,導致30%在本土創立的獨角獸企業赴美融資并最終成為美國公司。國內類似情況也對創投提出了挑戰,尤其是美元資本回流后創投能否填補空缺成為關鍵問題。此外,目前創投資金主要依賴國有資本,如何在道德風險與不確定性中取得平衡仍未解決,這可能是未來的一大隱憂。
6. 堅持開放。我們要堅持開放,我國科技取得今天的成就是因為開放,未來的發展也要開放。要站在世界舞臺,匯聚全人類的成果。DeepSeek用的是英偉達的芯片和最前沿的、世界通用的Transformer架構以及中國的優秀人才,才有這個結果,也是因為開源得到了世界的認可。
7. 不能把創新的視野局限在眼下的大模型或者其他與此相近的一些創新上。面向AI未來的發展,要打開思路。面向未來,不排除還有其他的模型和其他的路徑。創新的環境要寬泛寬松,當取得目前成績的時候,千萬不要把我們的視野只局限在當下的大語言模型、DeepSeek等等,要注重各種其他的創新,千萬不要把視野鎖定了。
(三)行業與企業
1. 內卷會影響創新,反內卷特別重要。在DeepSeek的API漲價200%-500%區間時,很多云商實施大幅度降價。這種“你漲價我降價”的現象,可以稱之為AI大模型的內卷以及反內卷。AI大模型領域比任何其他領域都更需要反內卷,如果大家都沒有錢掙,就變成了少數人的游戲,創新的玩家沒有造血功能就難以持續、逐漸退出,行業只剩下少數玩家,這會極大妨礙整個創新的進程。我們要警惕高度內卷文化帶來創新成本過高的問題,要警惕“蝗蟲過境寸草不生”的思路,要反內卷。
2. 不要迷信大廠,中小型企業是創新主力。無論是DeepSeek,還是openAI,都不是大廠。事實上,今天的移動互聯網萬人大廠,絕大多數(除了微軟)也不是更早的互聯網大廠。科技產業的顛覆性創新已經多次證明,DeepSeek再次證明,AI產業中,中小型企業是是創新主力。
(四)創新文化
1. 我們不缺錢,不缺技術,也不缺高密度的人才,但是缺包容創新的文化。我們的文化當中要給“非共識”一些土壤,從機制上保證,資源上保證,文化上保證。DeepSeek這件事給中國創新路徑一個最大的啟發,是社會和各級組織要包容那些非共識、非主流、非中庸的人,不光是個人的包容,要變成機制的包容、文化的包容。所有的創新都是對原來領域權威和規則的否定,有時候越前沿的東西越是非共識的,越不是中庸的。“高質量的中庸”就是要包容他們——不是無原則的大力支持,而是包容,給他足夠的空間,中國的文化當中特別需要“高質量的中庸”。在主賽道之外留一塊自留地給那些“非主流”的人,給他們自由生長的空間。
(五)人才與教育
1. 要認識到我國的人才與教育是有優勢的。中國人才基礎龐大,80、90后出生人口最密集,按比例,人才的絕對數量很大。我國人才培養模式也有良好的基礎。目前的北大、清華、浙大等更多更好的學校,包括這幾年國家在教育改革上成立了一些人工智能學院等等,對加速推進在前沿領域的改革創新和落地是非常重要的。據一位專家親身調研觀察,硅谷有兩個現象:一是大廠中華人工程師不低于30%,二是如果初創公司中華人工程師低于30%則表明該公司實力并非特別突出。可見中國的教育體系是有優勢的,培養工程師的制度碾壓世界其他國家。
(六)其他
1. 在創新中,情懷與愛好力量巨大。梁文鋒是根據興趣愛好去做的。他不去做產品,不為了做大公司去融資。他想要做的就是怎么能在 AGI上有突破。因為他本身的動因是情懷,因此他能夠將DeepSeek開源,形成如此巨大的影響力。否則的話,DeepSeek就是另外一個模型。
2. 理想的研究環境與激勵模式。DeepSeek的研究環境有三個關鍵要素:足夠的資源、足夠好的工資、足夠聚焦——找一些足夠好的人,聚焦在一件事情上,做一段時間。OPEN AI在發布ChatGPT之前就是這種狀態。幻方在DeepSeek發布之前也是這種狀態。且中小企業有一定的模式優勢。DeepSeek核心人員可以分享產品商業化過程中一定比例的收益,科學家非常年輕,但對科研自主權的掌握度非常高,所以某種意義上是一種使命驅動、但又有很高回報的激勵模式。
3. 匱乏有時候反而是財富。正是因為算力的匱乏,倒逼DeepSeek做匯編語言方面的編程,做出一系列的創新,最終取得了很好的效果。就像以色列,以色列資源極度匱乏,但反而極度創新,這是值得國內目前處于弱勢地位的行業和機構思考的。
(七)對創新方向的啟示
1. 場景驅動創新。DeepSeek的成功在于其高度優化的場景方法論,通過MoE架構和精細的系統設計,實現了工程學的涌現。其獎勵模型基于真實數據和環境反饋,而非傳統數據標注,差異顯著。同時,DeepSeek通過抓場景讓千行百業找到可結合、可部署的應用場景,這是其破圈的關鍵。
2. 體驗驅動創新。DeepSeek的成功源于產品體驗形成的競爭壁壘,盡管存在幻覺問題,但其低門檻和快速提升的結構化輸出能力支持了廣泛的應用場景。DeepSeek才剛剛起步,未來將涌現更多AI+應用。體驗驅動不僅是DeepSeek的啟示,也是2025年AI應用創業和產品創新的重要方向。
3. 知識驅動創新。無論是什么行業,都有獨有的知識庫——從個人知識庫到企業知識庫。迅速進入到細分場景和領域,迅速進入到千行百業的知識庫,去創造獨有的小場景、小模型和應用,成為更加生生不息的創新生態,也是重要的創新方向。
(感謝陳曉暉、鄧永強 、葛頎 、胡延平 、李志龍 、梁春曉、劉淼、梅德文、孟祥武、秦朔、盛希泰、吳聲、夏春、邢杰、熊園、熊智輝、易鵬、張備、張宏江、張旭、張中祥等提供主要觀點。)
盤古智庫課題組
2024.02.16
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.