全文 2,000字 | 閱讀約5分鐘
DeepSeek本周引發的行業震動,猶如一面棱鏡折射出三大顯性趨勢的璀璨光芒:首先,中國在生成式AI領域正以燎原之勢追趕美國,這必將重構全球AI供應鏈版圖;其次,開源模型正在將基礎模型層轉化為普惠資源,如同普羅米修斯的火種,為應用開發者開啟創新之門;再者,突破算力桎梏的算法革命正以指數級速度降低訓練成本,昭示著AI進化已突破單一依賴算力堆砌的舊范式。
約大約一周前,中國的DeepSeek公司發布了名為DeepSeek-R1的新模型,其在基準測試中的表現幾乎能與OpenAI’s o1媲美。而且,他們以寬松的MIT license公開了這款開源權重模型。上周,我在Davos時,許多沒有技術背景的商業領袖也對這款模型表現出了濃厚興趣。本周一更是在資本市場激起千層浪:英偉達等多家美國科技巨頭股價應聲重挫(截至撰稿時部分有所回升)。
我認為,DeepSeek的現象讓很多人開始重新思考以下幾點:
一、全球AI版圖的重構
中國在生成式AI上的驚人崛起,正以前所未有的速度縮小與 美國之間的差距。回想 2022 年 11 月 ChatGPT 初登場時,美國還在生成式AI 上大幅領先中國,而許多人的思維定式也讓這個印象根深蒂固。然而,短短兩年,隨著 Qwen (我的團隊已使用數月)、 Kimi 、 InternVL 以及 DeepSeek 等多款“中國智造”不斷涌現,中國在視頻生成等關鍵領域甚至已數度搶占國際前沿位置,讓世界為之震撼。
令我異常振奮的是, DeepSeek-R1 采用開源模型形式與全球共享,并附帶詳盡的技術文檔,這與中國科技界"大道至簡,開源為公"的胸懷形成璀璨輝映。反觀部分美國公司,卻借助宣傳“人類滅絕”等夸大的 AI 危機,力圖通過監管抑制開源。事實證明, 開源模型對于全球 AI供應鏈至關重要:眾多企業都將依賴它們。若美國繼續在這一領域設置障礙,中國就有望在全球供應鏈中占據核心地位,從而使更多企業轉向中國企業而非美國企業的技術方案。
二、開源生態的博弈
開源模型正在將 基礎模型層商品化。正如我之前所說, LLM token 的價格已經迅速下降,開源促成了這一趨勢,并為開發者提供了更多選擇。OpenAI的o1每百萬輸出token定價60美元,而DeepSeek R1以2.19美元的價格斷崖式擊穿行業認知。30倍價差的驚雷,炸醒了仍在算力迷宮中徘徊的觀望者。
與此同時,單純依靠訓練基礎模型并向外銷售 API 訪問的商業模式難度不小,許多公司仍在尋找收回巨額研發投入的方法。換句話說, 基礎模型訓練的競賽如同攀登AI領域的珠穆朗瑪——縱然風光無限,沿途卻布滿耗盡資源的骸骨(紅杉資本《AI的6000億美元之問》已深刻剖析此困境)。而真正的金礦,正蘊藏在應用層的熔巖之中:當他人已經在模型訓練上投入了數十億資金時,我們只需花費少量成本,就能把這些模型用來開發客服機器人、郵件摘要、 AI 醫療、法律文檔助手等多種服務。
三、算力的祛魅時刻
曾幾何時,"模型規模即真理"的敘事猶如AI領域的圣杯傳說,讓無數資本在算力競賽的中狂奔。僅僅依靠規模并非通往 AI 突飛猛進的唯一道路。眼下有關擴大模型規模能帶來革命性突破的說法可謂沸沸揚揚。公平而言,我曾經也是這種“大規模”思路的早期擁護者。曾有不少企業以“加大資金投入就能(i)把規模做大、(ii)并且實現預期中的性能提升”為口號,吸引到數十億美元資金。結果,整個行業一度過于癡迷規模,而忽視了其他靈活多樣的創新思路。在當美國芯片禁運的壓力下,來自中國的 DeepSeek 團隊反倒迸發出強大的研發創造力,通過一系列技術優化,成功使模型能夠在性能較弱的 H800 GPUs(而非 H100s)上運行,并且在不計研究成本的前提下,訓練總費用仍控制在 600 萬美元以內,可謂一次令人驚嘆的“低成本高效奇跡”。證明硅基文明的進化論從不只有"大力出奇跡"這單一章節。
歷史總在演繹辯證的輪回:當每個計算單元的成本坍縮,往往激發出更磅礴的需求浪潮。就像蒸汽機點燃工業革命后,人類對動力的渴求反而幾何級增長。至于這種模式是否會真正降低對算力的需求,現在還言之尚早。有時,單個“產品”更便宜,反而會刺激整體采購量增加。我相信,從長遠來看,人類對智能和算力的需求幾乎無上限,因此即便算力成本下降,也不會削弱我們對它的追求,反而會讓其應用場景更加繁盛。
在X平臺的輿論場域,DeepSeek-R1猶如一面棱鏡,折射出觀察者們潛意識的認知光譜:有人看見地緣政治棋局的量子糾纏,有人預見應用生態的寒武紀大爆發。于我而言,。正如我所帶領的團隊已經開始構思的一系列新項目——一旦能夠接觸到這樣的開放式高級推理模型,我們便能構建過去想都不敢想的創新應用。
面向未來,機遇與挑戰并存,而我們擁有無限可能。就像在茫茫海洋上遠眺燈塔一般, AI 的發展正在為全行業指明新航向。每一位投身其中的從業者,都有機會為這場新時代的變革添磚加瓦、作出貢獻。我相信,只要我們秉持遠見,堅守創新精神,就必能在這場智力與技術的浪潮中不斷前行,實現更廣泛的社會價值與行業引領。
參考資料:https://www.deeplearning.ai/the-batch/issue-286/
來源:官方媒體/網絡新聞
排版:Atlas
編輯:深思
主編: 圖靈
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.