網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

為什么BAT沒能做出DeepSeek

2025-02-07 19:15:13　來源: 藍媒匯

天津舉報

分享至

作者 | 葉二編輯 | 魏曉

一夜之間，DeepSeek搶走了幾乎所有國產(chǎn)大模型的風(fēng)頭。

過去一年，無論是在C端出圈的Kimi，還是后在居上的豆包，無論是用戶日活早早突破2億的文心一言，還是登頂全球開源第一的通義千問，與DeepSeek給全球科技圈帶來的震動相比，都遜色不少。

這并非是一眾國產(chǎn)大模型不給力，而實在是DeepSeek太優(yōu)秀了。

以前國內(nèi)大廠一直討論的是，距離OpenAI到底有多少年差距，但在DeepSeeK這里，卻是另一番景象。市場熱議的是DeepSeeK是否已經(jīng)干翻了OpenAI，其所代表的開源路線，已經(jīng)在倒逼OpenAI CEO山姆·奧爾特曼進行反思：“我個人認為，在這個問題上我們站在歷史的錯誤一邊。現(xiàn)在需要想出一個不同的開源策略。”

DeepSeek的橫空出世，其帶來的影響不僅是在行業(yè)內(nèi)，同樣也更在C端市場。

數(shù)據(jù)顯示，僅僅上線20天，DeepSeek的日活就突破了2000萬大關(guān)，成為全球增速最快的AI應(yīng)用。與之相比，ChatGPT突破1500萬大關(guān)花了244天，而DeepSeek僅用了18天。上線20天后的DeepSeek日活已達2215萬，是ChatGPT日活用戶的41.6%，并遠超豆包日活用戶的1695萬。

這是一場極其夸張的AI風(fēng)暴，并且跟以往截然不同的是，這是一家真正由中國創(chuàng)業(yè)公司主導(dǎo)引發(fā)的AI風(fēng)暴。

問題在于，為什么是DeepSeek？

要知道，過去兩年國內(nèi)主流的互聯(lián)網(wǎng)大廠都在大模型賽道上投入重兵，也都跑出了不少產(chǎn)品，市場也普遍抱有期待，希望其中有誰能早上追上OpenAI，與硅谷AI一較高下。

但最終破局的，卻是DeepSeek，大廠沒做到的，它反而實現(xiàn)了。

深耕已久

本質(zhì)上DeepSeek當下的爆火，是一種厚積之下的爆發(fā)。

雖說此次DeepSeek是一鳴驚人，但其團隊早就在AI領(lǐng)域布局多年，時間線上甚至比大廠還早，布局寬度以及深度，也絲毫不比大廠差多少。

公開數(shù)據(jù)顯示，DeepSeek，由知名私募巨頭幻方量化孕育而生，創(chuàng)始人為梁文鋒。

事實上，早在大學(xué)期間，即便在當時，人工智能還是一個空有理論并無實質(zhì)的概念，但梁文鋒無比篤信，“人工智能一定會改變世界”。

這也成為了其創(chuàng)業(yè)以來的終極愿景。

2015年梁文鋒創(chuàng)辦幻方，這是是國內(nèi)最早使用人工智能進行量化交易的公司，2016年第一份由深度學(xué)習(xí)生成的交易倉位上線執(zhí)行，2017 年全面應(yīng)用深度學(xué)習(xí)技術(shù)進行交易。

到了2018年，幻方官網(wǎng)將“把AI確定為公司的主要發(fā)展方向”寫入公司大事，再一年，幻方干脆改變了組織架構(gòu)，成立了幻方AI，對外自我介紹時總說自己是一家以大規(guī)模深度學(xué)習(xí)基礎(chǔ)研究與應(yīng)用為核心的人工智能公司。

自2019年至2021年間，幻方相繼自主研發(fā)了“螢火一號”與“螢火二號”AI集群，其中“螢火二號”投資達到10億元，極大提升算力支持。同時，幻方也積極招募了一批算法科學(xué)家。而創(chuàng)始人梁文鋒本人，則每天也都在寫代碼、跑代碼。

技術(shù)上，一直在穩(wěn)步儲備，基建上，更是沒有落下。

可能很少有人能預(yù)料到，2023年當ChatGPT橫空出世時，市場突然發(fā)現(xiàn)在國內(nèi)，擁有高性能GPU芯片最多的不是人工智能公司，而是梁文鋒旗下的幻方量化。

彼時根據(jù)國盛證券研報，在云算力端，當時除了幾家互聯(lián)網(wǎng)公司（商湯、百度、騰訊、字節(jié)、阿里），就只有幻方有超過1萬張A100芯片儲備。

足見，幻方對AI的投入，對比大廠，絲毫不落下風(fēng)。

反套路

還有就是，以梁文鋒為代表的DeepSeek創(chuàng)業(yè)團隊的銳氣。

互聯(lián)網(wǎng)大廠的AI戰(zhàn)略往往依附于現(xiàn)有業(yè)務(wù)體系。騰訊的AI需服務(wù)于社交與游戲生態(tài)，阿里的AI需嵌入電商和云計算場景。這種業(yè)務(wù)協(xié)同邏輯，固然能快速商業(yè)化，卻也框定了技術(shù)演進的路徑——資源投入越多，越傾向于優(yōu)化既有模式，而非另辟蹊徑。

而背靠幻方的DeepSeek，既有強大的財力支持，又有身為創(chuàng)業(yè)者敢于“從零開始”，不怕試錯的勇氣。這讓DeepSeek只需要沿著創(chuàng)新的信念，一路蹚過去。

對于創(chuàng)新，梁文鋒的態(tài)度是非常堅決的——“過去很多年，中國公司習(xí)慣了別人做技術(shù)創(chuàng)新，我們拿過來做應(yīng)用變現(xiàn)，但這并非是一種理所當然。這一波浪潮里，我們的出發(fā)點，就不是趁機賺一筆，而是走到技術(shù)的前沿，去推動整個生態(tài)發(fā)展。”

“我們看到的是中國AI不可能永遠處在跟隨的位置。我們經(jīng)常說中國AI和美國有一兩年差距，但真實的gap是原創(chuàng)和模仿之差。如果這個不改變，中國永遠只能是追隨者，所以有些探索也是逃不掉的。”

而如何實現(xiàn)創(chuàng)新，則是拋棄慣性的反套路。

最直接的體現(xiàn)，就是在團隊組成上。

圖片來自于幻方官網(wǎng)

國內(nèi)大廠在進入大模型賽道上，通常傾向于去海外挖人，引入技術(shù)大牛，快速拉起一個團隊，然后大干快上。而DeepSeek團隊組多由本土一些Top高校的應(yīng)屆畢業(yè)生組成，不看經(jīng)驗資歷，選人的標準一直都是熱愛和好奇心。

同時在工作機制上，“我們一般不前置分工，而是自然分工。每個人有自己獨特的成長經(jīng)歷，都是自帶想法的，不需要push他。探索過程中，他遇到問題，自己就會拉人討論。不過當一個idea顯示出潛力，我們也會自上而下地去調(diào)配資源。”

“如果有想法，每個人隨時可以調(diào)用訓(xùn)練集群的卡無需審批。同時因為不存在層級和跨部門，也可以靈活調(diào)用所有人，只要對方也有興趣。”

換句話說，大廠的組織架構(gòu)，本質(zhì)是一臺精密運轉(zhuǎn)的“效率機器”。但顛覆性創(chuàng)新的誕生，需要的恰恰是反效率的“失控”。

而DeepSeek正做到了這一點。

AI藍媒匯也就為什么大廠沒有做出DeepSeeK的問題，向DeepSeek提問，后者表示，本質(zhì)上是組織慣性、商業(yè)化壓力與技術(shù)路徑共同作用的結(jié)果，并稱：

這場由開源模型引發(fā)的技術(shù)革命，正在倒逼大廠重新思考創(chuàng)新邏輯。若無法跳出既有框架，其技術(shù)話語權(quán)或?qū)⑦M一步削弱。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.