在閱讀此文之前,麻煩您點擊一下“關注”,既方便您進行討論和分享,又能給您帶來不一樣的參與感,感謝您的支持。
本文內容均引用權威資料結合個人觀點進行撰寫,文中已標注文獻來源及截圖,請知悉。
“不破樓蘭終不還”,華為創始人任正非的這句話,曾激勵無數中國科技人奮勇向前。
如今,在人工智能領域,一位同樣具有“狼性”精神的領軍人物,正帶領團隊打破歐美技術壟斷。他甩出的DeepSeek,不僅在性能上比肩國際頂尖水平,更在開源開放的道路上邁出了關鍵一步。
信息來源:《AI炒股新紀元?頭部量化私募幻方宣布全力探索人工智能應用》,澎湃新聞,2023年4月16日。
他到底是怎樣做到的?
梁文鋒眼光究竟有多超前
2008年,全球經濟被金融海嘯打了個措手不及。那時候,人工智能還遠不是風口,國內互聯網公司忙著掙快錢,誰有心思搞什么底層技術研發?
偏偏有個年輕人,放著大疆不去,一頭扎進了AI量化交易的冷門領域,硬是選了條難走的路。他叫梁文鋒,心里憋著一股勁,不想只做個搭便車的,非要自己成為弄潮。
他認定,中國不能總指望別人“喂飯”,技術這塊硬骨頭,必須自己啃下來。梁文鋒是廣東湛江吳川人,1985年出生,長在農村,爹媽都是小學老師,一家子都實在。他小就安靜,但學習上特別有股鉆勁,腦子也好使,尤其是數學,簡直開了掛。
2002年,梁文鋒去了浙江大學,學的是電子信息工程。后來,他在浙大繼續攻讀信息與通信工程碩士,拜在項志宇教授門下。
在浙大的八年,梁文鋒把全部心血都撲在了學習上。他對計算機和數學簡直著了迷,甚至自掏腰包買設備、零件,搞起了研究,是個不折不扣的技術狂人。
那時候人工智能還遠著,可他就認準了這東西能改變世界。
畢業后,他沒選大廠高薪,而是一個人跑去成都,在出租屋里死磕金融機器學習。2013年,梁文鋒帶著研究成果,跟浙大校友一起,在杭州成立了雅克比投資。
兩年后,又有了杭州幻方科技,也就是后來的幻方量化。
DeepSeek橫空出世
趕上A股大熊市,市場跌宕起伏,可幻方量化卻逆勢而上,規模從10億、30億到60億,一路飆升。
到了2019年,短短四年,幻方量化的盤子就超過了百億。這事一出來,外面說什么的都有。幻方老板梁文鋒倒是不慌不忙,他說這都是公司一點一滴攢下來的,大家伙看到的只是2015年以后的事,但其實他們做了16年。
這份堅持,可不是說說而已。2023年7月,幻方量化直接成立了一家新的人工智能公司——“深度求索”(DeepSeek),擺明了就是要在大模型這條路上走到底。這意味著,梁文鋒徹底從金融圈跨進了通用人工智能的大門。
這之后,還不到一年,2024年5月,DeepSeek就拿出了V2版本的大模型。
這模型厲害了,性能跟GPT-4不相上下,價格卻低到讓人不敢相信,每百萬輸入只要1塊錢,只有GPT-4的七十分之一!這簡直就是AI界的“價格屠夫”,直接把大模型的價格打了下來。
DeepSeek V2 橫空出世,直接把整個AI圈炸懵了。有人猜,DeepSeek 肯定暗中招攬了一批隱世高手。
但實情是,DeepSeek 這支139人的研發隊伍,清一色是國內頂尖高校的應屆生和還沒畢業的博士實習生,資歷最深的也不過畢業幾年。
而且,DeepSeek 給的待遇不輸字節,管理方式卻大相徑庭。這里沒有森嚴的等級,也沒有任何KPI考核。
梁文鋒信奉“無為而治”,他覺得,真正的創新是自發涌現的,不是靠管出來的,所以要給每個人足夠的空間去嘗試,哪怕是犯錯。
DeepSeek 的員工們都明白,這里聚集了一群沒啥經驗但潛力無限的年輕人,以及一種鼓勵創新、允許試錯的氛圍。
最重要的是,就連會議室都設計得與眾不同。
deepseek火遍全球
會議室兩邊都有可以隨意推開的門,用公司同事的話說,這是“給偶然留出空隙”。正是這種由好奇心驅動、為“偶然”預留的空間,讓DeepSeek收獲了意外之喜。
值得一提的是,V2發布之后,國內的互聯網巨頭們,像字節、騰訊、百度、阿里,全都被打了個措手不及,被迫卷入一場價格戰。
媒體把 DeepSeek 形容成一條鯰魚,攪動了整個AI行業。對此,梁文鋒自己都感到意外,他只是按照自己的節奏,根據成本來定價,既不虧本,也不想賺快錢。
就像當初瘋狂囤積GPU一樣,很多人看不懂梁文鋒這一系列“不按套路出牌”的操作,總覺得背后有什么深奧的商業邏輯。
但他的同事們心里清楚,梁文鋒和大家一樣,每天都在看論文、寫代碼、參加討論,完全沒有老板的架子,就是一個純粹的技術狂人。
他所做的一切,無關乎利益得失,僅僅是出于對未知領域單純的熱愛與好奇,這是技術人骨子里的東西。
2025年開年,梁文鋒的公司便扔出了一顆“深水炸彈”——DeepSeekR1推理模型。這東西有多厲害?
性能直接叫板GPT-4o。更讓人瞠目結舌的是,它迅速火遍全球,在美國、中國以及全球其他140個國家和地區的應用商店里,都沖到了下載榜第一。
DeepSeek的橫空出世,把美國股市嚇得不輕,像英偉達這樣的AI巨頭,股價應聲下跌,市值蒸發嚴重。
美國媒體也懵了,完全搞不懂這家中國公司是怎么做到的:這么低的成本,這么小的團隊,怎么就搞出了這么大的動靜?簡直不可思議。
筆者認為
DeepSeek這回是真的讓全世界見識了什么叫中國AI力量,也難怪有人說,他就是AI界的“任正菲”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.