梁文鋒資料圖。
關于DeepSeek梁文鋒的100個細節
作者:王微微
1、1985年,梁文鋒出生在廣東湛江的一個普通的農村家庭,父親是一名小學老師。
2、梁文鋒從小成績優異,小學六年級通過考試被吳川一中錄取。
3、在吳川一中一直是學校里的尖子生,初中就喜歡拆裝電腦。
4、梁文鋒數學方面天賦極大,初中學完高中數學后開始學大學數學到微積分部分。
5、2002年梁文鋒17歲。以吳川一中高考狀元的成績考上浙江大學本科電子信息工程專業。
6、2007年,考上浙江大學信息與通信工程專業研究生。
7、梁文鋒是家族中第一個進入頂尖高校的孩子。
8、在大學期間,梁文鋒與同學一起開始積累市場行情數據和探索全自動量化交易。
9、2008年在浙大讀研究生的梁文鋒察覺到,用技術和數據或許能在市場中找到突破口。
10、2008年,梁文鋒用8萬元本金開始了量化交易之路。
11、2009年讀研期間便應邀加入以實習生身份加入艾麒,擔任新技術部經理,月薪16000元,算高薪特別聘請。
12、2010年6月,25歲的梁文鋒從浙江大學信息與通信工程專業碩士畢業,其畢業論文題目為《一種魯棒的PTZ攝像機目標跟蹤算法》。
13、2015年,以每年超過100%的復合收益率邁入了億元富豪隊伍。
14、「幻方」取自于中國古代洛書《九宮圖》,是一種特殊的矩陣,是科學的結晶與吉祥的象征。
15、梁文鋒的理想是:有朝一日能夠與世界級的量化交易泰斗——西蒙斯的文藝復興公司相媲美。
16、梁文鋒曾為西蒙斯的著作中文版寫過序,其中有一句:「每當工作中遇到困難,我總會想起西蒙斯的話:『一定有辦法為價格建模』。」西蒙斯是一位數學家,也是量化金融領域的先驅,他創立了長島對沖基金文藝復興科技公司,并于20世紀80年代開始使用機器學習技術。
17、2023年,梁文鋒創立“杭州深度求索人工智能基礎技術研究有限公司”,DeepSeek是該公司的深度求索品牌。
18、DeepSeek團隊規模不大,不到140人,成員多來自清華、北大、北航等應屆博士畢業生、在讀生以及碩士生,工作經驗不超過5年,大多是數學競賽一等獎、拿過國際金牌的算法人才。
19、團隊沒有海歸,完全本土人才。成員們普遍具有強大的學術背景和科研能力。
20、梁文鋒常常一整天都待在辦公室里,半天都不出來一次。
21、梁文鋒為人沉著冷靜,低調內斂、性格簡單直接、不善言辭,內心富有激情。
22、梁文鋒的一位商業伙伴向《金融時報》描述他為一個留著可怕發型的書呆子。
23、雖然沉默但在技術交流中梁文鋒能夠清晰地表達自己的觀點,邏輯思維能力非常強大。
24、對產品和技術有極高追求,是典型的技術男風格。
25、曾管理過多位算法工程師,采用扁平化管理方式,給予團隊成員充分的自由和信任,帶領團隊攻克了多項技術難關,發揮每個人的特長。
26、研究怎么把機器學習用在量化交易領域。嘗試用各種算法模型來預測股市走勢,沒日沒夜地寫代碼、調參數,常熬夜到凌晨。
27、難題是數據。四處搜集、托關系從金融機構獲取數據后開始建模,不斷優化模型參數,提高預測準確率。
28、利用模型預測股指期貨的漲跌,進行高頻交易,交易很快就獲得了豐厚的回報。
29、2025年1月20日,中共中央政治局常委、國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,梁文鋒在會上發言。
30、梁文鋒用人標準是熱愛和好奇心,而非經驗,因為他認為「創新需要擺脫慣性,經驗有時會成為包袱。」
31、梁文鋒對新人招聘薪資高、愿意給實習生很大機會。
32、創業后梁文鋒開放了萬卡免費提供給各大學用于科研,為推動學術研究貢獻了一份力量。
33、幻方量化向慈善捐款超過2.21億。其中個人捐款1.38億元,署名是「一只平凡的小豬」,無人知他是誰,員工猜測是梁。
34、在艾麒信息時,他就利用業余時間默默為量化投資做準備,提前布局。
35、梁文鋒實習公司老板給他建議:要做毛利高的業務。
36、2023年5月梁文鋒又回到實習公司艾麒信息做調研。
37、DeepSeek自己開發了更高效的算法和萬卡架構。減少了對高性能硬件如GPU的依賴,大幅降低硬件成本、充分提高了GPU的利用率。
38、一個注冊地是吉隆坡,注冊于1993年有效期至2031年的簡短域名ai.com,定位至DeepSeek,此前該域名曾長期定位至ChatGPT和馬斯克的xAI官網。
39、DeepSeek-R1推理大模型以超低的成本實現了與OpenAI GPT-4相當的性能表現,被業內譽為大模型行業的最大黑馬。
40、2025年1月27日,DeepSeek的應用程序成功登頂蘋果中國和美國地區免費下載榜。
41、1月27日,DeepSeek美區超越ChatGPT,成為下載量最大的免費應用。
42、2015年30歲的梁文鋒與徐進正式創辦幻方量化(High-Flyer)。一年內成立了20只產品,迅速成為量化投資領域的佼佼者。
43、隨后幾年,梁文鋒不斷擴大AI算法研究團隊,將人工智能技術深度融入量化策略。
44、2021年8月,幻方量化的資金管理規模一度突破千億,與九坤投資、明汯投資、靈均投資一起,被業界稱為量化私募領域的“四大天王”。
45、梁文鋒在金牛獎頒獎典禮上,指出「量化投資的未來,是用技術讓市場更有效率」。
46、梁文鋒手握天量私募,親自寫代碼。
47、梁文鋒一直隱形在幕后很少公開露臉,朋友圈一年幾乎只發一條信息。
48、DeepSeek的目標是用低成本、高性能的技術,打破國際巨頭在人工智能領域的壟斷。
49、2024年5月,DeepSeek發布其首款混合專家語言模型DeepSeek-V2。憑借出色的性能和性價比,引發了一場大模型價格戰,國內外科技巨頭紛紛跟進降價。
50、出現在2024年12月Deepseek公開了由梁文鋒、羅福莉等人撰寫的53頁論文《DeepSeek-V3 Technical Report》,訓練成本僅為557.6萬美元(OpenAI的GPT-4o訓練成本高達7800萬美元)。
51、DeepSeek-V3以1/10的成本實現了對GPT-4o的全面對標,被美國科技圈稱為「來自東方的神秘力量」。
52、雷軍挖走的90后天才少女羅福莉來自梁文鋒的DeepSeek團隊。
53、DeepSeek采取了開源的技術策略,主動向全球開發者社區分享核心技術成果。不僅贏得國際認可也推動行業技術生態的快速發展。
54、DeepSeek通過自主研發,放棄了英偉達芯片調度算法,自己開發了更高效的算法和萬卡架構,在算法和架構上進行了深度優化,減少了對高性能硬件如GPU的依賴,大幅降低硬件成本、充分提高了GPU的利用率。
55、梁文鋒曾表示,「我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚。」
56、梁文鋒將自己進入人工智能模型領域,描述為一名對探索計算機學習極限充滿好奇的工程師的自然發展。
57、開源更多是一種文化,而非商業行為,梁文鋒認為為開源做貢獻能贏得尊重。
58、梁文鋒不太在意穿著和發型,喜歡基于公式和計算做決策。
59、梁日常著裝低調,參加調研時捧著保溫杯,穿深藍色的工裝絨棉襯衫,身形瘦削,略顯拘謹,如同上世紀90年代工程師的模樣。
60、買了新房卻因醉心于開發策略而無心裝修,梁文鋒在房間里支帳篷睡覺。
61、同事說梁文鋒除了編程,沒有其他愛好。
62、梁文鋒面對所有專業問題,對細節毫不回避,對監管政策熟稔于心。
63、梁文鋒認為自己不過是站在開源社區巨人們的肩膀上,給國產大模型這棟大廈多擰了幾顆螺絲。
64、梁文鋒說DeepSeek的考核標準和一般公司不太一樣:「我們沒有KPI,也沒有所謂的任務」。
65、想做不收業績報酬和管理費的公司。
66、2019年,公司投入近2億自有資金研發深度學習訓練平臺「螢火一號」,螢火一號占地面積差不多有一個籃球場大。
67、2021年,「螢火二號」的投入高達10億,螢火二號預期一個機房面積差不多是10個籃球場。
68、梁文鋒說:「無論API,還是AI,都應該是普惠的、人人可以用得起的東西。」
69、2024年12月16日,梁文鋒朋友圈轉發了他為「量化之王」詹姆斯·西蒙斯傳記《征服市場的人:西蒙斯傳》所做的序言,并評論:「3年過去了,舊世界分崩離析,新時代正在光速到來。」
70、業內人士樂觀估計,梁文鋒持有的DeepSeek股份價值將達到1260億美元,甚至可能超過身價1180億美元的黃仁勛。
71、2021年,當幻方量化業績出現回撤時,梁文鋒就開始謀劃新的布局。他在運營High-Flyer期間開始從Nvidia(英偉達)購買數千塊GPU,一張A100顯卡的價格就十幾萬。
72、2023年時國內擁有超過1萬枚GPU的企業不超過5家,其中便包括幻方。幻方是大廠外唯一一家儲備萬張A100芯片的公司。
73、按照彭博億萬富翁指數的中間值進行估算,DeepSeek的估值大約在20億至300億美元;而持有公司84%股份的梁文鋒,其身家可能處于16.8億到252億美元之間,這使他有望躋身亞洲最富有的科技大亨行列,甚至有問鼎中國首富的可能性。
74、梁文鋒曾是幣安的早期成員。
75、DeepSeekV2的開源模型價格:推理成本被降到每百萬token僅1塊錢,約等于Llama 3 70B的七分之一,GPT-4 Turbo的七十分之一。
76、2013年梁文鋒與同學徐進共同創立了杭州雅克比投資管理有限公司。
77、2015年杭州幻方科技有限公司成立。
78、2016年是幻方科技的重要轉折點,當年,公司推出首個基于深度學習交易模型,實現所有量化策略的AI化轉型。
79、2018年,幻方科技正式確立了以AI為核心的發展戰略。
80、梁文鋒做DeepSeek的出發點不是趁機賺一筆,而是「走到技術的前沿,去推動整個生態發展」。
81、2025年1月DeepSeek用戶增長達1.25億,實現了7天完成1億用戶增長。ChatGPT用了2個月。
82、梁文鋒于2025年1月28日(除夕)回到米歷嶺村過年,1月29日(大年初一)上午離開家鄉。
83、梁文鋒同鄉說梁文鋒比較內向,過年過節回家一般也不怎么出門,蛇年他的鄉親在村口拉橫幅歡迎。
84、梁文鋒認為創新就是昂貴且低效的,有時候伴隨著浪費。
85、2025年1月28日,據央視新聞,DeepSeek突然遭受大量海外攻擊。
86、除了工作,梁文鋒還熱愛足球。
87、梁文鋒堅信「AI一定會改變世界」。
88、《山丘》雜志:「DeepSeek R1 就是 AI 的斯普特尼克時刻」。斯普特尼克是蘇聯發射的人造衛星,它開啟了人類的太空時代。
89、梁文鋒認為「一件激動人心的事,不能單純用錢衡量」。
90、最近的一筆捐款發生在2025年1月10日,西藏日喀則地震后,幻方量化向災區捐贈100萬元救災款。
91、搶用戶并不是我們的主要目的。無論API還是AI,都應該是普惠的、人人可以用得起的東西。
92、OpenAI募集了143億美元,花十年時間,而DeepSeek僅僅用了一年多時間。
93、一間位于DeepSeek樓上的風投公司稱因幻方大模型業務沒有拆分獨立融資計劃,所以無法成為其投資人。
94、技術沒有秘密,但重制需要時間和成本。
95、梁文鋒不做垂類和應用,而是做研究,做探索。
96、2月11日法國巴黎的人工智能峰會上,梁文鋒借助量子全息投影技術進行智能會議演講,畫面清晰細致到毛發根根分明,畫面延遲僅有1.2毫秒。
97、一位小紅書用戶發筆記稱其夫在一場婚禮中遇見梁文鋒,他還在桌前寫代碼,飯后搭其順風車。
98、梁文鋒研發團隊在海淀區北京融科資訊中心C座5層,華為最近也租下了數千平辦公區。物業方在樓下掛出了DeepSeek的銘牌,第二天便摘除了。早期梁文鋒團隊曾在中關村區域的互聯網金融中心WeWork過渡,這里靠近清華北大中國科學院等頂級院校。
99、融科資訊中心的保安高峰期每天要攔阻超過30位企圖登門的拜訪者。
100、如果用deepseek搜索任何關于梁文鋒的內容,得到的答復都是:「這個問題我暫時無法回答,讓我們換個話題再聊聊吧。」■
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.