全文 4,000字 | 閱讀約10分鐘
我們缺乏的不是資本,而是創新的信心和組織創新的智慧 —— 梁文峰
【核心內容速覽】
顛覆者梁文峰:一個工程師眼中的創新重構;
創新密碼破譯:從水稻文明到AI前沿的進化邏輯;
反常識實驗:DeepSeek如何突破傳統創新約束;
新范式誕生:當中國開始影響全球創新規則。
當DeepSeek的多頭潛在注意力架構將Transformer內存成本削減90%的消息傳出時,整個AI學界為之震動。這不僅僅是一個技術突破,更是一個文明拐點的隱喻。而在這個關鍵時刻,DeepSeek創始人梁文峰正在進行著一個更大膽的實驗 —— 在規避風險、漸進改良被視為理所當然的創新土壤中,重新定義中國的創新方式。
為什么是DeepSeek?為什么是現在?當我們試圖解答這個問題時,傳統的技術視角似乎難以自圓其說。硅谷著名AI研究者Teortaxes對此有著獨特的見解。作為從2023年就開始深入研究DeepSeek的觀察者,他提供了一個更為宏大的敘事框架:一個跨越千年稻作文明、跨越工業革命、直至人工智能時代的歷史長鏡頭。在這個框架下,梁文峰和DeepSeek的崛起不再是一個孤立的技術現象,而是一個文明在面對新邊疆時的覺醒時刻。
刻板印象往往像一面哈哈鏡,將復雜的現實扭曲成簡單的標簽。但如果我們把它當作一個棱鏡,或許能透過它看到更深層的真相:所謂的"創新基因"、"模仿思維",都不過是特定歷史條件下的理性選擇。當條件改變時,我們熟悉的一切都將重新洗牌。這正是梁文峰通過DeepSeek要證明的命題。
原文如下:
作者:Teortaxes
一、刻板印象的形成
國家層面的刻板印象,往往是在某些“反應型特征”的維度上不斷累積,再因路徑依賴而定型?!暗久桌碚摗彼沂镜臇|亞心理(即將密集型農業與規避風險、從眾服從,以及“勤能補拙”的行事風格相關聯)并非無中生有或純粹的東方主義偏見。研究(如 Talhelm 等人,2014)表明,南方的水稻種植區與北方的小麥種植區居民在認知方式上確有可測量的差異:南方人更傾向于整體思維和社會協作。這些特質的形成源于古代生存策略:在一塊塊歷經千年耕耘、幾乎寸土寸金的土地上,冒進式的嘗試可能釀成饑荒,而細致入微的優化卻能帶來穩定。
然而,刻板印象不等同于宿命,它只是與文化及環境刺激相互演化后產生的一種策略性傾向,而非某種不可改變的本質。環境參數一旦更易,文明血脈自會孕育全新心智。如今,“DeepSeek”正以實際成果對全球創新做出可量化的貢獻,恰恰彰顯了這份潛在的可塑性。他們的突破(從開源模型震撼硅谷"自由派"大佬、迫使后者向政府尋求庇護,到對 Transformer 架構的全新構思)都在質疑“快速跟跑者”的陳詞濫調。似乎,中國人從來不乏創造力,只是過去在推演中將其視為"不經濟"的選擇罷了。
二、歷史軌跡的差異
西方神話避諱封閉的中央之國的愿景,而浪漫化探索精神 —— 從哥倫布到SpaceX —— 但這是獨特歷史軌跡的遺產。歐洲的人口因黑死病減半,創造了土地和機會的真空;美國的邊疆直到1890年才關閉。與此同時,中國的長江三角洲在宋朝時期(1000年前)就已達到承載極限。創新變得漸進:在固定邊界內提高產量,而不是尋求新的視野。水車得到優化,但沒有蒸汽機。稅收登記得到改進,但沒有科學革命。即便在最高層次的國家政策上,明朝的寶船下西洋最終也只是一個代價高昂的虛榮項目,之后便回歸到歷史均值,而不是中國殖民時代的先驅。
這并非是缺乏神圣火花,而是理性分配認知資源的局部最小值。高人口密度有利于"開發型智慧" —— 用已知條件最大化資源提取強度 —— 而非探索性冒險。中國歷史上缺乏激進創新者,這類似于一種社會納什均衡:當每個人都穩健行事時,背離者(探索者)會面臨不成比例的懲罰。這解釋了東亞較高的平均智商分數和中國在國際數學奧林匹克競賽中的優勢,但在諾貝爾獎或菲爾茲獎獲得者方面的歷史性稀缺。差距不在于原始認知能力,而在于文化激勵:創造力只有在社會獎勵探索的賭注時才能蓬勃發展。
具有諷刺意味的是,西方可能正在快速追隨這一軌跡。那些智商測試,設計于工業化的"開發"時代(源于工業革命的普及教育和效仿泰勒制,以及二戰后文憑競爭的爆發),獎勵密集型問題解決、在約束條件下的模式匹配 —— 這是在水稻田文明中不可或缺的技能;但硅谷及其微不足道的等價物構成了最后的邊疆,這也需要勇氣去超越熟悉的約束。不過,這次或許東方也能收獲邊疆的饋贈。
三、DeepSeek作為引發相變的種子
DeepSeek 創始人梁文峰,正從根本上挑戰中國“創新均衡”現狀。他的行動方案在商業策略層面已然獨樹一幟,但更引人注目的是,它還可被視為一個大型“范式轉移”的原型,對導致系統性風險規避的先驗因素進行了精確定位。
開源至上
在一片被 NDA(保密協議)籠罩、前沿研究難見天日的時代,DeepSeek 選擇公開發布最先進的模型和技術報告,將“原創”從高風險的賭博變成一種“地位競賽”,并因此獲得了學術界難以企及的真實權威。對貢獻者而言,這等于是讓他們在全球范圍內積累聲望。“給予本身就是一種榮耀”,梁文峰如是說。DeepSeek 因此成了中國頂尖人才趨之若鶩的“綠洲”。
唯才是舉
無論是文學專業背景還是信息學奧賽冠軍,都能在公司內部自由探索研究方向,無需經過層層審批,而是各自協調,近似于硅谷式的“混沌精英制”。
后勤充沛
自招聘起就宣傳的充沛算力池,與綠燈常亮的扁平組織架構,都試圖構建出一個輕松的前沿探索環境——畢竟所有的挑戰都聚焦在待解決的終極難題上。
杜絕內耗
前員工曾透露,DeepSeek 力圖避免“螃蟹互扯后腿”的內耗,而這種內耗在某些大廠并不少見。在 DeepSeek,成員身處壓力更小、氛圍更和諧的環境,有助于集中火力沖擊外部競爭與更高難度的技術目標。
這一系列舉措正在打破刻板印象,也在西方創新中心引發困惑與反思。DeepSeek 提出的多頭潛變量注意力(MLA)架構,將 Transformer 的內存開銷降低了 87% 到 95%,而此前業界對超越多頭注意力(MHA)到單頭注意力(MQA)優化的帕累托邊界信心不足,更遑論在生產環境大規模實踐?,F在,西方實驗室紛紛引入 DeepSeek 最佳實踐,顛覆了以往默認的“創新順序”。他們在前沿開源模型方面的布局,重塑了整個大型語言模型(LLM)推理的市場格局;他們的 R1-Zero "重磅炸彈"則讓強化學習(RL)再現生機。媒體也看到了這層反諷——《金融時報》戲謔地指出:“至少目前看來,這是一個‘中國創新,美國模仿’的逆轉場景。”
四、梁文峰賭注
梁文峰正在押注(且已部分贏得注腳)的是,DeepSeek 能在中國“創新-模仿”的謝林點(博弈論中人們在沒有溝通的情況下的選擇傾向)上動搖現有均勢,具體而言:
證明探索回報
可觀利潤加上全球聲譽,讓那些高遠目標的“天馬行空式科研”看起來不再是空耗。我們已見 Minimax 開始模仿 DeepSeek 的開源策略,甚至連論文發布模式都如出一轍。
創造外溢效應
基于 DeepSeek 開源技術的初創公司,可將更多研發資金投向其他創新方向。他們的混合專家(MoE)設計也逐漸成為國內 AI 公司在大規模模型架構上的事實標準。
重塑人才市場
頂尖人才如今更樂于將基礎 AI 乃至 AGI(通用人工智能)研發視為真正可行的職業道路,而非相對于傳統高薪行業的“堂吉訶德式”浪漫嘗試。這股風潮正在形成,即便并非單靠 DeepSeek 一家之力推動。
當然,阻力猶存。中國風投界一貫偏好對成熟模式套利(如復制 Uber 或 Airbnb),對高風險研發則顯退縮。即便是雄心勃勃的 DeepSeek,也只能在明顯有限得多的資金下勉強運轉。梁文峰早期幾次融資嘗試,都只迎來悲觀懷疑。他曾指出:“我們經濟總量不低,大公司如字節、騰訊利潤也不低。但為何不創新?不是沒錢,而是沒信心,不知如何將高密度人才組織起來,做出真正有效的創新?!苯鉀Q方案很多,但最終能否凝結成真正成果,仍是未知數。
用一個比喻難以涵蓋全部。系統性轉變需要的絕非某個概念驗證就能達成。從以高考為中心的教育體系,到企業的層級管理制度,中國主流機制依然更傾向于鼓勵從眾與漸進式思維。梁文峰的項目,會否復制日本二戰后從"粗制濫造"到豐田生產體系與半導體問鼎世界的華麗轉身?也許有可能,但也需更多資源配合……或者最終難免歸于更宏大的歷史慣性。
五、好戲才開始上演
DeepSeek 告訴我們,文化特質并非一成不變的劇本,而更像是一種隨環境演變而變化的均衡態。中國歷史上以風險規避為主的“存量智慧”思路,在人口稠密、資源相對緊張的社會里曾合乎邏輯。但如今,隨著龐大資本與海量受過高等教育的人才不斷涌現,這套模式卻因慣性而遲遲無法切換,讓原本大好的“視界”未被開發。
梁文峰能否成功推行他的“根本性去風險化”(meta derisking),取決于 DeepSeek 能否如他所設想的那樣,催生更廣泛的生態系統——一個激勵良性循環的“飛輪”,而非只是依賴大數據或算力的堆積。一燕非春,猶覺寒消;一葉知秋,可窺歲暮。要讓中國真正摘掉“快速跟隨者”的帽子,需要讓各種制度對“高熱度天才”提供同等甚至更高水平的激勵,就像當年水稻社會對耐心與嚴謹的褒獎一樣。換言之,這需要
?改造教育體系,讓好奇心被更多鼓勵,而非只注重刷題熟練度;
?引導資本更多投向高風險、高回報的“登月計劃”,而非簡單的“套利模式”;
?鼓勵投資人像硅谷那樣看待失敗,將失敗視為一種數據和經驗,而非恥辱。
究竟 DeepSeek 會只是曇花一現的特例,還是會成為“成功企業”的新樣板?答案恐怕不只取決于梁文峰個人執行力,更取決于這個風險規避體系能否掙脫數百年來為求生存而深深鐫刻的本能。如果有朝一日真能做到,這些刻板印象也將不再具有現實意義——并非它們一開始就有錯,而是它們所賴以存在的環境條件已不復存在。萬花筒終將帶來新的視界。
全世界都在密切而又帶著幾分敵意的心態觀察這一實驗。比起 Meta那些“作戰室”的威脅,美國政府若想“截胡”這股嶄新的中國人才與技術動能,或許更值得警惕;但最大變數仍可能來自公司自身?;蛟S真正的“最后邊疆”并不在于能否將運載火箭成本降到最低,也不在于能否通過推理算力堆積來達到 AGI 級別,而是要把一個文明的集體思維從舊有均衡狀態中喚醒,讓它去適配當下與未來的需求。
參考資料:https://x.com/teortaxesTex/status/1885678099653697555
來源:官方媒體/網絡新聞
排版:Atlas
編輯:深思
主編: 圖靈
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.