DeepSeek又「炸」出圈了,這次不是因?yàn)楣δ芎瓦壿?,而是因?yàn)橐粋€(gè)震撼業(yè)界的舉動(dòng)——開源工作代碼。
開源第一天,DeepSeek亮出核彈級(jí)技術(shù)——FlashMLA正式開源!這是用于 Hopper GPU 的高效 MLA 解碼內(nèi)核,針對(duì)可變長(zhǎng)度序列進(jìn)行了優(yōu)化,現(xiàn)已投入生產(chǎn)。
具體亮點(diǎn):
BF16精度全解鎖
64位分頁KV緩存(內(nèi)存焦慮退退退!)
H800實(shí)測(cè)炸裂:3000GB/s內(nèi)存吞吐 + 580T算力天花板!
許多網(wǎng)友發(fā)問:為何要將辛苦研發(fā)的成果免費(fèi)分享?背后其實(shí)蘊(yùn)含著深刻的“開源精神”。
提到開源精神,不得不說起經(jīng)典著作《大教堂與集市》。書中以“大教堂”和“集市”代表兩種截然不同的開發(fā)模式,為我們展現(xiàn)了開源世界的獨(dú)特魅力。Linux操作系統(tǒng)的誕生,便是開源精神的生動(dòng)詮釋。1991年,芬蘭大學(xué)生李納斯·托瓦茲出于個(gè)人對(duì)UNIX操作系統(tǒng)的向往,課余用家用電腦編寫內(nèi)核,并分享到互聯(lián)網(wǎng)社區(qū),吸引眾多程序員參與,最終讓Linux成長(zhǎng)為全球重要的開源操作系統(tǒng)。這一過程完美體現(xiàn)了開源的底層邏輯:源于個(gè)人需求、早發(fā)布常發(fā)布、并非單純出于高尚道德,而是開發(fā)者與社區(qū)相互成就。
如今,DeepSeek的開源舉措,恰似復(fù)刻Linux的傳奇之路,卻又青出于藍(lán)而勝于藍(lán)。它不僅開源工作成果,還將工作細(xì)節(jié)毫無保留地公開,讓全球開發(fā)者能清晰看到其研發(fā)過程。這種極致的“早發(fā)布,常發(fā)布”,為行業(yè)發(fā)展注入了新的活力。DeepSeek掀起的這場(chǎng)技術(shù)海嘯才剛剛開始,本篇文章,將深入探究DeepSeek開源背后的故事。 以下,Enjoy:
本文授權(quán)轉(zhuǎn)載自公眾號(hào)“快刀青衣” ????
最近DeepSeek很火,已經(jīng)火到了各行各業(yè),以至于有一些很多年沒有跟我聯(lián)系過的好朋友,都開始在微信上私信我:“DeepSeek到底是個(gè)啥?”
我大部分時(shí)候都會(huì)說:“就是一款超強(qiáng)的開源模型,能自己推理、自己思考。開源就是把代碼全放出來,大家隨便用?!?/p>
當(dāng)我這么說了之后,下一個(gè)問題一般都是:“為啥???他們做出來的東西為啥免費(fèi)給別人用啊?”
其實(shí),這背后就是“開源精神”。
可能聽到這里,你也好奇,什么是“開源精神”?
對(duì)于這個(gè)問題,我推薦大家去讀一本經(jīng)典老書,名字叫《大教堂與集市》。
今天,我將結(jié)合《大教堂與集市》這本書的內(nèi)容,跟你科普一下什么是開源精神,也進(jìn)一步聊聊這輪DeepSeek開源模型的爆火,將對(duì)整個(gè)社會(huì)的技術(shù)發(fā)展帶來什么影響。
01
這里沒有象牙塔,只有純粹的車庫精神
在分享本書之前,我先跟大家分享一個(gè)最近看到的信息。
昨天中午,2025年2月21日12點(diǎn),DeepSeek團(tuán)隊(duì)在X平臺(tái)發(fā)布了一段英文內(nèi)容。
我用DeepSeek把它翻譯過來了,給大家分享一下:“我們是一個(gè)探索通用人工智能(AGI)的小型團(tuán)隊(duì)。我們將開源5個(gè)代碼倉庫,以完全透明的方式分享我們微小但真誠的進(jìn)展。這些在在線服務(wù)中經(jīng)過完整文檔記錄、部署和生產(chǎn)環(huán)境實(shí)戰(zhàn)檢驗(yàn)的基礎(chǔ)模塊,雖然謙遜但足夠堅(jiān)實(shí)。作為開源社區(qū)的一員,我們相信每一行共享的代碼都將轉(zhuǎn)化為加速探索進(jìn)程的集體動(dòng)能。每日解鎖即將到來——這里沒有象牙塔,只有純粹的車庫精神與社區(qū)驅(qū)動(dòng)的創(chuàng)新?!?/p>
有些同學(xué)可能不是從事軟件行業(yè)的,我來簡(jiǎn)單解釋一下,DeepSeek說的其實(shí)就是:從本周開始,他們將把每天的工作代碼開源出來。
能做出這樣的行動(dòng),是非常有魄力的。
你可能要問,這跟之前開源DeepSeek R1模型有啥區(qū)別?
我給你打個(gè)比方,之前開源的是工作成果,就像一個(gè)老師傅,把他所有的經(jīng)驗(yàn)無私傳授給你。而現(xiàn)在,你不但能拿到老師傅的秘籍,還能看到老師傅在過程中是怎么干活兒的。這對(duì)很多人來說,會(huì)比結(jié)果更有價(jià)值。
不出所料,看到這條內(nèi)容的各國網(wǎng)友都反響熱烈。第一條評(píng)論就寫道:“這才是真正的Open AI!”他們故意把“Open”和“AI”之間加了個(gè)空格,這話說得恰到好處,不僅是對(duì)DeepSeek的贊美,還順便對(duì)山姆·奧爾特曼率領(lǐng)的OpenAI發(fā)起了一波嘲諷。
02
開源的“命運(yùn)齒輪開始轉(zhuǎn)動(dòng)”
接下來,咱們進(jìn)入正題。
咱們先從書名說起,大家可能都會(huì)好奇,一本講技術(shù)文化的書,為啥會(huì)有“大教堂”和“集市”這兩個(gè)詞?到底是什么意思?
其實(shí),作者是用“大教堂”和“集市”這兩種形態(tài),來代表兩種不同的開發(fā)方式。“大教堂模式”就像是一個(gè)宏大的規(guī)劃,先列好長(zhǎng)遠(yuǎn)的目標(biāo)和計(jì)劃,可能是五年、十年的打算。然后,一小部分領(lǐng)導(dǎo)或資深專家來主導(dǎo),下面一層層管理、協(xié)作,直到最后按部就班地完成某個(gè)任務(wù),等到發(fā)布的那一刻,才一鳴驚人。
而“集市模式”,你可以把它想成一個(gè)熱鬧的菜市場(chǎng),里面有賣菜的、賣魚的,也有買東西的、閑逛的。這里沒有統(tǒng)一的領(lǐng)導(dǎo),也沒有明確的開發(fā)目標(biāo)或盈利方向。大家在這里各自為營,雜亂無章,卻依然保持著獨(dú)特的生命力,充滿了無限的可能和活力。
那什么是開源精神呢?
開源,簡(jiǎn)單來說,就是一個(gè)技術(shù)人或者團(tuán)隊(duì)將自己的所有代碼無私公開,全球的開發(fā)者都可以免費(fèi)獲取、學(xué)習(xí),甚至修改和應(yīng)用到自己的項(xiàng)目中。我之前提到過的GitHub就是全球最大的開源社區(qū)。
回到《大教堂與集市》這本書,作者埃里克·史蒂文·雷蒙德(通常稱為ESR),他不僅是經(jīng)驗(yàn)豐富的程序員,同時(shí)也是開源運(yùn)動(dòng)的旗手。
這本書的核心案例是開源操作系統(tǒng)Linux的故事。雖然大部分普通用戶對(duì)微軟的Windows系統(tǒng)或蘋果的MacOS更為熟悉,但實(shí)際上,我們生活中用到的很多網(wǎng)站服務(wù)器、智能家電,甚至路由器的底層系統(tǒng),都在使用Linux。而且,安卓手機(jī)的底層內(nèi)核也是基于Linux的。所以說,事實(shí)上,我們幾乎都是Linux的用戶,只是很多人并不知情。
而Linux的背后,其實(shí)有一段非常有意義的故事。
1991年,一個(gè)名叫李納斯·托瓦茲的芬蘭大學(xué)生,在課余時(shí)間用自己的家用電腦,想體驗(yàn)一下類似早期大型機(jī)上才有的UNIX操作系統(tǒng),于是他開始重新編寫內(nèi)核。
乍一看,這只是個(gè)大學(xué)生的玩票項(xiàng)目。但他并沒有止步于此。他把自己寫的源代碼上傳到了互聯(lián)網(wǎng)社區(qū)上,并且邀請(qǐng)其他程序員一起來改改看。
用一句特別俗套的爛梗,那就是“命運(yùn)的齒輪開始轉(zhuǎn)動(dòng)”。這件事,成了開源運(yùn)動(dòng)的重要里程碑。隨著越來越多的程序員參與其中,大家一起修復(fù)Bug、改進(jìn)代碼,Linux逐漸變得越來越強(qiáng)大。因?yàn)槊總€(gè)人都可以看到源代碼、修改代碼,并將自己的修改貢獻(xiàn)回來。隨著時(shí)間的推移,Linux社區(qū)從最初的一個(gè)“學(xué)生項(xiàng)目”成長(zhǎng)為全球最活躍、最成熟的開源操作系統(tǒng)之一。
03
開源,讓我印象深刻的三大底層邏輯
當(dāng)然,除了講述Linux的故事,這本書還深入探討了開源的核心理念,并詳細(xì)解釋了為什么開源運(yùn)動(dòng)能夠取得成功,其中有三條底層邏輯讓我印象深刻:
1.好的軟件品,往往源自開發(fā)者的個(gè)人需要
在開源世界里,無論是項(xiàng)目的發(fā)起者,還是遍布全球、不計(jì)報(bào)酬地提交Bug反饋、修復(fù)代碼的貢獻(xiàn)者,很多人參與的動(dòng)力其實(shí)都很簡(jiǎn)單,就是因?yàn)樗麄冏约盒枰@個(gè)工具。
要知道,現(xiàn)實(shí)中有大量程序員對(duì)自己開發(fā)的軟件并沒有太多熱情,他們只是把編程當(dāng)作一份糊口的工作,每個(gè)月拿著不菲的薪水,完成任務(wù)就好。但在開源社區(qū),情況完全不同。很多程序員大神,哪怕已經(jīng)身家千萬,依然會(huì)無償更新和維護(hù)一些開源項(xiàng)目。因?yàn)樗麄冋嬲矚g、真正在乎這個(gè)東西,這就是“興趣使然”的最佳例子。
2.早發(fā)布,常發(fā)布,傾聽用戶的反饋
在開源項(xiàng)目的開發(fā)模式中,盡早發(fā)布和頻繁發(fā)布是至關(guān)重要的。剛開始時(shí),許多成熟的開發(fā)者習(xí)慣性地認(rèn)為,軟件的早期版本往往會(huì)有很多問題。如果提前發(fā)布給用戶,用戶可能會(huì)因?yàn)轶w驗(yàn)不佳而流失。
因此,傳統(tǒng)的開發(fā)模式通常是“大教堂式”的。它們集結(jié)精英、集中開發(fā),經(jīng)過六到八個(gè)月的測(cè)試,最終才推出一個(gè)穩(wěn)定版本。
而Linux的創(chuàng)新就在于快速發(fā)布,最初階段,甚至一天會(huì)發(fā)布多次更新。這樣,許多早期測(cè)試者和項(xiàng)目貢獻(xiàn)者能夠迅速發(fā)現(xiàn)問題并進(jìn)行修復(fù)。
正因如此,Linux的發(fā)起人Linus曾提出一句很有趣的話:“只要眼睛多,Bug容易捉?!?/strong>
在“大教堂”開發(fā)模式下,Bug通常藏得很深,難以發(fā)現(xiàn)。需要經(jīng)過多人、幾個(gè)月的投入和檢查,才能揭示出來。
但在集市模式下,如果上千個(gè)開發(fā)者都在熱衷地研究每個(gè)新發(fā)布的版本,每個(gè)人都在不同的設(shè)備上運(yùn)行該系統(tǒng),那么問題就能被更快發(fā)現(xiàn)。而且,發(fā)現(xiàn)Bug的人為了自己的使用需求,通常會(huì)順手修復(fù)它。
3.免費(fèi)開源軟件,不是因?yàn)榈赖赂呱?/strong>
這本書的作者還強(qiáng)調(diào),千萬不要把開源的技術(shù)人員或團(tuán)隊(duì)當(dāng)作“利他者”,去夸贊他們的高尚品格。他指出,好的開源項(xiàng)目發(fā)起人其實(shí)也從中收獲了很多,比如圈子里的影響力,或者幫助解決技術(shù)難題的人。這與閉源項(xiàng)目一樣,只是一種開發(fā)選擇,并不意味著開源項(xiàng)目比閉源項(xiàng)目更高尚。
當(dāng)然,作者這樣說,顯得有些謙虛。在分享自己的開源項(xiàng)目時(shí),他提到,如果你真心承認(rèn)自己欠了別人很多,你就會(huì)發(fā)現(xiàn)整個(gè)開源社區(qū)會(huì)認(rèn)為你是這個(gè)軟件的發(fā)明者,并且在項(xiàng)目運(yùn)行過程中,收到大量贊美郵件,這些正向反饋會(huì)不斷涌來。來自全球各地的人會(huì)告訴你,你的項(xiàng)目如何幫助了他們。同時(shí),當(dāng)你采納了其他人的測(cè)試報(bào)告或修改的代碼時(shí),給予每個(gè)貢獻(xiàn)者的正反饋也非常強(qiáng)烈。
所以,我相信,DeepSeek這次愿意在本周將他們的代碼倉庫和工作細(xì)節(jié)公開出來,一定是因?yàn)樵谶^去一個(gè)月里,他們收到了大量正向反饋,這激勵(lì)他們作為開源社區(qū)的一員,愿意將自己的每一步探索都貢獻(xiàn)出來。
那么,就像當(dāng)初的芬蘭大學(xué)生李納斯·托瓦茲推動(dòng)“開源”的命運(yùn)齒輪開始轉(zhuǎn)動(dòng)一樣。你有沒有想過,DeepSeek這波操作,又會(huì)給全世界帶來怎樣的影響?會(huì)不會(huì)新的齒輪已經(jīng)開始悄然轉(zhuǎn)動(dòng)?
我認(rèn)為,一切才剛剛開始。
04
DeepSeek掀起的海嘯才剛剛開始
在具體聊DeepSeek開源之前,我想先插播一個(gè)題外話。
2024年12月,一部挪威制作的災(zāi)難劇集《逃離火山島》在奈飛上線,講的是虛構(gòu)的拉帕爾馬島火山噴發(fā)的故事。最開始,山頂?shù)牧芽p冒出白煙,裂縫越來越大,最終火山爆發(fā)。但奇怪的是,火山爆發(fā)并不是整個(gè)災(zāi)難的高潮?;鹕交?guī)е鴰r石滑入海中,最初就像泥石流一樣。但隨著波浪不斷傳遞,最后竟然變成了滔天巨浪,席卷鄰近的島嶼。
我為啥要說這個(gè)評(píng)分不高的小眾劇集呢?因?yàn)楫?dāng)時(shí)看到火山爆發(fā)的時(shí)候,我以為那就是最大的災(zāi)難,完全沒想到后面竟然會(huì)有海嘯?,F(xiàn)在回頭看,DeepSeek的情況其實(shí)也差不多,目前的進(jìn)展就像火山爆發(fā),而真正對(duì)各行各業(yè)帶來的巨大沖擊,才剛剛開始。
就比如DeepSeek要開源他們所有的代碼庫,這件事對(duì)我來說,比之前開源的R1模型更有價(jià)值。
為什么呢?很簡(jiǎn)單,R1只是他們內(nèi)部訓(xùn)練的成果,拿出來讓大家用,你可以在R1的基礎(chǔ)上開發(fā)自己的產(chǎn)品,這本身就很厲害。但現(xiàn)在,他們不僅僅開源了成果,更是把每天的工作細(xì)節(jié)都放出來。這意味著什么?如果他們的訓(xùn)練方法行不通,全球的團(tuán)隊(duì)可以立馬調(diào)整方向;如果方法有效,其他團(tuán)隊(duì)會(huì)立刻受到啟發(fā),推動(dòng)更大的創(chuàng)新。這就體現(xiàn)了“早發(fā)布,常發(fā)布”的精神,而DeepSeek做得更極致,他們直接每天都開源代碼,持續(xù)推進(jìn)創(chuàng)新。
去年年底,我們還在說,這個(gè)AI領(lǐng)域一直沒有出現(xiàn)殺手級(jí)應(yīng)用,現(xiàn)在DeepSeek就是第一個(gè)殺手級(jí)應(yīng)用了。
在我看來,DeepSeek掀起的海嘯主要有以下兩波大浪。
第一波,是對(duì)普通用戶來說,個(gè)性化體驗(yàn)將大幅提升。
現(xiàn)在,很多獨(dú)立開發(fā)者或普通用戶,都能基于DeepSeek的模型,做很多以前根本無法實(shí)現(xiàn)的任務(wù)。就像之前開源的AI圖像模型Stable Diffusion(我們通常簡(jiǎn)稱SD),它在2022年8月發(fā)布后,幾個(gè)月內(nèi)就衍生出了各種插畫生成應(yīng)用。而且,更牛的是,在GitHub開源平臺(tái)上,和SD相關(guān)的項(xiàng)目瘋長(zhǎng)到1000多個(gè)。這意味著一個(gè)開源項(xiàng)目的成功,激發(fā)了更多開源項(xiàng)目的誕生。
還有很多普通用戶,過去根本沒接觸過AI工具,但現(xiàn)在可以用DeepSeek來寫文案、找資料,極大提升了工作效率。正因?yàn)橛玫娜硕嗔?,未來?huì)衍生出更多基于AI的產(chǎn)品,專門解決個(gè)性化需求,這才是真正的技術(shù)普惠。
第二波影響,是對(duì)企業(yè)來說,尤其是中小企業(yè),AI應(yīng)用的門檻大大降低,未來會(huì)滲透進(jìn)各個(gè)場(chǎng)景。
過去,企業(yè)要做一個(gè)內(nèi)部系統(tǒng),通常得層層外包、招投標(biāo)。如果要做一個(gè)AI應(yīng)用,那就更麻煩了,人才、技術(shù)、資源等方面的限制都很大。但現(xiàn)在,DeepSeek的開源讓很多企業(yè)里有想法的個(gè)人,經(jīng)過研究后,可以非常快速地搭建出自己的企業(yè)應(yīng)用。
而且,像R1這么強(qiáng)大的開源大模型,對(duì)于所有非AI企業(yè)來說,底層的模型已經(jīng)不再是瓶頸,也不會(huì)是核心競(jìng)爭(zhēng)力了,因?yàn)榇蠹叶伎梢該碛小_@意味著,企業(yè)的關(guān)注點(diǎn)會(huì)轉(zhuǎn)向自己的核心數(shù)據(jù)、行業(yè)獨(dú)特的洞察力、或者AI場(chǎng)景的落地能力,只有這些才能成為新的競(jìng)爭(zhēng)優(yōu)勢(shì)。
別說百度、騰訊、阿里這些大廠,或者我們這些原本就有軟件研發(fā)能力的團(tuán)隊(duì)快速擁抱DeepSeek,就連我家保險(xiǎn)門上的智能鎖品牌,前天晚上也發(fā)了一篇公眾號(hào),宣布他們家的智能鎖接入了DeepSeek。
那一刻,我有點(diǎn)恍惚。作為一個(gè)產(chǎn)品經(jīng)理,我開始遐想:如果智能鎖接入了思考推理模型,到底能做些什么?是我站在門口時(shí),它根據(jù)心情來決定是否開門?還是它安裝在某個(gè)渣男家門口,發(fā)現(xiàn)有小三來訪時(shí),AI自動(dòng)通知女主人?
當(dāng)然,這只是開玩笑,但至少說明一點(diǎn),企業(yè)接入AI已經(jīng)不再是難事。
回到DeepSeek,他們這波成功的核心,實(shí)際上就是開源。
開源R1模型,讓全球開發(fā)者都能把它下載到電腦上,動(dòng)手一試,驚訝地發(fā)現(xiàn)這個(gè)模型真的是“能打”。
不僅如此,DeepSeek還開源了R1模型的論文和報(bào)告,吸引了一批技術(shù)大神前來關(guān)注,解讀他們?cè)趶?qiáng)化學(xué)習(xí)等方面的獨(dú)到之處。正是這些技術(shù)突破,讓硅谷的科技圈開始平視DeepSeek,平視中國的AI產(chǎn)品。
再說到DeepSeek的R1模型回答中的思維鏈,第一個(gè)具備推理能力的AI模型是OpenAI的o1,雖然它能推理,但OpenAI并沒有將思考過程展示出來,認(rèn)為這不是重點(diǎn)。而DeepSeek則大膽地將自己的思考過程用文字一一展示出來。對(duì)我來說,這個(gè)過程的展現(xiàn),比最終的輸出結(jié)果更觸動(dòng)人心。
而接下來,DeepSeek又要開源自己的代碼倉庫,讓全世界的開發(fā)者看到,他們團(tuán)隊(duì)每天都在做什么。
他們發(fā)布的那段話,簡(jiǎn)直就像是一篇開源世界的宣言。最后一句,簡(jiǎn)直點(diǎn)亮了整個(gè)話題:“這里沒有象牙塔,只有純粹的車庫精神和社區(qū)驅(qū)動(dòng)的創(chuàng)新。”
我把這句話發(fā)給DeepSeek,想讓它為我的這篇文章寫個(gè)結(jié)尾。它說:“大教堂的壁畫終將斑駁,而集市的賬本永遠(yuǎn)鮮活?!?/strong>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.