99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

【科普金華】過年親戚不聊結婚聊AI,DeepSeek為啥有這么大的魅力?

0
分享至

這個春節,有一款國產 AI 大模型成了科技新聞里“最靚的仔”,甚至回老家過年,不少親戚在飯桌上聊的“下飯話題”都變成了 AI。我們這些在北上廣互聯網公司打工過的牛馬,作為家人眼中唯一一個懂“修電腦”的人才,自然難免要被問到各種相關問題。


如何跟不了解科技行業的親朋好友簡單易懂地講清楚 DeepSeek,頗花費了我一番腦汁,但效果還不錯,比如我媽聽完后一拍大腿表示:八成懂了?。瓤龋幸徽f一,回答這個問題還是比“為什么不結婚/生小孩”,簡單多了……ㄟ(▔,▔)ㄏ )接下來我就把我跟我媽講的概括一下,希望能夠幫你揭開DeepSeek的神秘面紗。

先總結一下,DeepSeek 有三寶:

開源普惠,人人可復制嫁接

成本大幅降低

訓練模式突破性創新

其中每一條都為人類通往構建 AGI 創造了有利條件——所謂 AGI,指的是能夠像人類一樣完成各種不同任務的人工智能。它不僅能做一件事,還能學習、適應并解決多種問題。接下來,咱們就簡單聊聊 DeepSeek 先進在哪兒,有什么特點。

DeepSeek R1 強在哪兒?

DeepSeek 之前,最為人熟知的大模型產品是 ChatGPT,全球月活躍用戶約 4 億。但是大部分用戶體驗到的 ChatGPT 免費版本仍有許多不足。

比如,以前你問 ChatGPT 這樣的問題:

“小美上午 9 點的心率是 75bpm,下午 7 點的血壓是 120/80。她于晚上 11 點死亡。她中午還活著嗎?”

Chatgpt 就會被繞暈,給出不靠譜的答案。這說明彼時 ChatGPT 并不理解數字和數理之間,以及事物之間的邏輯關系,它回答對了可能是瞎蒙,可能是鸚鵡學舌。


注:由于現在的 AI 已經能解決這類問題,這里特地讓 ChatGPT 扮演更老的版本以展示可能出現的錯誤

但 DeepSeek R1 在展示結果同時,顯示了完整的思維力(Cot)推理過程,把問題一步步拆解分析,并且在學習數學題過程中,顯示出了提煉總結數理公式的能力。


這就是 DeepSeek R1 在計算性質上不同于 ChatGPT 和 GPT-4/4o 的根本區別——R1 是推理模型,后者不是。

我們為了檢驗它是否真的學會了數理邏輯,而不是靠積累的語料數據“瞎蒙”,派他去獨立解決各類數學和編程競賽的問題,結果十分亮眼——在MATH基準測試中的得分為 97.3,在AIME上的得分為 79.8,超過了 OpenAI 的 o1 預覽版。而在中科院物理所的競賽比拼中,也取得了優異的成績(參見 )

當然,這些測試只是從一個方面衡量了 DeepSeek R1 的能力,其他復雜的任務,可能會涉及不同的評估方法和指標。


為什么說 R1-Zero 是

AI 界的“野生學霸”

如果說傳統 AI 是“補習班量產的好學生”,成才主要靠輔導老師天天耳提面命,那 R1-Zero 就是靠自學的“天才少年”。

R1-Zero 的“自學”過程依賴于強化學習(RL)算法,而非傳統的人類標注數據。通過反復訓練和優化,盡管沒有人工干預,它仍在特定的反饋機制下自我優化,最后在數學題目中展示出了卓越的推理能力。

這個方法跟 ALPhaGo 有些類似,對,就是那個曾經戰勝過人類最強棋手的“硅基棋王”——它并沒有根據人類的圍棋教程學習,全程也沒有接受過任何人類輸入的信號指導,完全依賴自己和自己“億局局”下棋、勝負歸納總結,產生了強大的下棋策略。

更絕的是,DeepSeek 的解題過程一步步推演,可以長達成百上千字,甚至上萬,堪比《三體》里羅輯的面壁計劃——每一步都充滿“如果……那么……”的邏輯推演,而且連中學生都能看懂它的思維過程。

同時,它的訓練方法還帶來了效率提升,訓練周期更短,資源消耗降低,由于省去了 SFT 和復雜的獎懲模型,計算量減少。

開源:技術界的“人民戰爭”

需要指出的是,DeepSeek R1 并不是目前唯一的推理模型。OpenAI 的 o1 模型在推理任務上表現也很出色,但是 DeepSeek 有個顯著的不同。

那就是,OpenAI 的 o1 模型像米其林三星餐廳——菜品驚艷,但廚房謝絕參觀。而DeepSeek 直接把菜譜開源,邀請全世界極客來改良——有人往模型里塞《五年高考三年模擬》,訓練出秒殺奧數冠軍的 AI;有人用 R1 給女朋友寫情書,結果因為邏輯過于嚴謹被罵“直男癌”。這種“群毆式創新”,讓 AGI 研究從高冷學術圈變成了全民參與的“黑客馬拉松”(指限定時間內大家通過編程、設計等技能合作,做出有趣或實用的項目。)。

更重要的是,模型開源,讓全世界的科技人才,都有可能站在 R1 的基礎上,進行改良再創造??萍嫉臍v史進程已經一次次告訴我們:基礎技術的傳播擴散,會引發更大量、更先進的前沿突破和實際應用的涌現。

科技樹的點亮,沒辦法僅靠一個人或者一家公司,DeepSeek 的開源,就相當于一次開枝散葉的重要過程,而這也會提高 DeepSeek 的聲望和影響力。

省錢鬼才:成本僅用十分之一

大模型領域的研發其實是很“燒錢”的,很多知名的大模型,訓練一次成本就高達數百萬美元。

而 DeepSeek 最為人稱道的,是它把成本抹了個零——是的,它直接把成本金額的末尾砍掉了一個“0”。簡單地說,DeepSeek采用了一系列架構、算法和任務拆分等方面的優化和創新,這樣就能只用較低的成本就完成訓練任務,而這些方面的創造力正是 DeepSeek 的卓越之處。

更反常識的是,成本暴降的同時,性能反而飆升:它能夠在一個請求中處理多達 128000 個 Token、一次最多可以生成 32000 個 Token(注:1 個 token 視情況相當于 1 個詞語或 1 個漢字),非常適合編寫深度報告或剖析大量數據集,作為生產力工具效能極大提升,活生生把 AI 從“吞金獸”變成了“招財貓”,利人利己。

用推理實現環保

最新的研究和報道顯示,隨著人工智能行業的規模和影響力急劇擴大,維持人工智能增長所需的計算能力大約每 100 天翻一番。目前,ChatGPT 每天需要消耗大約 564 兆瓦時的電能。

同時,支撐大模型運算的數據中心服務器會需要消耗大量的水資源來散熱。有研究顯示,ChatGPT-3 在訓練期間耗水近 700 噸,其后每回答 20 至 50 個問題,就需消耗 500 毫升水。

耗能、耗水、增加碳排放,曾經是我們擔憂通往 AGI 之路的重要阻力,但是,DeepSeek 的成功向我們揭示了——或許我們有其他更好的道路。

過去十年,AI 界沉迷于“數量碾壓”:堆算力、沖數據量、比誰燒錢多。但 DeepSeek 另辟蹊徑——與其讓 AI 死記硬背《百科全書》,不如教它“怎么像福爾摩斯一樣思考”。結果在 ARC-AGI 測試(AGI 核心能力基準)中,R1 系統與人類表現不相上下。

這證明:也許推理能力才是打開 AGI 之門的鑰匙,而鑰匙孔里透出的光,正在被開源社區的手電筒照得越來越亮。

DeepSeek 不是神話

是團隊一步步創造的火種

雖然 DeepSeek 的故事聽起來像一部科幻爽文:它用純強化學習打破了數據壟斷,用開源點燃了全球極客的激情,再用成本暴降,讓 AI 能更好地從實驗室走進我們的生活,但它絕不像某些流量自媒體為了博眼球說的那樣橫空出世,更不是什么抄襲了其他廠家 AI 的結果。

過去一年,DeepSeek 團隊一直穩扎穩打,從 V2 模型(2024 年 5 月發布),到 V3 模型(2024 年 12 月發布),到最近的 R1 和 R1-zero 模型,每一步都取得了顯著的進步, 走得很扎實,而且其創新有開源的信息為證。

因此,不要理會那些逆襲開掛爽文或是抹黑文,我們要相信的是,從人類集體進步的角度講,投入時間、智慧和真正能點燃人的信念,突破式創新一定會涌現。

當我們驚嘆于 R1 的優異表現時,也別忘了——它省下的每一度電、開放的每一行代碼,都在為 AGI 降臨積蓄能量。或許未來某天,當真正具備通用智能的AI回首歷史時,會像人類銘記火種與輪子一樣,為 DeepSeek 刻下一塊里程碑。

參考文獻

[1]《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》 https://arxiv.org/abs/2501.12948

[2]DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language ModelDeepSeek-V3 Technical Report https://arxiv.org/abs/2405.04434

[3]DeepSeek-V3 技術報告 https://arxiv.org/html/2412.19437v1

[4]《研究人員發現算法可將人工智能能耗降低 95%》

https://oilprice.com/Energy/Energy-General/Researchers-Discover-Algorithm-to-Slash-AI-Energy-Consumption-by-95.html

[5]DeepSeek R1-Zero與R1的結果與分析. 騰訊云開發者社區.

https://cloud.tencent.com/developer/article/2493328

[6]GPT-4 Can't Reason https://arxiv.org/abs/2308.03762

策劃制作

作者丨木木 北京師范大學數學專業 資深產品經理 人工智能創業者

審核丨于乃功 北京工業大學機器人工程專業負責人,北京人工智能研究院機器人研究中心主任,博士生導師

策劃丨丁崝

責編丨丁崝

審校丨徐來、林林

本文經授權轉自“科普中國”(id:Science_China)公眾號

編輯:吳裕慧

一審:施新杭

二審:盧立明

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
媒體爆料CBA重要決定,季后賽大變天,遼寧隊成贏家,廣東隊要慌

媒體爆料CBA重要決定,季后賽大變天,遼寧隊成贏家,廣東隊要慌

宗介說體育
2025-04-15 13:54:56
醫療界大消息來啦!四川打響第一炮:公立醫院一次掛號可管8天!

醫療界大消息來啦!四川打響第一炮:公立醫院一次掛號可管8天!

青青子衿
2025-04-15 00:20:20
福建美女“覃姐姐”去世,年僅26歲,司機開小米su7超速將其撞飛

福建美女“覃姐姐”去世,年僅26歲,司機開小米su7超速將其撞飛

180°視角
2025-04-15 12:33:40
5月1日起,城鎮戶口可遷回農村,重新分配土地和宅基地建房!

5月1日起,城鎮戶口可遷回農村,重新分配土地和宅基地建房!

樂山精選
2025-04-02 11:58:11
你都知道哪些行業內幕?網友:水果真的要少吃,吃多脾胃不好

你都知道哪些行業內幕?網友:水果真的要少吃,吃多脾胃不好

娛樂圈人物大賞
2025-04-15 00:05:27
謝浩男相比較跟爸爸相處跟媽媽相處完全是兩種狀態,明顯跟爸爸親

謝浩男相比較跟爸爸相處跟媽媽相處完全是兩種狀態,明顯跟爸爸親

小影的娛樂
2025-04-16 00:36:15
中國反制,美國暫緩關稅戰,烏克蘭有機會?基輔揚言購買美國導彈

中國反制,美國暫緩關稅戰,烏克蘭有機會?基輔揚言購買美國導彈

風信子的花
2025-04-16 01:40:08
實錘有后門!央視曝光3名美國NSA特工攻擊路徑,國產替代要加速

實錘有后門!央視曝光3名美國NSA特工攻擊路徑,國產替代要加速

游古史
2025-04-15 16:35:22
廣東一服飾公司財務造假6年,老板套現10億被捕,國資無奈接盤

廣東一服飾公司財務造假6年,老板套現10億被捕,國資無奈接盤

墨印齋
2025-04-15 18:40:29
鎖定西部第五!快船笑納76人三重大禮,莫雷神操作毀恩比德巔峰

鎖定西部第五!快船笑納76人三重大禮,莫雷神操作毀恩比德巔峰

奕辰說球
2025-04-15 11:24:26
掘金老板:已做出解雇決定后曾征求約基奇意見 被他拒絕了

掘金老板:已做出解雇決定后曾征求約基奇意見 被他拒絕了

直播吧
2025-04-15 08:44:10
東風26恐怖的生產數量,終于讓美國明白中國的打法

東風26恐怖的生產數量,終于讓美國明白中國的打法

科學知識點秀
2025-04-12 08:40:13
張柏芝小時候的身份證,這才是天生麗質

張柏芝小時候的身份證,這才是天生麗質

東方不敗然多多
2025-04-13 10:55:13
山西省委常委、政法委書記為重要貢獻舉報人頒獎

山西省委常委、政法委書記為重要貢獻舉報人頒獎

政知新媒體
2025-04-15 13:40:16
中國開始乘勝追擊,中美關稅戰的最終結局,特朗普已經沒得選

中國開始乘勝追擊,中美關稅戰的最終結局,特朗普已經沒得選

老高風云
2025-04-14 18:43:50
沈陽奔海自助餐要黃了?祁老板視頻發聲并直播哭泣

沈陽奔海自助餐要黃了?祁老板視頻發聲并直播哭泣

遼沈音信
2025-04-16 00:01:05
拜登預言成真,等特朗普干完這四年,美國或將成為“世界老二”?

拜登預言成真,等特朗普干完這四年,美國或將成為“世界老二”?

阿傖說事
2025-04-14 18:15:13
廊坊通報“廣告牌匾禁用紅藍黑”:三河市委主要負責人被免職

廊坊通報“廣告牌匾禁用紅藍黑”:三河市委主要負責人被免職

人民網
2025-04-15 10:45:26
京東、美團交火,殃及餓了么?

京東、美團交火,殃及餓了么?

無冕財經
2025-04-15 18:27:33
經此一戰,中國國際威望大增,全世界的人態度都變了

經此一戰,中國國際威望大增,全世界的人態度都變了

華山穹劍
2025-04-15 20:25:15
2025-04-16 02:48:49
金華科協 incentive-icons
金華科協
金華市科協傳播科學知識新平臺
2030文章數 286關注度
往期回顧 全部

科技要聞

小鵬汽車MPV車型改款上市,35.98萬起

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

體育要聞

惡性循環!錫伯杜的壓榨哲學是對是錯?

娛樂要聞

娛樂圈模范夫妻塌房?私生活曝光!

財經要聞

李強:以更大力度促進消費擴大內需

汽車要聞

19.99萬起 廣汽本田P7能在新能源分一杯羹?

態度原創

本地
時尚
藝術
房產
軍事航空

本地新聞

云游湖北|相約安陸,解鎖限定版粉色春天

春天穿“韓系少女風”的你,美到離譜!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

房產要聞

牛!引入廣州中學九年一貫制學校,不愧天河全優生

軍事要聞

烏遭俄導彈襲擊 澤連斯基喊話特朗普訪烏

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 扎囊县| 鹰潭市| 集安市| 保定市| 兴安县| 当雄县| 昭觉县| 驻马店市| 文水县| 平潭县| 织金县| 屏东县| 建始县| 剑河县| 札达县| 濮阳县| 阳新县| 洪洞县| 太原市| 山西省| 屯昌县| 南漳县| 日照市| 如皋市| 灯塔市| 仪征市| 和林格尔县| 苏州市| 临西县| 乌恰县| 马山县| 平度市| 凤台县| 杭锦旗| 开阳县| 郓城县| 神木县| 叙永县| 胶南市| 崇州市| 太仓市|