99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

夜襲 OpenAI,DeepSeek 開源最強推理模型 R1,再震歐美同行

0
分享至


中國的 OpenAI,出現了。


文|宛辰
編 | 靖宇
文章來源 | 極客公園(ID:geekpark)

對標 OpenAI o1 正式版的國產大模型來了!

1 月 20 日晚,DeepSeek(深度求索)公司發布推理模型 DeepSeek-R1 正式版,同步開源模型權重,并允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

網友熱評:這,才是真正的OpenAI。能力相當于一個月 200 美元的 ChatGPT o1 版本,卻完全免費。

不止如此,DeepSeek 一同開源的還有「技術報告」,那些訓練 R1 時踩過的坑、做過的事通通講給你聽,只為鋪平 AGI 的路。

第一時間閱讀這份技術報告后,英偉達高級研究科學家 Jim Fan 帶來了新鮮解讀,值得我們大聲齊讀:


「我們生活在這樣一個時代:由非美國公司保持 OpenAI 最初的使命——做真正開放的前沿研究、為所有人賦能。這似乎講不通,但戲劇性的往往最有可能發生。

DeepSeek-R1 不僅開源了大量模型,還泄露了所有訓練秘密。他們可能是第一個顯示 RL(強化學習)飛輪發揮主要作用、持續增長的 OSS 項目。

影響可以通過『內部實現了 ASI』或『草莓計劃』等神話名稱來實現。也可以通過簡單地轉儲原始算法和 matplotlib 學習曲線來產生影響?!?/p>

中國公司 DeepSeek,正在實現趕超 OpenAI 的使命。


DeepSeek-R1:實力派選擇「秀肌肉」

「DeepSeek-R1」的發布,擺明了是:有實力所以明晃晃地秀肌肉!

這首先體現在它不整期貨那一套,而是「發布即上線」,現在,你就可以在 DeepSeek 官網與 App 體驗最新的推理模型 DeepSeek-R1,隨便體驗隨便用,免費。


登錄 DeepSeek 官網或官方 App,打開「深度思考」模式,即可調用最新版 DeepSeek-R1 完成各類推理任務。|圖片來源:DeepSeek

DeepSeek-R1 也同步上線了 API,對用戶開放思維鏈輸出,通過設置 model='deepseek-reasoner' 即可調用。

值得注意的是 DeepSeek-R1 API 服務定價為每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16 元??聪旅孢@這圖你會有更直接的體感,輸出 API 價格只有 OpenAI o1 的 3%。低價背后,顯然仍是秀肌肉,價格實力展現了技術實力——從AI Infra 層面降本的技術能力。


圖中深藍色柱子代表 DeepSeek-R1,剩下的灰色、淺藍、青淺灰分別是 OpenAI o1 不同版本的價格。|來源:DeepSeek

第三波「秀肌肉」體現在開源開放。DeepSeek-R1 開源模型權重幾乎是選擇了最開放的許可證和用戶協議,開源 License 統一使用 MIT,產品協議明確可「模型蒸餾」,主打一個讓大家多多來基于它做二次開發、集成。DeepSeek 甚至主動給大家示范引導將 R1 作為教師模型來蒸餾出一個更小但仍有實力的模型,「通過 DeepSeek-R1 的輸出,蒸餾了 6 個小模型開源給社區,其中 32B 和 70B 模型在多項能力上實現了對標 OpenAI o1-mini 的效果」。

事實上,模型開源選擇不同的 License 背后大有學問,這直接體現不同模型廠商的開放程度,更體現開源背后的目的和策略。比如像 Llama、Qwen、GPT-2 等模型就不止開放權重,還開放了模型訓練的源代碼,這可能是為了追求衍生模型的繁榮。而 DeepSeek-R1 選擇只開放權重,但換成了標準化、寬松的 MIT License,更多還是為了讓更多開發者能用起來,感受 DeepSeek-R1 的能力。

我們再來通過幾大主流測試基準來感受一下 DeepSeek-R1 的實力。「性能對齊 OpenAI-o1 正式版 DeepSeek-R1 在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。」


圖片來源:DeepSeek

對于 DeepSeek-R1 帶來的直觀感受,硅基流動聯合創始人楊攀表示,不止模型能力和性能出色,最近兩個模型 (R1 和 V3) 在訓練技術和模型底層架構上都做了領先全球的創新,而且其論文開放程度也震驚了業界。

在一并公開的模型技術報告中,DeepSeek 將「DeepSeek-R1」訓練技術全部公開,「旨在促進技術社區的充分交流與創新協作」。


根據技術報告,硅基流動創始人&CEO 袁進輝稱,DeepSeek-R1 是無人區的探索和發現。|來源:即刻

對于開源模型加技術報告,開源社聯合創始人林旅強此前向極客公園表示,開源是最好的「秀技術肌肉」的方式,同時「有的開源模型只開源、不講他是怎么做的,但是合乎大家期待的開源模型是要搭配技術報告,等于是發 paper 了。開源模型不夠的,因為模型是黑盒子,技術報告會說明一些東西。DeepSeek 他們是很透明地把他的技術報告拿來公開,即使一定程度還是會捂著掖著,但是已經是開得比較有態度。今天全球范圍的學術派還是會認為,你把一個東西做出來再以開源的方式,是有學術追求的。」

如果 DeepSeek 的目標是真正達到 AGI,就不斷需要把踩過的坑、做過的事情開放出來,讓大家少走一點彎路,開放才能讓整個行業更快達到 AGI,他補充道。

最后,我們來隨機看一些用戶實測評價(截圖來源:X.com):




Twitter 用戶盛贊 R1 的實力|圖片來源:X


DeepSeek,還有什么驚喜是我們不知道的?!

盡管昨晚 DeepSeek-R1 的發布引發了「這才是 Open AI 吧」「東方的 OpenAI」等一片稱贊。但 DeepSeek 強得非常扎實、全面。

去年在 2024 年 11 月 20 日發布 DeepSeek-R1-Lite 預覽版時,美國著名半導體與 AI 咨詢機構 Semianalysis 創始人 Dylan Patel 就坐不住了,第一時間下場「提醒」大家:他們有 5 萬張 H100 GPU!請不要以為他們只有 1 萬張 A100!


因為眾所周知的原因,這大概率不是事實,卻能反映 DeepSeek-R1-Lite 的強悍到讓行業緊張。

一個月后,DeepSeek 上線并同步開源了媲美 GPT-4o 和 Claude 3.5 Sonnet 的模型「DeepSeek-V3」,并附上了詳實的技術報告。這一次,幾乎驚動了整個硅谷AI圈??ㄉ瘢∣penAI 創始團隊、前 Tesla AI 總監 Andrej Karpathy)、Alexandr Wang(Scale.ai 創始人)、田淵棟(Meta AI 科學家)、賈揚清(Lepton AI 創始人)……人均一句「難以置信」。就連 Sam Altman 都忍不住出來酸一把「復刻已經被驗證過奏效的東西是容易的」。


DeepSeek-V3 發布后,Sam Altman 疑似喊話 DeepSeek。|截圖來源:X.com

隨著模型性能逐漸走向全球第一梯隊,DeepSeek 也迎來了新的發展契機。

過去一年半,DeepSeek 專注于模型和研究,但從今年開始,DeepSeek 著手做應用了。

2025 年 1 月 15 日,DeepSeek 推出移動端 AI 助手「DeepSeek」App。目前看,DeepSeek App 跟網頁版功能一致,主要有兩個功能:聯網搜索和深度思考,主打一個簡潔,聊天記錄也會同步顯示在手機端和網頁端,尚未針對移動端進行特定功能的打磨,也沒有市面上 AI 助手類 App 豐富、fancy 的功能,更像是一個能讓你在手機上體驗 DeepSeek 最新模型的入口。


DeepSeek App 展示圖|來源:Apple Store

對此,一位投資人向極客公園解釋 DeepSeek 開始做應用背后可能的戰略轉向:「前期 DeepSeek 靠自己的算力優勢積累出了模型技術的領先度。后期要補數據,發 App 是補數據的手段之一。接入用戶數據和場景,可以幫助他更好地進行模型能力的迭代和升級?!?/p>

同時,有了 DeepSeek-R1 和其他模態、類型越來越好的模型,可以期待未來 DeepSeek 在比如代碼模型/應用里有更激進的表現,驚喜才剛剛開始。


媒介合作聯系微信號|ciweimeijiejun

如需和我們交流可后臺回復“進群”加社群

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
《中縣干部》里的那個縣長,被查了

《中縣干部》里的那個縣長,被查了

六子吃涼粉
2025-04-22 14:10:15
75歲姜昆洛杉磯被偶遇,妻子罕見露面,兩人吃日料,畫面溫馨

75歲姜昆洛杉磯被偶遇,妻子罕見露面,兩人吃日料,畫面溫馨

180°視角
2025-04-22 09:10:54
中美對轟,中方退兩架波音,美國天價港口費砸向中國,誰輸不起?

中美對轟,中方退兩架波音,美國天價港口費砸向中國,誰輸不起?

文雅筆墨
2025-04-22 11:42:25
萊昂納德39分累脫力!賽后癱倒在博格丹懷里,神似皮蓬抱流感喬丹

萊昂納德39分累脫力!賽后癱倒在博格丹懷里,神似皮蓬抱流感喬丹

嘴炮體壇
2025-04-22 13:05:18
綠營動手,將朱立倫定為“首謀”,朱立倫態度變了,趙少康不忍了

綠營動手,將朱立倫定為“首謀”,朱立倫態度變了,趙少康不忍了

DS北風
2025-04-22 17:34:22
非洲小國一群婦女不滿采礦破壞環境,縱火焚毀中資采礦設施,設備全部被燒毀

非洲小國一群婦女不滿采礦破壞環境,縱火焚毀中資采礦設施,設備全部被燒毀

互聯網大觀
2025-04-21 13:56:35
天津阿姨供奉30多年觀音,拆開發現裝著別人衣服!網友:被借運了

天津阿姨供奉30多年觀音,拆開發現裝著別人衣服!網友:被借運了

奇思妙想草葉君
2025-04-21 23:09:39
充10分鐘續航2000公里!固態電池正式投產,豐田徹底急了

充10分鐘續航2000公里!固態電池正式投產,豐田徹底急了

瘋狂小菠蘿
2025-04-21 18:13:17
票房已破157億元,《哪吒2》延長上映至5月31日!出品方光線傳媒賺麻:一季度凈利潤超20億元,大增近375%

票房已破157億元,《哪吒2》延長上映至5月31日!出品方光線傳媒賺麻:一季度凈利潤超20億元,大增近375%

每日經濟新聞
2025-04-22 15:58:06
后續來了!高鐵攔門事件通報細節,女子身份被扒,處罰結果引爭議

后續來了!高鐵攔門事件通報細節,女子身份被扒,處罰結果引爭議

追風小狗
2025-04-21 22:24:05
高速車輛追尾起火后續!車企淪陷,遇難者身份被扒,更多細節流出

高速車輛追尾起火后續!車企淪陷,遇難者身份被扒,更多細節流出

削桐作琴
2025-04-22 00:09:12
馬筱梅帶大S女兒逛樂園,小玥兒穿戴時尚變化大,臉型像極了大S!

馬筱梅帶大S女兒逛樂園,小玥兒穿戴時尚變化大,臉型像極了大S!

古希臘掌管月桂的神
2025-04-22 15:51:20
女子攔高鐵事件最新后續:女子身份被揭露,回家后被警方拘捕!

女子攔高鐵事件最新后續:女子身份被揭露,回家后被警方拘捕!

小毅說事
2025-04-21 21:52:18
人民幣是怎么了?

人民幣是怎么了?

六爺阿旦
2025-04-22 17:47:35
如果事情屬實,那就不是“荒唐”的問題了

如果事情屬實,那就不是“荒唐”的問題了

末名先生
2025-04-22 16:07:52
美媒警告:如果中美爆發沖突,美軍需要準備好損失幾艘航母

美媒警告:如果中美爆發沖突,美軍需要準備好損失幾艘航母

空天力量
2025-04-22 13:10:17
江蘇兩廳級干部被查

江蘇兩廳級干部被查

魯中晨報
2025-04-22 20:00:02
突發!美國商務部剛剛宣布:反傾銷稅3400%

突發!美國商務部剛剛宣布:反傾銷稅3400%

壹航運
2025-04-22 17:14:25
俄專家談中國非核“氫彈”:中國或已成功試爆一種新型熱壓彈

俄專家談中國非核“氫彈”:中國或已成功試爆一種新型熱壓彈

俄羅斯衛星通訊社
2025-04-22 15:12:44
巴西大豆短期內難以取代美國大豆:蛋白含量&出油量均低于美產,存在季節缺口

巴西大豆短期內難以取代美國大豆:蛋白含量&出油量均低于美產,存在季節缺口

三言四拍
2025-04-22 19:24:47
2025-04-22 20:39:00
刺猬公社 incentive-icons
刺猬公社
聽記者講幕后,聽新聞前輩講古
9481文章數 172393關注度
往期回顧 全部

科技要聞

美團騎手親述:京東外賣單子傭金高卻難搶

頭條要聞

中央巡視組進駐后李明月被查 曾稱我號碼老百姓都知道

頭條要聞

中央巡視組進駐后李明月被查 曾稱我號碼老百姓都知道

體育要聞

當今足壇最瘋的門將,能有多離譜?

娛樂要聞

關曉彤分手風波后首現身!甜美狀態好

財經要聞

宜賓銀行與五糧液集團頻繁關聯交易

汽車要聞

捷途山海T2加長版/山海L9等 捷途新車展前亮相

態度原創

房產
手機
數碼
公開課
軍事航空

房產要聞

60+樓盤狂拼特價,海口最新房價曝光!

手機要聞

小米16系列再次被確認:直屏+副屏,有望九月份發布!

數碼要聞

機械師新款24寸顯示器上市:FHD 200Hz屏國補價466元

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

普京三年來首次向烏克蘭發出“和談邀約”

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 克拉玛依市| 德庆县| 普安县| 二连浩特市| 德阳市| 江华| 新宾| 乌鲁木齐市| 福建省| 台安县| 安阳市| 师宗县| 阿拉善盟| 石门县| 上犹县| 靖远县| 天等县| 肇东市| 攀枝花市| 中卫市| 朔州市| 来宾市| 崇阳县| 大厂| 八宿县| 甘孜县| 宁晋县| 柳林县| 西峡县| 庆云县| 同江市| 布尔津县| 古蔺县| 同心县| 肥东县| 鄂尔多斯市| 开鲁县| 古丈县| 大丰市| 莱芜市| 潞西市|