99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek登上醫學頂刊:兩篇Nature Medicine論文評估DeepSeek在醫療領域的表現

0
分享至

撰文丨王聰

編輯丨王多魚

排版丨水成文

2025 年 1 月 20 日,中國杭州的初創公司深度求索(DeepSeek)發布了一款大語言模型(LLM)——DeepSeek-R1,這是一個部分開源(訓練數據未公開,因此并非完全開源)的“推理”模型,其能夠以與OpenAI于 2024 年年底發布的最先進的專注于“推理”的大語言模型ChatGPT-o1相近的水平解決一些科學問題。

更重要的是,DeepSeek-R1 的訓練成本遠低于美國科技巨頭們開發的主流大語言模型,DeepSeek-R1 的高性能與超低成本引起了全世界科學界的驚嘆。

2025 年4 月 23 日,國際頂尖醫學期刊Nature Medicine背靠背發表了兩篇關于DeepSeek的論文。這兩項研究分別評估了DeepSeek在醫療任務、臨床推理和臨床決策中的能力,并與ChatGPT-o1Llama 3.1-405B、ChatGPT-4oGemini-2.0 Flash Thinking Experimental進行了比較。



DeepSeek 在醫療任務和臨床推理方面的比較基準測試

DeepSeek是一款新推出的大語言模型(LLM),旨在提升推理能力,但其在醫療領域的表現尚未得到評估。

在這項研究中,西奈山伊坎醫學院Xueyan Mei團隊等評估了三款大型語言模型——DeepSeek-R1ChatGPT-o1Llama 3.1-405B在執行四項不同醫療任務方面的能力:回答美國醫師執照考試(USMLE)中的問題、基于文本的診斷和管理案例進行解讀和推理、根據 RECIST 1.1 標準對腫瘤進行分類,以及對多模態的診斷影像報告進行總結。

評估結果顯示,在美國醫師執照考試(USMLE)中,DeepSeek-R1(準確率=0.92)的表現略遜于 ChatGPT-o1(準確率=0.95),但優于 Llama 3.1-405B(準確率=0.83)。在基于文本的病例挑戰中,DeepSeek-R1 的表現與 ChatGPT-o1 相當(分別使用《新英格蘭醫學雜志》和 Medicilline 數據庫時,準確率分別為 0.57 vs 0.55 和 0.74 vs 0.76)。對于 RECIST 腫瘤分類,DeepSeek-R1 的表現也與 ChatGPT-o1 相似(0.73 vs 0.81)。

DeepSeek 提供的診斷推理步驟被認為比 ChatGPT 和 Llama 3.1-405B 提供的更準確(平均Likert評分分別為 3.61、3.22 和 3.13)。但 DeepSeek-R1 提供的總結影像報告的整體質量略低于 ChatGPT-o1 提供的報告(Likert評分 為4.5 vs 4.8)。

總的來說,這項研究突顯了 DeepSeek-R1 大語言模型在醫療應用方面的潛力,并指出了一些需要改進的地方。

DeepSeek 在臨床決策中的基準評價

大語言模型(LLM)正在不斷改變醫療應用領域。然而,像ChatGPT-4o這樣的專有模型在臨床應用方面面臨重大障礙,因為它們無法在醫療機構內部署,從而不符合嚴格的隱私法規。

近期,諸如DeepSeek之類的開源大語言模型取得的進展提供了一個很有前景的替代方案,因為它們能夠在擁有先進信息技術基礎設施的醫院里,對本地數據進行高效的微調。

為了展示 DeepSeek-V3 和 DeepSeek-R1 的臨床實用性,柏林夏里特大學醫學院的Roland Eils團隊在臨床決策支持任務上對其性能進行了基準測試,測試對象還包括專有的大語言模型,例如ChatGPT-4oGemini-2.0 Flash Thinking Experimental

通過涵蓋常見和罕見疾病的 125 個具有充分統計效力的患者病例,研究團隊發現,DeepSeek 的表現與專有的大型語言模型相當,在某些情況下甚至更優。

這項研究表明,開源的大言模型能夠提供一條可擴展的途徑,用于安全的模型訓練,從而在符合數據隱私和醫療保健法規的前提下,實現現實世界中的醫療應用。

論文鏈接

https://www.nature.com/articles/s41591-025-03726-3

https://www.nature.com/articles/s41591-025-03727-2

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美前副國務卿:特朗普政府誤判中國實力

美前副國務卿:特朗普政府誤判中國實力

上觀新聞
2025-04-26 15:29:10
省委書記、省長聯名發信

省委書記、省長聯名發信

新京報政事兒
2025-04-25 12:02:35
22點和23點睡覺,差距到底有多大?

22點和23點睡覺,差距到底有多大?

環球網資訊
2025-04-08 21:33:09
比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

影史侃談
2025-03-16 22:40:07
朝鮮驅逐艦下水,74個垂發單元,遠超052D型,到底有多強?

朝鮮驅逐艦下水,74個垂發單元,遠超052D型,到底有多強?

今墨緣
2025-04-26 12:17:47
突發!珍珠女王白如方去世,死因曝光,多次登央視,如外交官一般

突發!珍珠女王白如方去世,死因曝光,多次登央視,如外交官一般

二月侃事
2025-04-26 13:50:50
聯盟官方預測最新奪冠概率:快船3.6%,湖人勇士5.6%,兩隊超30%

聯盟官方預測最新奪冠概率:快船3.6%,湖人勇士5.6%,兩隊超30%

你的籃球頻道
2025-04-26 07:58:57
莆田市原副市長胡國防被查

莆田市原副市長胡國防被查

魯中晨報
2025-04-26 17:12:02
本賽季,有可能誕生歐戰歷史上第一個三連亞球隊

本賽季,有可能誕生歐戰歷史上第一個三連亞球隊

體育一點就通
2025-04-26 14:39:19
拔出蘿卜帶出泥!沈騰林允戀情再添實錘?女方那點事再也瞞不住了

拔出蘿卜帶出泥!沈騰林允戀情再添實錘?女方那點事再也瞞不住了

野山歷史
2025-04-24 11:40:09
19國援兵全到齊,菲律賓對華開“第二槍”,外交部:中國不感興趣

19國援兵全到齊,菲律賓對華開“第二槍”,外交部:中國不感興趣

吳欣純Deborah
2025-04-25 17:56:05
場均21分6板,唐斯走了你扶正,都說1.3億太貴,如今打成白菜價

場均21分6板,唐斯走了你扶正,都說1.3億太貴,如今打成白菜價

大西體育
2025-04-26 17:50:39
今晚,德甲冠軍有望誕生!只要滿足2個條件,凱恩就將圓夢首冠

今晚,德甲冠軍有望誕生!只要滿足2個條件,凱恩就將圓夢首冠

球場沒跑道
2025-04-26 07:31:27
富庶小國崩潰有多快?三年變地獄:全國斷電缺糧,連吃飯都成問題

富庶小國崩潰有多快?三年變地獄:全國斷電缺糧,連吃飯都成問題

牛牛叨史
2025-04-20 01:11:40
政審時名下莫名多家公司,我沒啃聲,直接用法人身份把他公司拆了

政審時名下莫名多家公司,我沒啃聲,直接用法人身份把他公司拆了

蘭姐說故事
2025-04-24 15:00:06
剛剛,這里突發4.9級地震!

剛剛,這里突發4.9級地震!

最江陰
2025-04-26 13:20:52
當兒女不尊重你時,不要講道理,不要發脾氣,記住3個字就夠了

當兒女不尊重你時,不要講道理,不要發脾氣,記住3個字就夠了

顧一宸
2025-04-26 13:12:51
肇慶發現中華穿山甲,體格健壯,在四處嗅探,曾經消失了36年

肇慶發現中華穿山甲,體格健壯,在四處嗅探,曾經消失了36年

觀察鑒娛
2025-04-26 09:05:03
我空降到家鄉擔任副省長,參加校友聚會,卻被班花的處長丈夫嘲笑

我空降到家鄉擔任副省長,參加校友聚會,卻被班花的處長丈夫嘲笑

紅豆講堂
2025-04-16 10:47:03
“Linux 之父”怒批:文件系統大小寫不敏感是天大錯誤

“Linux 之父”怒批:文件系統大小寫不敏感是天大錯誤

IT之家
2025-04-26 09:51:25
2025-04-26 18:40:49
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科學研究
7327文章數 144641關注度
往期回顧 全部

科技要聞

李斌:對蔚來公司四季度盈利非常有信心

頭條要聞

90后男子搬磚9年攢200萬元蓋了別墅 如今說自己很后悔

頭條要聞

90后男子搬磚9年攢200萬元蓋了別墅 如今說自己很后悔

體育要聞

去更大的舞臺追夢 專訪中國男籃國手楊瀚森

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

房產
時尚
教育
數碼
公開課

房產要聞

逆勢大幅漲價!最高2.8萬/平!長天雲汀開盤又賣爆了!

今夏流行“不穿褲子”!洋氣顯瘦顯腿長,誰穿誰好看!

教育要聞

親子矛盾徹底化解的三大衡量標準!

數碼要聞

由于未能通過測試 Google已放棄三星的HBM3E工藝轉用美光

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 辽中县| 思茅市| 仁寿县| 专栏| 安泽县| 荆门市| 若尔盖县| 新闻| 和硕县| 河北区| 康保县| 临猗县| 泰顺县| 饶平县| 新密市| 黄梅县| 庆元县| 四平市| 广西| 温泉县| 廉江市| 孝昌县| 静乐县| 仁布县| 隆昌县| 贵溪市| 嘉禾县| 泰顺县| 察隅县| 宁阳县| 方山县| 洪雅县| 呼和浩特市| 保德县| 平江县| 新民市| 吴川市| 博湖县| 乐清市| 台北市| 无棣县|