99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

物理學家怒噴:我真心不明白為何有些人還看好LLM

0
分享至


自 OpenAI 推出 ChatGPT 以來,基于大語言模型(LLM)的產品和服務已經滲透進各行各業中,其帶來的智能革命,被認為可以媲美工業革命和電力革命。

然而,大模型固有的幻覺(hallucination),一直是阻礙大模型進一步落地應用的因素之一。這讓一部分人認為,大多由 LLM 生成的內容根本無法令人信服,甚至非常糟糕

今天,德國理論物理學家、作家和音樂家 Sabine Hossenfelder 便在 X 上發表長文,怒噴 LLM“繼續編造鏈接、參考文獻和引文”

她寫道,“我真心不明白為什么有些人還看好 LLM......我要求它們提供所謂引文的來源,我點擊鏈接,返回的卻是 404 錯誤。我用谷歌搜索所謂的引文,根本不存在。他們引用了一份科學出版物,我查了一下,根本不存在。”

她甚至嘲諷道,“有一件事倒是省了我不少時間,那就是單位換算和收集各種常數。不過你會覺得,這不應該需要一個耗資數億美元的 LLM 來完成。”

完整推文如下:


我真心不明白為什么有些人還看好大語言模型(LLM)。


我每天都在使用 GPT、Grok、Gemini、Mistral 等,希望它們能幫我節省搜索信息和總結信息的時間。它們繼續編造鏈接、參考文獻和引文,就像它們從第一天開始做的那樣。


我要求它們提供所謂引文的來源,我點擊鏈接,返回的卻是 404 錯誤。我用谷歌搜索所謂的引文,根本不存在。他們引用了一份科學出版物,我查了一下,根本不存在。


這種情況經常發生。


是的,在過去的兩年里,情況有所好轉,因為有了 DeepSearch 和思維鏈(CoT),大約有 50-60% 左右的參考文獻是存在的。據我個人估計,目前 GPT-4o 的 DeepResearch 是最好的。尤其是 Grok,即使被要求提供參考文獻,它也經常不提供。它似乎連推文都無法鏈接。這讓人非常沮喪。


是的,我試過 Gemini,它更糟糕,因為它甚至經常拒絕搜索來源,而是給我如何自己操作的說明。因為這個原因,我就不再用它了。


我還用它們快速估算數量級,但它們總是出錯。有一件事倒是省了我不少時間,那就是單位換算和收集各種常數。不過你會覺得,這不應該需要一個耗資數億美元的 LLM 來完成。


昨天,我把一篇論文上傳到 GPT,想讓它寫個摘要,它卻告訴我這篇論文是 2023 年的,而 PDF 的頁眉上明明寫著是 2025 年的。我甚至不知道這到底是怎么回事,但這遠非智能。


我感覺到,現在很多人都認為知識圖譜可以解決 LLM 的問題,但不,它們不能。它們不能。


即使知識圖譜可以 100% 防止邏輯不一致,但仍有許多文本結構在邏輯上完全一致,卻與現實毫無關系。


公司將繼續大力推廣 LLM,直到有一天,一個新的玩家提出了一種不同類型的人工智能(AI)模型,并迅速超越了它們。到了那一天,很多公司的估值顯然被嚴重高估了。對股市來說,這將是非常糟糕的一天。

https://x.com/skdh/status/1905132853672784121

本文僅為作者觀點,不代表學術頭條的立場。

整理:學術君

如需轉載或投稿,請直接在公眾號內留言

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
專打國家元首的金牛座導彈抵烏!紅場勝利日閱兵式需要掂量了

專打國家元首的金牛座導彈抵烏!紅場勝利日閱兵式需要掂量了

大風文字
2025-04-25 18:56:10
又美又颯!吳艷妮13米00奪第七:戰斗天使真美,挑戰世界頂尖選手

又美又颯!吳艷妮13米00奪第七:戰斗天使真美,挑戰世界頂尖選手

李喜林籃球絕殺
2025-04-26 21:09:17
調度中心不雅畫面人員被停職調查,知情者披露兩人疑似身份內情

調度中心不雅畫面人員被停職調查,知情者披露兩人疑似身份內情

Likepres
2025-04-25 22:29:07
儲戶慌嗎?存款方面迎來4個方面的調整,已存的人咋辦?

儲戶慌嗎?存款方面迎來4個方面的調整,已存的人咋辦?

話史官1
2025-04-26 15:03:19
深圳殉情男子遺書稱想與妻子合葬 岳母:連女兒的牙刷他都不舍得丟 想不到他深情到這個地步

深圳殉情男子遺書稱想與妻子合葬 岳母:連女兒的牙刷他都不舍得丟 想不到他深情到這個地步

閃電新聞
2025-04-26 10:42:31
小米YU9曝光,雷軍讓3億中產沸騰了

小米YU9曝光,雷軍讓3億中產沸騰了

互聯網品牌官
2025-04-24 16:06:32
喬-科爾:希望穆里尼奧回英超,想在三、四年內奪冠找他就對了

喬-科爾:希望穆里尼奧回英超,想在三、四年內奪冠找他就對了

直播吧
2025-04-26 21:55:12
2025年一季度出口值30強城市:蘇州、寧波環比大增,鄭州漲勢喜人

2025年一季度出口值30強城市:蘇州、寧波環比大增,鄭州漲勢喜人

Data居士
2025-04-26 10:59:59
美麗的新娘

美麗的新娘

動物奇奇怪怪
2025-04-27 00:35:07
69年九大名單出爐,毛主席發怒:怎么沒他?此人痛哭:主席記得我

69年九大名單出爐,毛主席發怒:怎么沒他?此人痛哭:主席記得我

可樂88
2024-04-26 09:14:34
不滿裁判吹罰?崔康熙:大家都是足球人 有些問題我沒法直說

不滿裁判吹罰?崔康熙:大家都是足球人 有些問題我沒法直說

球事百科吖
2025-04-27 04:40:14
航母才是最大的捕魚船?遼寧艦每次帶回數十噸海鮮,全部銷毀!

航母才是最大的捕魚船?遼寧艦每次帶回數十噸海鮮,全部銷毀!

百態人間
2025-04-22 16:26:25
中年女人有意讓你“拿下”,會有一個表現:兩個字

中年女人有意讓你“拿下”,會有一個表現:兩個字

蓮子說情感
2025-01-11 10:26:07
王勵勤遇當頭一棒!國乒大潰敗,單打16人參賽15人出局;日本強勢

王勵勤遇當頭一棒!國乒大潰敗,單打16人參賽15人出局;日本強勢

莼侃體育
2025-04-26 08:27:26
王菲現身謝霆鋒演唱會!《玉蝴蝶》唱響時,王菲陶醉起舞,太甜了

王菲現身謝霆鋒演唱會!《玉蝴蝶》唱響時,王菲陶醉起舞,太甜了

叨嘮
2025-04-26 02:45:58
1-0大冷門,90分鐘絕殺,英冠第22掀翻英冠第6,蘭帕德率隊2連敗

1-0大冷門,90分鐘絕殺,英冠第22掀翻英冠第6,蘭帕德率隊2連敗

側身凌空斬
2025-04-26 21:39:34
北京房價:泡沫與走勢分析

北京房價:泡沫與走勢分析

流蘇晚晴
2025-04-26 21:36:36
殺人誅心!大S離世后,小玥兒的第一個生日現場曝光,網友集體破防了

殺人誅心!大S離世后,小玥兒的第一個生日現場曝光,網友集體破防了

瞎說娛樂
2025-04-26 10:55:49
大比分2-1!塔圖姆空砍36+9,黑馬雙星合砍61分,凱爾特人遭逆轉

大比分2-1!塔圖姆空砍36+9,黑馬雙星合砍61分,凱爾特人遭逆轉

老梁體育漫談
2025-04-26 10:06:15
突降6℃!湖北接下來大反轉

突降6℃!湖北接下來大反轉

魯中晨報
2025-04-26 11:20:10
2025-04-27 05:28:49
學術頭條
學術頭條
致力于學術傳播和科學普及,重點關注人工智能、生命科學等前沿科學進展。
1247文章數 5069關注度
往期回顧 全部

科技要聞

百度心響實測:“能用版Manus”開了個好頭

頭條要聞

特朗普將舉行集會慶祝執政100天 美媒:時機不妙

頭條要聞

特朗普將舉行集會慶祝執政100天 美媒:時機不妙

體育要聞

廣廈19分勝遼寧獲開門紅 孫銘徽13分3助崴腳

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

房產
健康
手機
數碼
軍事航空

房產要聞

教育理念再進階!解碼新世界星輝如何構筑「家校社成長生態圈」!

唇皰疹和口腔潰瘍是"同伙"嗎?

手機要聞

vivo大折疊屏新機曝光,三季度登場

數碼要聞

AMD修補高危安全漏洞!歷代Zen架構CPU 100%中招

軍事要聞

白宮爭吵后特朗普與澤連斯基"首度"碰面

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 方城县| 邯郸市| 青州市| 南和县| 瓮安县| 扶沟县| 达拉特旗| 莱芜市| 旬阳县| 迁西县| 永州市| 镇巴县| 伊吾县| 丹东市| 分宜县| 府谷县| 三台县| 海兴县| 阿荣旗| 通榆县| 肇州县| 双鸭山市| 三台县| 炎陵县| 淮阳县| 富阳市| 安吉县| 五原县| 盐池县| 都江堰市| 临桂县| 潮安县| 义乌市| 滦南县| 双流县| 浦北县| 萍乡市| 周宁县| 唐海县| 安宁市| 临江市|