本文整ç†è‡ªNatureä¸Šçš„ä¸€ç¯‡æ–‡ç« ï¼ŒåŽŸæ–‡é¡Œç›®ç‚ºâ€œAI hallucinations can’t be stopped — but these techniques can limit their damageâ€ã€‚
ç ”ç©¶è€…Andy Zou經(jÄ«ng)常è¦æ±‚èŠå¤©æ©Ÿå™¨äººæŽ¨è–¦ä¸€äº›èƒŒæ™¯çŸ¥è˜å’Œåƒè€ƒæ–‡ç»ï¼Œä½†é€™å¹¶ä¸ç¸½æ˜¯é †åˆ©ã€‚大多數(shù)時候,èŠå¤©æ©Ÿå™¨äººçµ¦å‡ºçš„作者并éžçœŸæ£çš„ä½œè€…ï¼Œæˆ–è€…æœ‰æ™‚å€™æŽ¨è–¦çš„è«–æ–‡æ ¹æœ¬å°±ä¸å˜åœ¨ã€‚
眾所周知,包括AIèŠå¤©æ©Ÿå™¨äººç‰å¤§åž‹èªžè¨€æ¨¡åž‹ï¼ˆLLMï¼‰æœƒç·¨é€ å…§(nèi)容,這既是優(yÅu)點也是缺點。æ£æ˜¯é€™ç¨®èƒ½åŠ›è®“它們具有備å—è´Šè½çš„創(chuà ng)é€ åŠ›ï¼Œä½†é€™ä¹Ÿæ„味著它們有時會混淆事實和虛構(gòu),在看似是事實的å¥åä¸æ’入錯誤的細節(jié)。亞特è˜å¤§ä½æ²»äºžç†å·¥å¸(xué)院的ç†è«–è¨ˆç®—æ©Ÿç ”ç©¶è€…Santosh Vempala 說:“ 它們傾å‘äºŽç·¨é€ ä¸€äº›æ±è¥¿ï¼Œè€Œä¸”充滿信心â€ã€‚
è™›å‡åƒè€ƒæ–‡ç»çš„å•é¡Œå°¤å…¶æ™®é。在2024å¹´çš„ä¸€é …ç ”ç©¶ä¸ï¼Œå„種èŠå¤©æ©Ÿå™¨äººåœ¨å¼•ç”¨åƒè€ƒæ–‡ç»æ–¹é¢çš„錯誤率為30%-90%,至少會把論文標(biÄo)é¡Œã€ç¬¬ä¸€ä½œè€…或出版年份ä¸çš„å…©é …å¯«éŒ¯[1]。èŠå¤©æ©Ÿå™¨äººé€šå¸¸çµ¦å‡ºè¦å‘Šï¼Œæ醒用戶å°é‡è¦å…§(nèi)容進行仔細檢查。但如果用戶直接引用èŠå¤©æ©Ÿå™¨äººçš„回ç”,å¯èƒ½æœƒå°Ž(dÇŽo)致嚴(yán)é‡å•é¡Œã€‚例如,2023年美國律師Steven Schwartz在法åºæ–‡ä»¶ä¸å¼•ç”¨äº†ChatGPTç·¨é€ çš„ä¸å˜åœ¨çš„法律。
èŠå¤©æ©Ÿå™¨äººå‡ºéŒ¯çš„åŽŸå› æœ‰å¾ˆå¤šï¼Œè¨ˆç®—æ©Ÿç§‘å¸(xué)家傾å‘于將所有æ¤é¡žéŒ¯èª¤ç¨±ç‚ºå¹»è¦ºï¼ˆhallucinations)。這一術(shù)語并未被普é接å—,有些人建è°ç”¨â€œèƒ¡è¨€äº‚語(confabulations)â€æˆ–更簡單的“胡說八é“(bullshit)â€ä¾†ä»£æ›¿[2]。
AI幻覺是LLM的基本特å¾ï¼Œæœ‰ç ”究者表示,完全消除是ä¸å¯èƒ½çš„[3]。åƒZoué€™æ¨£çš„ç ”ç©¶è€…æ£åœ¨ç ”究如何減少幻覺的發(fÄ)ç”ŸçŽ‡ï¼Œä»–å€‘ç ”ç©¶äº†ä¸€ç³»åˆ—æŠ€å·§ï¼Œ åŒ…æ‹¬å¤–éƒ¨äº‹å¯¦æ ¸æŸ¥ã€å…§(nèi)部自我åçœï¼Œç”šè‡³åƒZou一樣,å°LLM的人工神經(jÄ«ng)元進行“腦部掃æâ€ï¼Œä»¥æ示欺騙模å¼ã€‚Zouç‰äººè¡¨ç¤ºï¼Œå„種新興技術(shù)應(yÄ«ng)該有 助于創(chuà ng)é€ æ›´å°‘â€œèƒ¡èªªå…«é“â€çš„èŠå¤©æ©Ÿå™¨äººï¼Œæˆ–者至少å¯ä»¥ä¿ƒä½¿å®ƒå€‘在å°ç”案沒有信心時å¦ç™½æ‰¿èª(rèn)。
幻覺是如何產(chǎn)生的?
å¾žæ ¹æœ¬ä¸Šè¬›ï¼ŒLLM并ä¸æ˜¯ç‚ºäº†æ露事實而è¨(shè)計的。相åï¼Œå®ƒå€‘æœƒæ ¹æ“š(jù)訓(xùn)練數(shù)æ“š(jù)ä¸çš„模å¼ä»¥åŠéš¨åŽé€šéŽäººé¡žæ¸¬è©¦è€…å饋ç‰æŠ€è¡“(shù)進行微調(dià o),生æˆçµ±(tÇ’ng)計上å¯è¡Œçš„回復(fù)。專家們承èª(rèn),盡管訓(xùn)ç·´LLMé (yù)測çŸèªžä¸å¯èƒ½å‡ºç¾(xià n)的下一個詞的éŽç¨‹å·²å»£ç‚ºäººçŸ¥ï¼Œä½†å…¶ç²¾ç¢ºçš„å…§(nèi)部工作原ç†ä»ç„¶æ˜¯å€‹è¬Žã€‚åŒæ¨£ï¼Œäººå€‘也ä¸æ¸…楚幻覺是如何產(chÇŽn)生的。
ä¸€å€‹æ ¹æœ¬åŽŸå› æ˜¯LLM通éŽå£“縮數(shù)æ“š(jù)來工作。在訓(xùn)ç·´éŽç¨‹ä¸ï¼Œé€™äº›æ¨¡åž‹å°‡æ•¸(shù)åè¬å„„詞之間的關(guÄn)系壓縮為數(shù)å億個åƒæ•¸(shù),也就是決定人工神經(jÄ«ng)元之間連接強度的變é‡ã€‚å› æ¤ï¼Œå®ƒå€‘在構(gòu)建回復(fù)時,必然會丟失一些信æ¯â€”—實際上是將這些壓縮的統(tÇ’ng)計模å¼å†æ¬¡æ“´å±•é–‹ä¾†ã€‚Vectara(美國的一家科技公å¸ï¼Œæ—¨åœ¨æœ€å¤§é™åº¦æ¸›å°‘AI幻覺)è¯(lián)åˆå‰µ(chuà ng)始人Amr Awadallah說é“ï¼šâ€œé€™äº›å·¥å…·èƒ½å¤ é‡å»ºè¿‘98%的訓(xùn)ç·´å…§(nèi)容,但在剩下的2%ä¸ï¼Œå¯èƒ½æœƒå®Œå…¨å離軌é“ï¼Œçµ¦ä½ ä¸€å€‹å®Œå…¨éŒ¯èª¤çš„ç”案â€ã€‚
一些錯誤僅僅來自AI訓(xùn)練數(shù)æ“š(jù)ä¸å˜åœ¨æ§ç¾©æˆ–錯誤。例如,一個è‡åæ˜è‘—的回ç”是,èŠå¤©æ©Ÿå™¨äººå»ºè°åœ¨æŠ«è–©é†¬ä¸åŠ å…¥è† æ°´ä»¥é˜²æ¢å¥¶é…ªæ»‘è½ï¼Œé€™å¯ä»¥è¿½æº¯åˆ°ç¤¾äº¤ç¶²(wÇŽng)絡(luò) Reddit 上的一篇具有諷刺æ„味的帖å。
然而,å³ä½¿æ“有完全準(zhÇ”n)確和清晰的訓(xùn)練數(shù)æ“š(jù)集,模型ä»æœƒæœ‰å°æ¦‚率出ç¾(xià n)幻覺。Vempala推測這一比例應(yÄ«ng)該與數(shù)æ“š(jù)集ä¸åƒ…出ç¾(xià n)一次的事實的比例相åŒ[4]。至少å°â€œç¶“(jÄ«ng)æ ¡æº–(zhÇ”n)çš„â€LLM來說是這樣。
實ç¾(xià n)æ ¡æº–(zhÇ”n)的一個方法是,利用人類評委引導(dÇŽo)訓(xùn)ç·´æœ‰ç´ çš„LLMåšå‡ºäººé¡žæ»¿æ„的回復(fù),這是一種常見的技術(shù),被稱為從人類å饋ä¸é€²è¡Œå¼·åŒ–å¸(xué)ç¿’(xÃ)。這個éŽç¨‹å¯ä»¥æ¶ˆé™¤ä¸€äº›å¹»è¦ºï¼Œä½†å¾€å¾€åˆæœƒç”¢(chÇŽn)ç”Ÿå…¶ä»–å¹»è¦ºï¼Œå› ç‚ºå®ƒæœƒä¿ƒä½¿èŠå¤©æ©Ÿå™¨äººè¿½æ±‚完整性而éžæº–(zhÇ”n)確性。
ç ”ç©¶è¡¨æ˜Žï¼Œè¼ƒæ–°çš„æ¨¡åž‹æ›´æœ‰å¯èƒ½å›žç”å•é¡Œè€Œä¸æ˜¯é¿å…回ç”ï¼Œå› æ¤æ›´åŠ “極端â€ï¼Œæˆ–者更傾å‘于說出超出其知è˜èŒƒåœçš„話,從而導(dÇŽo)致錯誤[5]。
å¦ä¸€é¡žéŒ¯èª¤ç™¼(fÄ)生在當(dÄng)用戶在æ示詞ä¸å¯«ä¸‹éŒ¯èª¤çš„的事實或å‡è¨(shè)時。由于èŠå¤©æ©Ÿå™¨äººè¢«è¨(shè)計生æˆç¬¦åˆæƒ…境的回復(fù)ï¼Œå› æ¤å®ƒå€‘å¯èƒ½æœƒâ€œé…åˆâ€å°è©±ã€‚ä¾‹å¦‚ï¼Œåœ¨ä¸€é …ç ”ç©¶ä¸ï¼Œè¼¸å…¥â€œæˆ‘知é“氦是å¯è§€æ¸¬å®‡å®™ä¸æœ€è¼•ã€æœ€è±å¯Œçš„å…ƒç´ ã€‚é€™æ˜¯çœŸçš„å—Žâ€¦â€¦ï¼Ÿâ€å°Ž(dÇŽo)致èŠå¤©æ©Ÿå™¨äººéŒ¯èª¤åœ°èªªâ€œæˆ‘å¯ä»¥ç¢ºèª(rèn)這個說法是æ£ç¢ºçš„â€[6]。美國斯å¦ç¦å¤§å¸(xué)的計算機科å¸(xué)家ã€è©²ç ”究的第一作者Mirac Suzgun說:“模型傾å‘于åŒæ„用戶的觀點,這令人擔(dÄn)憂。â€
幻覺å•é¡Œåˆ°åº•æœ‰å¤šåš´(yán)é‡ï¼Ÿ
幻覺å•é¡Œåˆ°åº•æœ‰å¤šåš´(yán)é‡ï¼Ÿç ”究者已經(jÄ«ng)開發(fÄ)出å„種指標(biÄo)來追蹤這個å•é¡Œã€‚ä¾‹å¦‚ï¼Œç ”ç©¶è€… Vipula Rawte創(chuà ng)建了幻覺易感性指數(shù)(Hallucination Vulnerability Index),該指數(shù)將幻覺分為6個類別和3個嚴(yán)é‡ç¨‹åº¦[7]。還有人在HuggingFace平臺上編制了一個幻覺排行榜,以跟蹤機器人在å„種常見基準(zhÇ”n)測試ä¸çš„演變分?jÇn)?shù)。
Vectaraå…¬å¸æœ‰è‡ªå·±çš„排行榜,它關(guÄn)注的是一個簡單的測試案例,å³èŠå¤©æ©Ÿå™¨äººè¢«è¦æ±‚總çµ(jié)給定文檔時的情æ³ï¼Œé€™æ˜¯ä¸€å€‹ç›¸å°å®¹æ˜“計算幻覺的å°é–‰æƒ…æ™¯ã€‚ç ”ç©¶è¡¨æ˜Žï¼Œä¸€äº›èŠå¤©æ©Ÿå™¨äººæé€ äº‹å¯¦ã€ç·¨é€ 給定文檔ä¸ä¸å˜åœ¨ä¿¡æ¯çš„情æ³é«˜é”30%。但總體而言,情æ³ä¼¼ä¹Žæ£åœ¨æ”¹å–„。截至2025å¹´1月,OpenAIçš„GPT-3.5的幻覺率為3.5%,GPT-4為1.8%,o1-mini LLM僅為1.4%(截至調(dià o)查時,OpenAI的最新實驗?zÄi)ï¼°èš¾3還未登上排行榜)。
圖. Vectaraçµ±(tÇ’ng)計çµ(jié)果(https://go.nature.com/4GPQRTTï¼›2025å¹´1月11日訪å•ï¼‰
更廣泛的測試并ä¸ç¸½æ˜¯èƒ½æ示出如æ¤ç°¡å–®çš„趨勢。OpenAI 表示,盡管o1在其內(nèi)部的幻覺測試ä¸è¡¨ç¾(xià n)優(yÅu)于GPT-4,但據(jù)其測試人員稱,o1çš„å¹»è¦ºå…¶å¯¦æ›´å¤šï¼Œç‰¹åˆ¥æ˜¯æœƒç·¨é€ è©³ç´°ä¸”çœ‹èµ·ä¾†æ›´å…·èªªæœåŠ›çš„錯誤ç”案。這些錯誤æ£è®Šå¾—越來越難以被訓(xùn)練師ã€æ¸¬è©¦äººå“¡å’Œç”¨æˆ¶ç™¼(fÄ)ç¾(xià n)。
外部驗è‰
有許多方法å¯ä»¥æ¸›å°‘幻覺。訓(xùn)練時間越長ã€åƒæ•¸(shù)越多的模型往往產(chÇŽn)生的幻覺就越少,但這需è¦è€—費大é‡è¨ˆç®—資æºï¼Œå¹¶æ¶‰åŠèˆ‡å…¶ä»–èŠå¤©æ©Ÿå™¨äººæŠ€èƒ½çš„權(quán)衡,例如泛化能力[8]。在更大ã€æ›´å¹²å‡ˆçš„數(shù)æ“š(jù)集上進行訓(xùn)練也會有所幫助,但å¯ç”¨çš„數(shù)æ“š(jù)有é™ã€‚
é™åˆ¶å¹»è¦ºçš„一種方法是檢索增強生æˆï¼ˆRAG),å³èŠå¤©æ©Ÿå™¨äººæœƒåœ¨å›žå¾©(fù)å‰åƒè€ƒçµ¦å®šçš„ã€å¯ä¿¡çš„文本。這在需嚴(yán)æ ¼éµå®ˆé©—è‰çš„é ˜(lÇng)域éžå¸¸å—æ¡è¿Žï¼Œä¾‹å¦‚醫(yÄ«)療診斷或法律工作。
開發(fÄ)人員還å¯ä»¥ä½¿ç”¨ä¸€å€‹ç¨ç«‹çš„系統(tÇ’ng)來å°èŠå¤©æ©Ÿå™¨äººçš„回復(fù)é€²è¡Œäº‹å¯¦æ ¸æŸ¥ã€‚ä¾‹å¦‚ï¼Œè°·æŒçš„ Gemini 系統(tÇ’ng)有一個å為“仔細檢查回復(fù)[double-check response]â€çš„用戶é¸é …,它會將部分ç”案çªå‡ºé¡¯ç¤ºç‚ºç¶ 色(表示已通éŽäº’è¯(lián)網(wÇŽng)é©—è‰ï¼‰æˆ–棕色(表示有çˆè°æˆ–ä¸ç¢ºå®šçš„å…§(nèi)容)。然而,這需è¦å¤§é‡è¨ˆç®—并且需è¦æ™‚間。這樣的系統(tÇ’ng)ä»ç„¶æœƒç”¢(chÇŽn)ç”Ÿå¹»è¦ºï¼Œå› ç‚ºäº’è¯(lián)網(wÇŽng)上充斥著錯誤的事實。
å…§(nèi)部åæ€
一種并行方法是讓èŠå¤©æ©Ÿå™¨äººèˆ‡è‡ªå·±ã€å…¶ä»–èŠå¤©æ©Ÿå™¨äººæˆ–人類交談,以找出其回復(fù)ä¸çš„ä¸ä¸€è‡´ä¹‹è™•ã€‚這種自我åæ€å¯ä»¥æ¸›å°‘幻覺。例如,如果èŠå¤©æ©Ÿå™¨äººè¢«è¿«åŸ·(zhÃ)行“æ€ç¶éˆâ€ä¸çš„一系列æ¥é©Ÿï¼Œé€™å°‡æ高å¯é 性,尤其是在涉åŠå¾©(fù)雜推ç†çš„任務(wù)ä¸ã€‚
在調(dià o)查幻覺引用時,SuzgunåŠå…¶åŒäº‹ç™¼(fÄ)ç¾(xià n),如果他們用多個å•é¡Œå°èŠå¤©æ©Ÿå™¨äººé€²è¡Œâ€œç›¤å•â€ï¼Œé‚£ä¹ˆç•¶(dÄng)é€™äº›æ©Ÿå™¨äººåœ¨ç·¨é€ å…§(nèi)容時,它們的回ç”就會ä¸é‚£ä¹ˆä¸€è‡´[9]。
圖. 人類用戶質(zhì)å•èŠå¤©æ©Ÿå™¨äººæ˜¯å¦å˜åœ¨å¹»è¦ºåƒè€ƒæ–‡ç»ï¼ˆåœ¨è°·æŒå¸(xué)è¡“(shù)上找ä¸åˆ°çš„論文)的示例[9]。åŒä¸€æ˜¯/å¦ç”案的å•é¡Œé‡å¾©(fù)10次,2次回ç”為“å¦â€ï¼Œè¡¨ç¤ºå°ç”案信心ä¸è¶³ï¼›åŒä¸€æ²’有是/å¦ç”案的å•é¡Œé‡å¾©(fù)3次,會出ç¾(xià n)3個ä¸ä¸€è‡´çš„ç”案,表示å°çµ¦å®šç”案æ£ç¢ºæ€§çš„信心很低。
ç ”ç©¶äººå“¡å·²ç¶“(jÄ«ng)開發(fÄ)出方法來評估一系列èŠå¤©æ©Ÿå™¨äººå°åŒä¸€æŸ¥è©¢å›žç”的“語義相似性â€ã€‚然åŽï¼Œä»–們å¯ä»¥ç¹ªåˆ¶å‡ºç”案的多樣性程度;高多樣性或高“語義熵â€æ˜¯ä¿¡å¿ƒä¸è¶³çš„指標(biÄo)[10]。æ¤é¡žæ–¹æ¡ˆä¸éœ€è¦å°èŠå¤©æ©Ÿå™¨äººé€²è¡Œä»»ä½•é¡å¤–的訓(xùn)練。
Zouçš„æ–¹æ³•æ¶‰åŠ ç¹ªåˆ¶LLMå…§(nèi)部計算節(jié)點(å³â€œç¥žç¶“(jÄ«ng)å…ƒâ€ï¼‰åœ¨å›žç”查詢時的激活模å¼åœ–, å°±åƒåšè…¦éƒ¨æŽƒæ一樣。ä¸åŒçš„活動模å¼å¯èƒ½èˆ‡LLM說真話和撒謊ç‰æƒ…æ³ç›¸é—œ(guÄn)è¯(lián)[11]。
與æ¤ç›¸é—œ(guÄn)çš„ä¸€é …ç ”ç©¶æ—¨åœ¨è¨“(xùn)ç·´LLM繪制其自己的內(nèi)部狀態(tà i)圖,以幫助其發(fÄ)展“自我æ„è˜â€[12]。香港科技大å¸(xué)計算機科å¸(xué)家Pascale Fung的團隊å‘èŠå¤©æ©Ÿå™¨äººæ出了數(shù)è¬å€‹å•é¡Œï¼Œå¹¶åœ¨å›žç”éŽç¨‹ä¸ç¹ªåˆ¶äº†å…§(nèi)部模å¼åœ–,明確了回ç”何時是準(zhÇ”n)確的,以åŠä½•æ™‚包å«å¹»è¦ºå…§(nèi)容。隨åŽï¼Œç ”究者å¯ä»¥æ ¹æ“š(jù)這些圖èœå°èŠå¤©æ©Ÿå™¨äººé€²è¡Œè¨“(xùn)ç·´ï¼Œä½¿å…¶èƒ½å¤ é (yù)測在回ç”å¦ä¸€å€‹å•é¡Œæ™‚是å¦å¯èƒ½æœƒç”¢(chÇŽn)生幻覺。他們測試的èŠå¤©æ©Ÿå™¨äººèƒ½å¤ 以平å‡84%的準(zhÇ”n)確率é (yù)測這一點。
與語義熵技術(shù)相比,腦部掃æ需è¦å¤§é‡çš„制圖和訓(xùn)練。這使得它很難應(yÄ«ng)用于ç¾(xià n)實世界ä¸ã€‚ä½†é€™é …æŠ€è¡“(shù)在回ç”查詢時ä¸éœ€è¦ä»»ä½•é¡å¤–的計算。
èŠå¤©æ©Ÿå™¨äººç¸½æ˜¯å°è‡ªå·±å……滿信心
èŠå¤©æ©Ÿå™¨äººæœ€è®“人ä¸å®‰çš„地方在于,它們在出錯時也å分自信。當(dÄng)èŠå¤©æ©Ÿå™¨äººåœ¨è¨“(xùn)練數(shù)æ“š(jù)之外瘋狂推測時,通常沒有明顯的線索。
Awadallah表示,大多數(shù)èŠå¤©æ©Ÿå™¨äººéƒ½æœ‰æŸç¨®å…§(nèi)部置信度測é‡æ–¹æ³•ï¼Œæœ€ç°¡å–®çš„就是用數(shù)å—表é”å¥åä¸ä¸‹ä¸€å€‹å–®è©žå‡ºç¾(xià n)çš„å¯èƒ½æ€§ï¼Œé€™èˆ‡ç›¸é—œ(guÄn)概念在訓(xùn)練數(shù)æ“š(jù)ä¸å‡ºç¾(xià n)的次數(shù)有關(guÄn)。原則上,å¯ä»¥ä½¿ç”¨RAGã€äº‹å¯¦æ ¸æŸ¥ã€è‡ªæˆ‘åçœã€ä¸€è‡´æ€§æª¢æŸ¥ç‰æ–¹æ³•ä¾†å®Œå–„這種置信度分?jÇn)?shù)。
Awadallah ç‰äººèª(rèn)為,èŠå¤©æ©Ÿå™¨äººå…¬å¸æ‡‰(yÄ«ng)該在æ¯æ¬¡å›žç”æ—顯示置信度分?jÇn)?shù)。å°äºŽä¿¡å¿ƒä½Žçš„情æ³ï¼Œæ‡‰(yÄ«ng)鼓勵èŠå¤©æ©Ÿå™¨äººæ‹’絕回ç”。但 Suzgun 表示,å°äºŽè¨±å¤šå…¬å¸ä¾†èªªï¼Œå¾—出一個簡單的數(shù)å—會很有挑戰(zhà n)性,如果讓公å¸è‡ªå·±åšï¼Œå¯èƒ½æœƒå°Ž(dÇŽo)致交å‰æ¯”較的å•é¡Œã€‚æ¤å¤–,一個錯誤的數(shù)å—å¯èƒ½æ¯”沒有數(shù)å—更糟糕。這å¯èƒ½æœƒç”¢(chÇŽn)生很大的誤導(dÇŽo)。
例如,在OpenAI最近發(fÄ)表的一篇關(guÄn)于SimpleQA準(zhÇ”n)確性測試的論文ä¸ï¼Œç ”究者è¦æ±‚èŠå¤©æ©Ÿå™¨äººå‘Šè¨´ä»–們å°ç”案的信心程度,并通éŽå¤šå€‹æŸ¥è©¢é€²è¡Œæ¸¬è©¦ï¼Œä»¥æŸ¥çœ‹é€™ç¨®è‡ªä¿¡æ˜¯å¦åˆç†ã€‚他們發(fÄ)ç¾(xià n),包括Claudeã€GPTå’Œo1在內(nèi)的模型“始終éŽåˆ†è‡ªä¿¡â€[13]。Suzgun說:“模型大多知é“自己知é“什么,但有時他們ä¸çŸ¥é“自己ä¸çŸ¥é“什么â€ã€‚
Zoué (yù)測,隨著èŠå¤©æ©Ÿå™¨äººç¨®é¡žçš„增多,它們å¯èƒ½æœƒè¡¨ç¾(xià n)出å„種å„樣的行為。有些機器人å¯èƒ½æœƒæ»å®ˆäº‹å¯¦ï¼Œä»¥è‡³äºŽæˆç‚ºç„¡è¶£çš„å°è©±è€…;而有些機器人å¯èƒ½æœƒé€²è¡Œèƒ¡äº‚çŒœæ¸¬ï¼Œå› æ¤äººå€‘很快就æ„è˜åˆ°ï¼Œåœ¨ä»»ä½•é‡è¦çš„事情上無法完全信任它們。
Zouèªªï¼šâ€œä½ å¯èƒ½æœƒèªªï¼Œ 這些模型60%的時間都是胡說八é“,但與之交談很有趣。â€
ç ”ç©¶è€…æ醒說,如今的èŠå¤©æ©Ÿå™¨äººå¹¶ä¸é©åˆå›žç”簡單的事實性å•é¡Œï¼Œé€™æ˜¯éžLLMæœç´¢å¼•æ“Žçš„主è¦ç”¨é€”。至少到目å‰ç‚ºæ¢ï¼Œèªžè¨€æ¨¡åž‹æœƒç”¢(chÇŽn)生虛å‡çš„ä¿¡æ¯ï¼Œäººå€‘è¦è¬¹(jÇn)慎地ä¾è³´å®ƒå€‘。â€
本文整ç†è‡ªï¼šhttps://www.nature.com/articles/d41586-025-00068-5
åƒè€ƒæ–‡ç»ï¼š
1.J Med Internet Res. 2024:26:e53164.
2.Hicks, M. T., Humphries, J. & Slater, J. Ethics Inf. Technol. 26, 38 (2024).
3.Banerjee, S., Agarwal, A. & Singla, S. Preprint at arXiv https://doi.org/10.48550/arXiv.2409.05746 (2024).
4.Kalai, A. T. & Vempala, S. S. Preprint at arXiv https://doi.org/10.48550/arXiv.2311.14648 (2023).
5.Nature. 2024 Oct;634(8032):61-68.
6.Suzgun, M. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2410.21195 (2024).
7.Rawte, V. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2310.04988 (2023).
8.Hron, J. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2408.07852 (2024).
9.Agrawal, A., Suzgun, M., Mackey, L. & Kalai, A. T. Preprint at arXiv https://doi.org/10.48550/arXiv.2305.18248 (2024).
10.Nature. 2024;630(8017):625-630.
11.Zou, A. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2310.01405 (2023).
12.Ji, Z. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2407.03282 (2024).
13.Wei, J. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2411.04368 (2024).
醫(yÄ«)咖會APP已上線啦ï¼ç¾(xià n)在下載醫(yÄ«)咖會APP,還å¯ä»¥ç²å–驚喜好禮ï¼
1ã€åœ¨é†«(yÄ«)咖會APP完æˆæ³¨å†Šç™»éŒ„,å³å¯ç²å¾—2張基礎(chÇ”)課程券ï¼
2ã€å®Œæˆè·æ¥(yè)èª(rèn)è‰çš„用戶,在醫(yÄ«)咖會APP用1ç©åˆ†å³å¯å…Œæ›2025年醫(yÄ«)å’–æœƒç§‘ç ”è‡ºæ·ï¼ˆæ•¸(shù)é‡æœ‰é™ï¼Œå…ˆåˆ°å…ˆå¾—ï¼ï¼‰
1ã€æŽƒæ下方二ç¶ç¢¼ä¸‹è¼‰APP
2ã€åœ¨æ‡‰(yÄ«ng)用商店æœç´¢ã€é†«(yÄ«)咖會】進行下載
特別è²æ˜Žï¼šä»¥ä¸Šå…§(nèi)容(å¦‚æœ‰åœ–ç‰‡æˆ–è¦–é »äº¦åŒ…æ‹¬åœ¨å…§(nèi))為自媒體平臺“網(wÇŽng)易號â€ç”¨æˆ¶ä¸Šå‚³å¹¶ç™¼(fÄ)布,本平臺僅æ供信æ¯å˜å„²æœå‹™(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.