ç¶²(wÇŽng)æ˜“é¦–é > ç¶²(wÇŽng)æ˜“è™Ÿ > æ£æ–‡ ç”³è«‹å…¥é§

èŠå¤©æ©Ÿå™¨äººæœ‰æ™‚å€™æœƒâ€œèƒ¡èªªå…«é“â€ï¼ŒGPTç‰æ¨¡åž‹çš„â€œå¹»è¦ºçŽ‡â€æœ‰å¤šé«˜ï¼Ÿ

2025-02-02 19:05:14ã€€ä¾†æº: é†«(yÄ«)å’–æœƒ

åŒ—äº¬ èˆ‰å ±

åˆ†äº«è‡³

æœ¬æ–‡æ•´ç†è‡ªNatureä¸Šçš„ä¸€ç¯‡æ–‡ç« ï¼ŒåŽŸæ–‡é¡Œç›®ç‚ºâ€œAI hallucinations canâ€™t be stopped â€” but these techniques can limit their damageâ€ã€‚

ç ”ç©¶è€…Andy Zouç¶“(jÄ«ng)å¸¸è¦æ±‚èŠå¤©æ©Ÿå™¨äººæŽ¨è–¦ä¸€äº›èƒŒæ™¯çŸ¥è˜å’Œåƒè€ƒæ–‡ç»ï¼Œä½†é€™å¹¶ä¸ç¸½æ˜¯é †åˆ©ã€‚å¤§å¤šæ•¸(shÃ¹)æ™‚å€™ï¼ŒèŠå¤©æ©Ÿå™¨äººçµ¦å‡ºçš„ä½œè€…å¹¶éžçœŸæ£çš„ä½œè€…ï¼Œæˆ–è€…æœ‰æ™‚å€™æŽ¨è–¦çš„è«–æ–‡æ ¹æœ¬å°±ä¸å˜åœ¨ã€‚

çœ¾æ‰€å‘¨çŸ¥ï¼ŒåŒ…æ‹¬AIèŠå¤©æ©Ÿå™¨äººç‰å¤§åž‹èªžè¨€æ¨¡åž‹ï¼ˆLLMï¼‰æœƒç·¨é€ å…§(nÃ¨i)å®¹ï¼Œé€™æ—¢æ˜¯å„ª(yÅu)é»žä¹Ÿæ˜¯ç¼ºé»žã€‚æ£æ˜¯é€™ç¨®èƒ½åŠ›è®“å®ƒå€‘å…·æœ‰å‚™å—è´Šè½çš„å‰µ(chuÃ ng)é€ åŠ›ï¼Œä½†é€™ä¹Ÿæ„å‘³è‘—å®ƒå€‘æœ‰æ™‚æœƒæ··æ·†äº‹å¯¦å’Œè™›æ§‹(gÃ²u)ï¼Œåœ¨çœ‹ä¼¼æ˜¯äº‹å¯¦çš„å¥åä¸æ’å…¥éŒ¯èª¤çš„ç´°ç¯€(jiÃ©)ã€‚äºžç‰¹è˜å¤§ä½æ²»äºžç†å·¥å¸(xuÃ©)é™¢çš„ç†è«–è¨ˆç®—æ©Ÿç ”ç©¶è€…Santosh Vempala èªªï¼šâ€œ å®ƒå€‘å‚¾å‘äºŽç·¨é€ ä¸€äº›æ±è¥¿ï¼Œè€Œä¸”å……æ»¿ä¿¡å¿ƒâ€ã€‚

è™›å‡åƒè€ƒæ–‡ç»çš„å•é¡Œå°¤å…¶æ™®éã€‚åœ¨2024å¹´çš„ä¸€é …ç ”ç©¶ä¸ï¼Œå„ç¨®èŠå¤©æ©Ÿå™¨äººåœ¨å¼•ç”¨åƒè€ƒæ–‡ç»æ–¹é¢çš„éŒ¯èª¤çŽ‡ç‚º30%-90%ï¼Œè‡³å°‘æœƒæŠŠè«–æ–‡æ¨™(biÄo)é¡Œã€ç¬¬ä¸€ä½œè€…æˆ–å‡ºç‰ˆå¹´ä»½ä¸çš„å…©é …å¯«éŒ¯[1]ã€‚èŠå¤©æ©Ÿå™¨äººé€šå¸¸çµ¦å‡ºè¦å‘Šï¼Œæé†’ç”¨æˆ¶å°é‡è¦å…§(nÃ¨i)å®¹é€²è¡Œä»”ç´°æª¢æŸ¥ã€‚ä½†å¦‚æžœç”¨æˆ¶ç›´æŽ¥å¼•ç”¨èŠå¤©æ©Ÿå™¨äººçš„å›žç”ï¼Œå¯èƒ½æœƒå°Ž(dÇŽo)è‡´åš´(yÃ¡n)é‡å•é¡Œã€‚ä¾‹å¦‚ï¼Œ2023å¹´ç¾Žåœ‹å¾‹å¸«Steven Schwartzåœ¨æ³•åºæ–‡ä»¶ä¸å¼•ç”¨äº†ChatGPTç·¨é€ çš„ä¸å˜åœ¨çš„æ³•å¾‹ã€‚

èŠå¤©æ©Ÿå™¨äººå‡ºéŒ¯çš„åŽŸå› æœ‰å¾ˆå¤šï¼Œè¨ˆç®—æ©Ÿç§‘å¸(xuÃ©)å®¶å‚¾å‘äºŽå°‡æ‰€æœ‰æ¤é¡žéŒ¯èª¤ç¨±ç‚ºå¹»è¦ºï¼ˆhallucinationsï¼‰ã€‚é€™ä¸€è¡“(shÃ¹)èªžå¹¶æœªè¢«æ™®éæŽ¥å—ï¼Œæœ‰äº›äººå»ºè°ç”¨â€œèƒ¡è¨€äº‚èªžï¼ˆconfabulationsï¼‰â€æˆ–æ›´ç°¡å–®çš„â€œèƒ¡èªªå…«é“ï¼ˆbullshitï¼‰â€ä¾†ä»£æ›¿[2]ã€‚

AIå¹»è¦ºæ˜¯LLMçš„åŸºæœ¬ç‰¹å¾ï¼Œæœ‰ç ”ç©¶è€…è¡¨ç¤ºï¼Œå®Œå…¨æ¶ˆé™¤æ˜¯ä¸å¯èƒ½çš„[3]ã€‚åƒZoué€™æ¨£çš„ç ”ç©¶è€…æ£åœ¨ç ”ç©¶å¦‚ä½•æ¸›å°‘å¹»è¦ºçš„ç™¼(fÄ)ç”ŸçŽ‡ï¼Œä»–å€‘ç ”ç©¶äº†ä¸€ç³»åˆ—æŠ€å·§ï¼Œ åŒ…æ‹¬å¤–éƒ¨äº‹å¯¦æ ¸æŸ¥ã€å…§(nÃ¨i)éƒ¨è‡ªæˆ‘åçœï¼Œç”šè‡³åƒZouä¸€æ¨£ï¼Œå°LLMçš„äººå·¥ç¥žç¶“(jÄ«ng)å…ƒé€²è¡Œâ€œè…¦éƒ¨æŽƒæâ€ï¼Œä»¥æç¤ºæ¬ºé¨™æ¨¡å¼ã€‚Zouç‰äººè¡¨ç¤ºï¼Œå„ç¨®æ–°èˆˆæŠ€è¡“(shÃ¹)æ‡‰(yÄ«ng)è©²æœ‰ åŠ©äºŽå‰µ(chuÃ ng)é€ æ›´å°‘â€œèƒ¡èªªå…«é“â€çš„èŠå¤©æ©Ÿå™¨äººï¼Œæˆ–è€…è‡³å°‘å¯ä»¥ä¿ƒä½¿å®ƒå€‘åœ¨å°ç”æ¡ˆæ²’æœ‰ä¿¡å¿ƒæ™‚å¦ç™½æ‰¿èª(rÃ¨n)ã€‚

å¹»è¦ºæ˜¯å¦‚ä½•ç”¢(chÇŽn)ç”Ÿçš„ï¼Ÿ

å¾žæ ¹æœ¬ä¸Šè¬›ï¼ŒLLMå¹¶ä¸æ˜¯ç‚ºäº†æéœ²äº‹å¯¦è€Œè¨(shÃ¨)è¨ˆçš„ã€‚ç›¸åï¼Œå®ƒå€‘æœƒæ ¹æ“š(jÃ¹)è¨“(xÃ¹n)ç·´æ•¸(shÃ¹)æ“š(jÃ¹)ä¸çš„æ¨¡å¼ä»¥åŠéš¨åŽé€šéŽäººé¡žæ¸¬è©¦è€…åé¥‹ç‰æŠ€è¡“(shÃ¹)é€²è¡Œå¾®èª¿(diÃ o)ï¼Œç”Ÿæˆçµ±(tÇ’ng)è¨ˆä¸Šå¯è¡Œçš„å›žå¾©(fÃ¹)ã€‚å°ˆå®¶å€‘æ‰¿èª(rÃ¨n)ï¼Œç›¡ç®¡è¨“(xÃ¹n)ç·´LLMé (yÃ¹)æ¸¬çŸèªžä¸å¯èƒ½å‡ºç¾(xiÃ n)çš„ä¸‹ä¸€å€‹è©žçš„éŽç¨‹å·²å»£ç‚ºäººçŸ¥ï¼Œä½†å…¶ç²¾ç¢ºçš„å…§(nÃ¨i)éƒ¨å·¥ä½œåŽŸç†ä»ç„¶æ˜¯å€‹è¬Žã€‚åŒæ¨£ï¼Œäººå€‘ä¹Ÿä¸æ¸…æ¥šå¹»è¦ºæ˜¯å¦‚ä½•ç”¢(chÇŽn)ç”Ÿçš„ã€‚

ä¸€å€‹æ ¹æœ¬åŽŸå› æ˜¯LLMé€šéŽå£“ç¸®æ•¸(shÃ¹)æ“š(jÃ¹)ä¾†å·¥ä½œã€‚åœ¨è¨“(xÃ¹n)ç·´éŽç¨‹ä¸ï¼Œé€™äº›æ¨¡åž‹å°‡æ•¸(shÃ¹)åè¬å„„è©žä¹‹é–“çš„é—œ(guÄn)ç³»å£“ç¸®ç‚ºæ•¸(shÃ¹)åå„„å€‹åƒæ•¸(shÃ¹)ï¼Œä¹Ÿå°±æ˜¯æ±ºå®šäººå·¥ç¥žç¶“(jÄ«ng)å…ƒä¹‹é–“é€£æŽ¥å¼·åº¦çš„è®Šé‡ã€‚å› æ¤ï¼Œå®ƒå€‘åœ¨æ§‹(gÃ²u)å»ºå›žå¾©(fÃ¹)æ™‚ï¼Œå¿…ç„¶æœƒä¸Ÿå¤±ä¸€äº›ä¿¡æ¯â€”â€”å¯¦éš›ä¸Šæ˜¯å°‡é€™äº›å£“ç¸®çš„çµ±(tÇ’ng)è¨ˆæ¨¡å¼å†æ¬¡æ“´å±•é–‹ä¾†ã€‚Vectaraï¼ˆç¾Žåœ‹çš„ä¸€å®¶ç§‘æŠ€å…¬å¸ï¼Œæ—¨åœ¨æœ€å¤§é™åº¦æ¸›å°‘AIå¹»è¦ºï¼‰è¯(liÃ¡n)åˆå‰µ(chuÃ ng)å§‹äººAmr Awadallahèªªé“ï¼šâ€œé€™äº›å·¥å…·èƒ½å¤ é‡å»ºè¿‘98%çš„è¨“(xÃ¹n)ç·´å…§(nÃ¨i)å®¹ï¼Œä½†åœ¨å‰©ä¸‹çš„2%ä¸ï¼Œå¯èƒ½æœƒå®Œå…¨åé›¢è»Œé“ï¼Œçµ¦ä½ ä¸€å€‹å®Œå…¨éŒ¯èª¤çš„ç”æ¡ˆâ€ã€‚

ä¸€äº›éŒ¯èª¤åƒ…åƒ…ä¾†è‡ªAIè¨“(xÃ¹n)ç·´æ•¸(shÃ¹)æ“š(jÃ¹)ä¸å˜åœ¨æ§ç¾©æˆ–éŒ¯èª¤ã€‚ä¾‹å¦‚ï¼Œä¸€å€‹è‡åæ˜è‘—çš„å›žç”æ˜¯ï¼ŒèŠå¤©æ©Ÿå™¨äººå»ºè°åœ¨æŠ«è–©é†¬ä¸åŠ å…¥è† æ°´ä»¥é˜²æ¢å¥¶é…ªæ»‘è½ï¼Œé€™å¯ä»¥è¿½æº¯åˆ°ç¤¾äº¤ç¶²(wÇŽng)çµ¡(luÃ²) Reddit ä¸Šçš„ä¸€ç¯‡å…·æœ‰è«·åˆºæ„å‘³çš„å¸–åã€‚

ç„¶è€Œï¼Œå³ä½¿æ“æœ‰å®Œå…¨æº–(zhÇ”n)ç¢ºå’Œæ¸…æ™°çš„è¨“(xÃ¹n)ç·´æ•¸(shÃ¹)æ“š(jÃ¹)é›†ï¼Œæ¨¡åž‹ä»æœƒæœ‰å°æ¦‚çŽ‡å‡ºç¾(xiÃ n)å¹»è¦ºã€‚VempalaæŽ¨æ¸¬é€™ä¸€æ¯”ä¾‹æ‡‰(yÄ«ng)è©²èˆ‡æ•¸(shÃ¹)æ“š(jÃ¹)é›†ä¸åƒ…å‡ºç¾(xiÃ n)ä¸€æ¬¡çš„äº‹å¯¦çš„æ¯”ä¾‹ç›¸åŒ[4]ã€‚è‡³å°‘å°â€œç¶“(jÄ«ng)æ ¡æº–(zhÇ”n)çš„â€LLMä¾†èªªæ˜¯é€™æ¨£ã€‚

å¯¦ç¾(xiÃ n)æ ¡æº–(zhÇ”n)çš„ä¸€å€‹æ–¹æ³•æ˜¯ï¼Œåˆ©ç”¨äººé¡žè©•å§”å¼•å°Ž(dÇŽo)è¨“(xÃ¹n)ç·´æœ‰ç´ çš„LLMåšå‡ºäººé¡žæ»¿æ„çš„å›žå¾©(fÃ¹)ï¼Œé€™æ˜¯ä¸€ç¨®å¸¸è¦‹çš„æŠ€è¡“(shÃ¹)ï¼Œè¢«ç¨±ç‚ºå¾žäººé¡žåé¥‹ä¸é€²è¡Œå¼·åŒ–å¸(xuÃ©)ç¿’(xÃ)ã€‚é€™å€‹éŽç¨‹å¯ä»¥æ¶ˆé™¤ä¸€äº›å¹»è¦ºï¼Œä½†å¾€å¾€åˆæœƒç”¢(chÇŽn)ç”Ÿå…¶ä»–å¹»è¦ºï¼Œå› ç‚ºå®ƒæœƒä¿ƒä½¿èŠå¤©æ©Ÿå™¨äººè¿½æ±‚å®Œæ•´æ€§è€Œéžæº–(zhÇ”n)ç¢ºæ€§ã€‚

ç ”ç©¶è¡¨æ˜Žï¼Œè¼ƒæ–°çš„æ¨¡åž‹æ›´æœ‰å¯èƒ½å›žç”å•é¡Œè€Œä¸æ˜¯é¿å…å›žç”ï¼Œå› æ¤æ›´åŠ â€œæ¥µç«¯â€ï¼Œæˆ–è€…æ›´å‚¾å‘äºŽèªªå‡ºè¶…å‡ºå…¶çŸ¥è˜èŒƒåœçš„è©±ï¼Œå¾žè€Œå°Ž(dÇŽo)è‡´éŒ¯èª¤[5]ã€‚

å¦ä¸€é¡žéŒ¯èª¤ç™¼(fÄ)ç”Ÿåœ¨ç•¶(dÄng)ç”¨æˆ¶åœ¨æç¤ºè©žä¸å¯«ä¸‹éŒ¯èª¤çš„çš„äº‹å¯¦æˆ–å‡è¨(shÃ¨)æ™‚ã€‚ç”±äºŽèŠå¤©æ©Ÿå™¨äººè¢«è¨(shÃ¨)è¨ˆç”Ÿæˆç¬¦åˆæƒ…å¢ƒçš„å›žå¾©(fÃ¹)ï¼Œå› æ¤å®ƒå€‘å¯èƒ½æœƒâ€œé…åˆâ€å°è©±ã€‚ä¾‹å¦‚ï¼Œåœ¨ä¸€é …ç ”ç©¶ä¸ï¼Œè¼¸å…¥â€œæˆ‘çŸ¥é“æ°¦æ˜¯å¯è§€æ¸¬å®‡å®™ä¸æœ€è¼•ã€æœ€è±å¯Œçš„å…ƒç´ ã€‚é€™æ˜¯çœŸçš„å—Žâ€¦â€¦ï¼Ÿâ€å°Ž(dÇŽo)è‡´èŠå¤©æ©Ÿå™¨äººéŒ¯èª¤åœ°èªªâ€œæˆ‘å¯ä»¥ç¢ºèª(rÃ¨n)é€™å€‹èªªæ³•æ˜¯æ£ç¢ºçš„â€[6]ã€‚ç¾Žåœ‹æ–¯å¦ç¦å¤§å¸(xuÃ©)çš„è¨ˆç®—æ©Ÿç§‘å¸(xuÃ©)å®¶ã€è©²ç ”ç©¶çš„ç¬¬ä¸€ä½œè€…Mirac Suzgunèªªï¼šâ€œæ¨¡åž‹å‚¾å‘äºŽåŒæ„ç”¨æˆ¶çš„è§€é»žï¼Œé€™ä»¤äººæ“”(dÄn)æ†‚ã€‚â€

å¹»è¦ºå•é¡Œåˆ°åº•æœ‰å¤šåš´(yÃ¡n)é‡ï¼Ÿ

å¹»è¦ºå•é¡Œåˆ°åº•æœ‰å¤šåš´(yÃ¡n)é‡ï¼Ÿç ”ç©¶è€…å·²ç¶“(jÄ«ng)é–‹ç™¼(fÄ)å‡ºå„ç¨®æŒ‡æ¨™(biÄo)ä¾†è¿½è¹¤é€™å€‹å•é¡Œã€‚ä¾‹å¦‚ï¼Œç ”ç©¶è€… Vipula Rawteå‰µ(chuÃ ng)å»ºäº†å¹»è¦ºæ˜“æ„Ÿæ€§æŒ‡æ•¸(shÃ¹)ï¼ˆHallucination Vulnerability Indexï¼‰ï¼Œè©²æŒ‡æ•¸(shÃ¹)å°‡å¹»è¦ºåˆ†ç‚º6å€‹é¡žåˆ¥å’Œ3å€‹åš´(yÃ¡n)é‡ç¨‹åº¦[7]ã€‚é‚„æœ‰äººåœ¨HuggingFaceå¹³è‡ºä¸Šç·¨åˆ¶äº†ä¸€å€‹å¹»è¦ºæŽ’è¡Œæ¦œï¼Œä»¥è·Ÿè¹¤æ©Ÿå™¨äººåœ¨å„ç¨®å¸¸è¦‹åŸºæº–(zhÇ”n)æ¸¬è©¦ä¸çš„æ¼”è®Šåˆ†?jÇn)?shÃ¹)ã€‚

Vectaraå…¬å¸æœ‰è‡ªå·±çš„æŽ’è¡Œæ¦œï¼Œå®ƒé—œ(guÄn)æ³¨çš„æ˜¯ä¸€å€‹ç°¡å–®çš„æ¸¬è©¦æ¡ˆä¾‹ï¼Œå³èŠå¤©æ©Ÿå™¨äººè¢«è¦æ±‚ç¸½çµ(jiÃ©)çµ¦å®šæ–‡æª”æ™‚çš„æƒ…æ³ï¼Œé€™æ˜¯ä¸€å€‹ç›¸å°å®¹æ˜“è¨ˆç®—å¹»è¦ºçš„å°é–‰æƒ…æ™¯ã€‚ç ”ç©¶è¡¨æ˜Žï¼Œä¸€äº›èŠå¤©æ©Ÿå™¨äººæé€ äº‹å¯¦ã€ç·¨é€ çµ¦å®šæ–‡æª”ä¸ä¸å˜åœ¨ä¿¡æ¯çš„æƒ…æ³é«˜é”30%ã€‚ä½†ç¸½é«”è€Œè¨€ï¼Œæƒ…æ³ä¼¼ä¹Žæ£åœ¨æ”¹å–„ã€‚æˆªè‡³2025å¹´1æœˆï¼ŒOpenAIçš„GPT-3.5çš„å¹»è¦ºçŽ‡ç‚º3.5%ï¼ŒGPT-4ç‚º1.8%ï¼Œo1-mini LLMåƒ…ç‚º1.4%ï¼ˆæˆªè‡³èª¿(diÃ o)æŸ¥æ™‚ï¼ŒOpenAIçš„æœ€æ–°å¯¦é©—?zÄi)ï¼°èš¾3é‚„æœªç™»ä¸ŠæŽ’è¡Œæ¦œï¼‰ã€‚

åœ–. Vectaraçµ±(tÇ’ng)è¨ˆçµ(jiÃ©)æžœï¼ˆhttps://go.nature.com/4GPQRTTï¼›2025å¹´1æœˆ11æ—¥è¨ªå•ï¼‰

æ›´å»£æ³›çš„æ¸¬è©¦å¹¶ä¸ç¸½æ˜¯èƒ½æç¤ºå‡ºå¦‚æ¤ç°¡å–®çš„è¶¨å‹¢ã€‚OpenAI è¡¨ç¤ºï¼Œç›¡ç®¡o1åœ¨å…¶å…§(nÃ¨i)éƒ¨çš„å¹»è¦ºæ¸¬è©¦ä¸è¡¨ç¾(xiÃ n)å„ª(yÅu)äºŽGPT-4ï¼Œä½†æ“š(jÃ¹)å…¶æ¸¬è©¦äººå“¡ç¨±ï¼Œo1çš„å¹»è¦ºå…¶å¯¦æ›´å¤šï¼Œç‰¹åˆ¥æ˜¯æœƒç·¨é€ è©³ç´°ä¸”çœ‹èµ·ä¾†æ›´å…·èªªæœåŠ›çš„éŒ¯èª¤ç”æ¡ˆã€‚é€™äº›éŒ¯èª¤æ£è®Šå¾—è¶Šä¾†è¶Šé›£ä»¥è¢«è¨“(xÃ¹n)ç·´å¸«ã€æ¸¬è©¦äººå“¡å’Œç”¨æˆ¶ç™¼(fÄ)ç¾(xiÃ n)ã€‚

å¤–éƒ¨é©—è‰

æœ‰è¨±å¤šæ–¹æ³•å¯ä»¥æ¸›å°‘å¹»è¦ºã€‚è¨“(xÃ¹n)ç·´æ™‚é–“è¶Šé•·ã€åƒæ•¸(shÃ¹)è¶Šå¤šçš„æ¨¡åž‹å¾€å¾€ç”¢(chÇŽn)ç”Ÿçš„å¹»è¦ºå°±è¶Šå°‘ï¼Œä½†é€™éœ€è¦è€—è²»å¤§é‡è¨ˆç®—è³‡æºï¼Œå¹¶æ¶‰åŠèˆ‡å…¶ä»–èŠå¤©æ©Ÿå™¨äººæŠ€èƒ½çš„æ¬Š(quÃ¡n)è¡¡ï¼Œä¾‹å¦‚æ³›åŒ–èƒ½åŠ›[8]ã€‚åœ¨æ›´å¤§ã€æ›´å¹²å‡ˆçš„æ•¸(shÃ¹)æ“š(jÃ¹)é›†ä¸Šé€²è¡Œè¨“(xÃ¹n)ç·´ä¹Ÿæœƒæœ‰æ‰€å¹«åŠ©ï¼Œä½†å¯ç”¨çš„æ•¸(shÃ¹)æ“š(jÃ¹)æœ‰é™ã€‚

é™åˆ¶å¹»è¦ºçš„ä¸€ç¨®æ–¹æ³•æ˜¯æª¢ç´¢å¢žå¼·ç”Ÿæˆï¼ˆRAGï¼‰ï¼Œå³èŠå¤©æ©Ÿå™¨äººæœƒåœ¨å›žå¾©(fÃ¹)å‰åƒè€ƒçµ¦å®šçš„ã€å¯ä¿¡çš„æ–‡æœ¬ã€‚é€™åœ¨éœ€åš´(yÃ¡n)æ ¼éµå®ˆé©—è‰çš„é ˜(lÇng)åŸŸéžå¸¸å—æ¡è¿Žï¼Œä¾‹å¦‚é†«(yÄ«)ç™‚è¨ºæ–·æˆ–æ³•å¾‹å·¥ä½œã€‚

é–‹ç™¼(fÄ)äººå“¡é‚„å¯ä»¥ä½¿ç”¨ä¸€å€‹ç¨ç«‹çš„ç³»çµ±(tÇ’ng)ä¾†å°èŠå¤©æ©Ÿå™¨äººçš„å›žå¾©(fÃ¹)é€²è¡Œäº‹å¯¦æ ¸æŸ¥ã€‚ä¾‹å¦‚ï¼Œè°·æŒçš„ Gemini ç³»çµ±(tÇ’ng)æœ‰ä¸€å€‹åç‚ºâ€œä»”ç´°æª¢æŸ¥å›žå¾©(fÃ¹)[double-check response]â€çš„ç”¨æˆ¶é¸é …ï¼Œå®ƒæœƒå°‡éƒ¨åˆ†ç”æ¡ˆçªå‡ºé¡¯ç¤ºç‚ºç¶ è‰²ï¼ˆè¡¨ç¤ºå·²é€šéŽäº’è¯(liÃ¡n)ç¶²(wÇŽng)é©—è‰ï¼‰æˆ–æ£•è‰²ï¼ˆè¡¨ç¤ºæœ‰çˆè°æˆ–ä¸ç¢ºå®šçš„å…§(nÃ¨i)å®¹ï¼‰ã€‚ç„¶è€Œï¼Œé€™éœ€è¦å¤§é‡è¨ˆç®—å¹¶ä¸”éœ€è¦æ™‚é–“ã€‚é€™æ¨£çš„ç³»çµ±(tÇ’ng)ä»ç„¶æœƒç”¢(chÇŽn)ç”Ÿå¹»è¦ºï¼Œå› ç‚ºäº’è¯(liÃ¡n)ç¶²(wÇŽng)ä¸Šå……æ–¥è‘—éŒ¯èª¤çš„äº‹å¯¦ã€‚

å…§(nÃ¨i)éƒ¨åæ€

ä¸€ç¨®å¹¶è¡Œæ–¹æ³•æ˜¯è®“èŠå¤©æ©Ÿå™¨äººèˆ‡è‡ªå·±ã€å…¶ä»–èŠå¤©æ©Ÿå™¨äººæˆ–äººé¡žäº¤è«‡ï¼Œä»¥æ‰¾å‡ºå…¶å›žå¾©(fÃ¹)ä¸çš„ä¸ä¸€è‡´ä¹‹è™•ã€‚é€™ç¨®è‡ªæˆ‘åæ€å¯ä»¥æ¸›å°‘å¹»è¦ºã€‚ä¾‹å¦‚ï¼Œå¦‚æžœèŠå¤©æ©Ÿå™¨äººè¢«è¿«åŸ·(zhÃ)è¡Œâ€œæ€ç¶éˆâ€ä¸çš„ä¸€ç³»åˆ—æ¥é©Ÿï¼Œé€™å°‡æé«˜å¯é æ€§ï¼Œå°¤å…¶æ˜¯åœ¨æ¶‰åŠå¾©(fÃ¹)é›œæŽ¨ç†çš„ä»»å‹™(wÃ¹)ä¸ã€‚

åœ¨èª¿(diÃ o)æŸ¥å¹»è¦ºå¼•ç”¨æ™‚ï¼ŒSuzgunåŠå…¶åŒäº‹ç™¼(fÄ)ç¾(xiÃ n)ï¼Œå¦‚æžœä»–å€‘ç”¨å¤šå€‹å•é¡Œå°èŠå¤©æ©Ÿå™¨äººé€²è¡Œâ€œç›¤å•â€ï¼Œé‚£ä¹ˆç•¶(dÄng)é€™äº›æ©Ÿå™¨äººåœ¨ç·¨é€ å…§(nÃ¨i)å®¹æ™‚ï¼Œå®ƒå€‘çš„å›žç”å°±æœƒä¸é‚£ä¹ˆä¸€è‡´[9]ã€‚

åœ–. äººé¡žç”¨æˆ¶è³ª(zhÃ¬)å•èŠå¤©æ©Ÿå™¨äººæ˜¯å¦å˜åœ¨å¹»è¦ºåƒè€ƒæ–‡ç»ï¼ˆåœ¨è°·æŒå¸(xuÃ©)è¡“(shÃ¹)ä¸Šæ‰¾ä¸åˆ°çš„è«–æ–‡ï¼‰çš„ç¤ºä¾‹[9]ã€‚åŒä¸€æ˜¯/å¦ç”æ¡ˆçš„å•é¡Œé‡å¾©(fÃ¹)10æ¬¡ï¼Œ2æ¬¡å›žç”ç‚ºâ€œå¦â€ï¼Œè¡¨ç¤ºå°ç”æ¡ˆä¿¡å¿ƒä¸è¶³ï¼›åŒä¸€æ²’æœ‰æ˜¯/å¦ç”æ¡ˆçš„å•é¡Œé‡å¾©(fÃ¹)3æ¬¡ï¼Œæœƒå‡ºç¾(xiÃ n)3å€‹ä¸ä¸€è‡´çš„ç”æ¡ˆï¼Œè¡¨ç¤ºå°çµ¦å®šç”æ¡ˆæ£ç¢ºæ€§çš„ä¿¡å¿ƒå¾ˆä½Žã€‚

ç ”ç©¶äººå“¡å·²ç¶“(jÄ«ng)é–‹ç™¼(fÄ)å‡ºæ–¹æ³•ä¾†è©•ä¼°ä¸€ç³»åˆ—èŠå¤©æ©Ÿå™¨äººå°åŒä¸€æŸ¥è©¢å›žç”çš„â€œèªžç¾©ç›¸ä¼¼æ€§â€ã€‚ç„¶åŽï¼Œä»–å€‘å¯ä»¥ç¹ªåˆ¶å‡ºç”æ¡ˆçš„å¤šæ¨£æ€§ç¨‹åº¦ï¼›é«˜å¤šæ¨£æ€§æˆ–é«˜â€œèªžç¾©ç†µâ€æ˜¯ä¿¡å¿ƒä¸è¶³çš„æŒ‡æ¨™(biÄo)[10]ã€‚æ¤é¡žæ–¹æ¡ˆä¸éœ€è¦å°èŠå¤©æ©Ÿå™¨äººé€²è¡Œä»»ä½•é¡å¤–çš„è¨“(xÃ¹n)ç·´ã€‚

Zouçš„æ–¹æ³•æ¶‰åŠ ç¹ªåˆ¶LLMå…§(nÃ¨i)éƒ¨è¨ˆç®—ç¯€(jiÃ©)é»žï¼ˆå³â€œç¥žç¶“(jÄ«ng)å…ƒâ€ï¼‰åœ¨å›žç”æŸ¥è©¢æ™‚çš„æ¿€æ´»æ¨¡å¼åœ–ï¼Œ å°±åƒåšè…¦éƒ¨æŽƒæä¸€æ¨£ã€‚ä¸åŒçš„æ´»å‹•æ¨¡å¼å¯èƒ½èˆ‡LLMèªªçœŸè©±å’Œæ’’è¬Šç‰æƒ…æ³ç›¸é—œ(guÄn)è¯(liÃ¡n)[11]ã€‚

èˆ‡æ¤ç›¸é—œ(guÄn)çš„ä¸€é …ç ”ç©¶æ—¨åœ¨è¨“(xÃ¹n)ç·´LLMç¹ªåˆ¶å…¶è‡ªå·±çš„å…§(nÃ¨i)éƒ¨ç‹€æ…‹(tÃ i)åœ–ï¼Œä»¥å¹«åŠ©å…¶ç™¼(fÄ)å±•â€œè‡ªæˆ‘æ„è˜â€[12]ã€‚é¦™æ¸¯ç§‘æŠ€å¤§å¸(xuÃ©)è¨ˆç®—æ©Ÿç§‘å¸(xuÃ©)å®¶Pascale Fungçš„åœ˜éšŠå‘èŠå¤©æ©Ÿå™¨äººæå‡ºäº†æ•¸(shÃ¹)è¬å€‹å•é¡Œï¼Œå¹¶åœ¨å›žç”éŽç¨‹ä¸ç¹ªåˆ¶äº†å…§(nÃ¨i)éƒ¨æ¨¡å¼åœ–ï¼Œæ˜Žç¢ºäº†å›žç”ä½•æ™‚æ˜¯æº–(zhÇ”n)ç¢ºçš„ï¼Œä»¥åŠä½•æ™‚åŒ…å«å¹»è¦ºå…§(nÃ¨i)å®¹ã€‚éš¨åŽï¼Œç ”ç©¶è€…å¯ä»¥æ ¹æ“š(jÃ¹)é€™äº›åœ–èœå°èŠå¤©æ©Ÿå™¨äººé€²è¡Œè¨“(xÃ¹n)ç·´ï¼Œä½¿å…¶èƒ½å¤ é (yÃ¹)æ¸¬åœ¨å›žç”å¦ä¸€å€‹å•é¡Œæ™‚æ˜¯å¦å¯èƒ½æœƒç”¢(chÇŽn)ç”Ÿå¹»è¦ºã€‚ä»–å€‘æ¸¬è©¦çš„èŠå¤©æ©Ÿå™¨äººèƒ½å¤ ä»¥å¹³å‡84%çš„æº–(zhÇ”n)ç¢ºçŽ‡é (yÃ¹)æ¸¬é€™ä¸€é»žã€‚

èˆ‡èªžç¾©ç†µæŠ€è¡“(shÃ¹)ç›¸æ¯”ï¼Œè…¦éƒ¨æŽƒæéœ€è¦å¤§é‡çš„åˆ¶åœ–å’Œè¨“(xÃ¹n)ç·´ã€‚é€™ä½¿å¾—å®ƒå¾ˆé›£æ‡‰(yÄ«ng)ç”¨äºŽç¾(xiÃ n)å¯¦ä¸–ç•Œä¸ã€‚ä½†é€™é …æŠ€è¡“(shÃ¹)åœ¨å›žç”æŸ¥è©¢æ™‚ä¸éœ€è¦ä»»ä½•é¡å¤–çš„è¨ˆç®—ã€‚

èŠå¤©æ©Ÿå™¨äººç¸½æ˜¯å°è‡ªå·±å……æ»¿ä¿¡å¿ƒ

èŠå¤©æ©Ÿå™¨äººæœ€è®“äººä¸å®‰çš„åœ°æ–¹åœ¨äºŽï¼Œå®ƒå€‘åœ¨å‡ºéŒ¯æ™‚ä¹Ÿååˆ†è‡ªä¿¡ã€‚ç•¶(dÄng)èŠå¤©æ©Ÿå™¨äººåœ¨è¨“(xÃ¹n)ç·´æ•¸(shÃ¹)æ“š(jÃ¹)ä¹‹å¤–ç˜‹ç‹‚æŽ¨æ¸¬æ™‚ï¼Œé€šå¸¸æ²’æœ‰æ˜Žé¡¯çš„ç·šç´¢ã€‚

Awadallahè¡¨ç¤ºï¼Œå¤§å¤šæ•¸(shÃ¹)èŠå¤©æ©Ÿå™¨äººéƒ½æœ‰æŸç¨®å…§(nÃ¨i)éƒ¨ç½®ä¿¡åº¦æ¸¬é‡æ–¹æ³•ï¼Œæœ€ç°¡å–®çš„å°±æ˜¯ç”¨æ•¸(shÃ¹)å—è¡¨é”å¥åä¸ä¸‹ä¸€å€‹å–®è©žå‡ºç¾(xiÃ n)çš„å¯èƒ½æ€§ï¼Œé€™èˆ‡ç›¸é—œ(guÄn)æ¦‚å¿µåœ¨è¨“(xÃ¹n)ç·´æ•¸(shÃ¹)æ“š(jÃ¹)ä¸å‡ºç¾(xiÃ n)çš„æ¬¡æ•¸(shÃ¹)æœ‰é—œ(guÄn)ã€‚åŽŸå‰‡ä¸Šï¼Œå¯ä»¥ä½¿ç”¨RAGã€äº‹å¯¦æ ¸æŸ¥ã€è‡ªæˆ‘åçœã€ä¸€è‡´æ€§æª¢æŸ¥ç‰æ–¹æ³•ä¾†å®Œå–„é€™ç¨®ç½®ä¿¡åº¦åˆ†?jÇn)?shÃ¹)ã€‚

Awadallah ç‰äººèª(rÃ¨n)ç‚ºï¼ŒèŠå¤©æ©Ÿå™¨äººå…¬å¸æ‡‰(yÄ«ng)è©²åœ¨æ¯æ¬¡å›žç”æ—é¡¯ç¤ºç½®ä¿¡åº¦åˆ†?jÇn)?shÃ¹)ã€‚å°äºŽä¿¡å¿ƒä½Žçš„æƒ…æ³ï¼Œæ‡‰(yÄ«ng)é¼“å‹µèŠå¤©æ©Ÿå™¨äººæ‹’çµ•å›žç”ã€‚ä½† Suzgun è¡¨ç¤ºï¼Œå°äºŽè¨±å¤šå…¬å¸ä¾†èªªï¼Œå¾—å‡ºä¸€å€‹ç°¡å–®çš„æ•¸(shÃ¹)å—æœƒå¾ˆæœ‰æŒ‘æˆ°(zhÃ n)æ€§ï¼Œå¦‚æžœè®“å…¬å¸è‡ªå·±åšï¼Œå¯èƒ½æœƒå°Ž(dÇŽo)è‡´äº¤å‰æ¯”è¼ƒçš„å•é¡Œã€‚æ¤å¤–ï¼Œä¸€å€‹éŒ¯èª¤çš„æ•¸(shÃ¹)å—å¯èƒ½æ¯”æ²’æœ‰æ•¸(shÃ¹)å—æ›´ç³Ÿç³•ã€‚é€™å¯èƒ½æœƒç”¢(chÇŽn)ç”Ÿå¾ˆå¤§çš„èª¤å°Ž(dÇŽo)ã€‚

ä¾‹å¦‚ï¼Œåœ¨OpenAIæœ€è¿‘ç™¼(fÄ)è¡¨çš„ä¸€ç¯‡é—œ(guÄn)äºŽSimpleQAæº–(zhÇ”n)ç¢ºæ€§æ¸¬è©¦çš„è«–æ–‡ä¸ï¼Œç ”ç©¶è€…è¦æ±‚èŠå¤©æ©Ÿå™¨äººå‘Šè¨´ä»–å€‘å°ç”æ¡ˆçš„ä¿¡å¿ƒç¨‹åº¦ï¼Œå¹¶é€šéŽå¤šå€‹æŸ¥è©¢é€²è¡Œæ¸¬è©¦ï¼Œä»¥æŸ¥çœ‹é€™ç¨®è‡ªä¿¡æ˜¯å¦åˆç†ã€‚ä»–å€‘ç™¼(fÄ)ç¾(xiÃ n)ï¼ŒåŒ…æ‹¬Claudeã€GPTå’Œo1åœ¨å…§(nÃ¨i)çš„æ¨¡åž‹â€œå§‹çµ‚éŽåˆ†è‡ªä¿¡â€[13]ã€‚Suzgunèªªï¼šâ€œæ¨¡åž‹å¤§å¤šçŸ¥é“è‡ªå·±çŸ¥é“ä»€ä¹ˆï¼Œä½†æœ‰æ™‚ä»–å€‘ä¸çŸ¥é“è‡ªå·±ä¸çŸ¥é“ä»€ä¹ˆâ€ã€‚

Zoué (yÃ¹)æ¸¬ï¼Œéš¨è‘—èŠå¤©æ©Ÿå™¨äººç¨®é¡žçš„å¢žå¤šï¼Œå®ƒå€‘å¯èƒ½æœƒè¡¨ç¾(xiÃ n)å‡ºå„ç¨®å„æ¨£çš„è¡Œç‚ºã€‚æœ‰äº›æ©Ÿå™¨äººå¯èƒ½æœƒæ»å®ˆäº‹å¯¦ï¼Œä»¥è‡³äºŽæˆç‚ºç„¡è¶£çš„å°è©±è€…ï¼›è€Œæœ‰äº›æ©Ÿå™¨äººå¯èƒ½æœƒé€²è¡Œèƒ¡äº‚çŒœæ¸¬ï¼Œå› æ¤äººå€‘å¾ˆå¿«å°±æ„è˜åˆ°ï¼Œåœ¨ä»»ä½•é‡è¦çš„äº‹æƒ…ä¸Šç„¡æ³•å®Œå…¨ä¿¡ä»»å®ƒå€‘ã€‚

Zouèªªï¼šâ€œä½ å¯èƒ½æœƒèªªï¼Œ é€™äº›æ¨¡åž‹60%çš„æ™‚é–“éƒ½æ˜¯èƒ¡èªªå…«é“ï¼Œä½†èˆ‡ä¹‹äº¤è«‡å¾ˆæœ‰è¶£ã€‚â€

ç ”ç©¶è€…æé†’èªªï¼Œå¦‚ä»Šçš„èŠå¤©æ©Ÿå™¨äººå¹¶ä¸é©åˆå›žç”ç°¡å–®çš„äº‹å¯¦æ€§å•é¡Œï¼Œé€™æ˜¯éžLLMæœç´¢å¼•æ“Žçš„ä¸»è¦ç”¨é€”ã€‚è‡³å°‘åˆ°ç›®å‰ç‚ºæ¢ï¼Œèªžè¨€æ¨¡åž‹æœƒç”¢(chÇŽn)ç”Ÿè™›å‡çš„ä¿¡æ¯ï¼Œäººå€‘è¦è¬¹(jÇn)æ…Žåœ°ä¾è³´å®ƒå€‘ã€‚â€

æœ¬æ–‡æ•´ç†è‡ªï¼šhttps://www.nature.com/articles/d41586-025-00068-5

åƒè€ƒæ–‡ç»ï¼š

1.J Med Internet Res. 2024:26:e53164.

2.Hicks, M. T., Humphries, J. & Slater, J. Ethics Inf. Technol. 26, 38 (2024).

3.Banerjee, S., Agarwal, A. & Singla, S. Preprint at arXiv https://doi.org/10.48550/arXiv.2409.05746 (2024).

4.Kalai, A. T. & Vempala, S. S. Preprint at arXiv https://doi.org/10.48550/arXiv.2311.14648 (2023).

5.Nature. 2024 Oct;634(8032):61-68.

6.Suzgun, M. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2410.21195 (2024).

7.Rawte, V. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2310.04988 (2023).

8.Hron, J. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2408.07852 (2024).

9.Agrawal, A., Suzgun, M., Mackey, L. & Kalai, A. T. Preprint at arXiv https://doi.org/10.48550/arXiv.2305.18248 (2024).

10.Nature. 2024;630(8017):625-630.

11.Zou, A. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2310.01405 (2023).

12.Ji, Z. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2407.03282 (2024).

13.Wei, J. et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2411.04368 (2024).

é†«(yÄ«)å’–æœƒAPPå·²ä¸Šç·šå•¦ï¼ç¾(xiÃ n)åœ¨ä¸‹è¼‰é†«(yÄ«)å’–æœƒAPPï¼Œé‚„å¯ä»¥ç²å–é©šå–œå¥½ç¦®ï¼

1ã€åœ¨é†«(yÄ«)å’–æœƒAPPå®Œæˆæ³¨å†Šç™»éŒ„ï¼Œå³å¯ç²å¾—2å¼µåŸºç¤Ž(chÇ”)èª²ç¨‹åˆ¸ï¼

2ã€å®Œæˆè·æ¥(yÃ¨)èª(rÃ¨n)è‰çš„ç”¨æˆ¶ï¼Œåœ¨é†«(yÄ«)å’–æœƒAPPç”¨1ç©åˆ†å³å¯å…Œæ›2025å¹´é†«(yÄ«)å’–æœƒç§‘ç ”è‡ºæ·ï¼ˆæ•¸(shÃ¹)é‡æœ‰é™ï¼Œå…ˆåˆ°å…ˆå¾—ï¼ï¼‰

1ã€æŽƒæä¸‹æ–¹äºŒç¶ç¢¼ä¸‹è¼‰APP

2ã€åœ¨æ‡‰(yÄ«ng)ç”¨å•†åº—æœç´¢ã€é†«(yÄ«)å’–æœƒã€‘é€²è¡Œä¸‹è¼‰

ç‰¹åˆ¥è²æ˜Žï¼šä»¥ä¸Šå…§(nÃ¨i)å®¹(å¦‚æœ‰åœ–ç‰‡æˆ–è¦–é »äº¦åŒ…æ‹¬åœ¨å…§(nÃ¨i))ç‚ºè‡ªåª’é«”å¹³è‡ºâ€œç¶²(wÇŽng)æ˜“è™Ÿâ€ç”¨æˆ¶ä¸Šå‚³å¹¶ç™¼(fÄ)å¸ƒï¼Œæœ¬å¹³è‡ºåƒ…æä¾›ä¿¡æ¯å˜å„²æœå‹™(wÃ¹)ã€‚

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.