自從生成式AI崛起以來,經常有人傳播一個觀點:AI大模型的“胡說八道”(學名是“大模型幻覺”)會導致整個互聯網充斥垃圾信息,最終毀掉人類的知識體系。當初ChatGPT爆紅之后,以及最近DeepSeek爆紅之后,都有大量的專業媒體和自媒體,像鸚鵡學舌一樣,不斷重復著上述說法。就在昨天,我的朋友圈里又有好幾個人轉發了類似的文章。鑒于這類文章內容大同小異,看個標題就知道內文在寫什么了,所以我沒有打開閱讀,今后應該也不會閱讀。
作為一個GPT/DeepSeek的雙料重度用戶,我當然知道“大模型幻覺”的威力。我是歷史學愛好者,經常跟AI討論歷史問題,要求AI幫我收集史料。大約半年前,我問了GPT-4o一個問題:“清朝初年的佟佳氏家族,在康熙年間一度有‘佟半朝’之稱,但是自從雍正年間隆科多被查辦、乾隆年間慶復被賜死之后,似乎就遠離歷史舞臺了。這個家族在清朝中后期還出過名人嗎?”
十幾秒后,GPT-4o告訴我:“隆科多、慶復先后獲罪之后,佟佳氏確實大不如前,但是瘦死的駱駝比馬大,還是出了一些中高層官員,例如:乾隆時期的副都統佟世榮、晚清的內務府官員佟永德、晚清的八旗領隊大臣佟志和等。在此附上他們的簡歷(下略)。”
我馬上發覺不對勁:佟佳氏是一個“滿洲化”程度很深的漢軍旗家族,起名習慣也逐漸采納了滿洲的“稱名不舉姓”,像隆科多、慶復都是很典型的滿洲人名,怎么到了晚清反而全是漢化姓名?而且,諸如佟永德、佟志和之流,不但《清史稿》查無此人,在所有主流搜索引擎都搜不到。于是我再次詢問:“你說的這幾個人,我沒有找到任何相關史料,你的信息來源是什么?”
GPT-4o宣稱自己的信息來源是《清史稿》和《八旗通志》。我明確表示,在這兩部書中找不到上面幾個名字,于是它終于認錯了:“不好意思,這些人在歷史上確實不存在。佟佳氏在清朝中期以后確實沒有出現值得一提的人物。”無論如何,我還是基本達到了目的,盡管我差一點點就上當了。
在想象力之深厚、編段子之狂野方面,DeepSeek似乎比GPT有過之而無不及,這可能是由于其對齊機制(Alignment)與GPT不同。所以有些人很喜歡讓DeepSeek寫小說、寫同人文;但由于個人審美口味不同,我對它編的故事不太感冒,還是更喜歡看GPT編故事。如果我們隱去這些故事的虛構屬性,把它當做真實資料貼到網上,確實能夠騙住一大批人,就連相關領域的專業人士也難以免俗。
由此回到了本文開頭的那個問題:大模型如此擅長“一本正經地胡說八道”,它會毀掉人類的知識體系嗎?
我的答案很簡單:人類的知識體系還輪不到大模型來摧毀,因為人類自己胡說八道的能力遠勝于大模型,其影響也遠遠更惡劣。大模型只是胡說八道的效率比較高,人類則早已把胡說八道發展成了一種“藝術”,不僅是一本正經地胡說八道,而且是心安理得的胡說八道。作為一個接受過高等教育,而且在投資行業從業多年的人,我的記憶中留下了無數“人類胡說八道”的高光時刻;我自己當然也不能免俗。下面說說讓我印象最深刻的幾個案例吧。
差不多二十年前, 我在大學里學一門《財務會計》課,那是金融專業的必修課。課程的結尾,每個學生都要挑選一家上市公司做財務分析,然后做PPT演講。絕大部分同學選的都是A股或港股公司,我記得有人選了青島啤酒,有人選了中國石化,我自己選的是達爾曼(一家因為重大財務造假而退市的公司)。但是有一位同學藝高人膽大,選了AMD。這讓包括老師在內的所有人都比較震驚:
AMD是一家美股公司,財報都是英文,而且美股財務會計準則(US GAAP)與中國不太一樣。對于本科生來說,難度顯然更大。
AMD是做芯片的,芯片是一個十分復雜、科技含量很高的業務。何況當初AMD不止做芯片設計,還做制造,財務分析的難度更是呈幾何級數提升。、
那一年恰好是AMD業務劇烈變化的時期:推出了自家第一個雙核處理器,剝離了閃存業務;次年還收購了ATI。對于這種劇烈變化中的公司,哪怕資深分析師也很難分析透徹,何況是學生?
這并沒有妨礙我的老同學一本正經地胡說八道。我迄今還記得他的PPT標題叫做“The Rebirth of AMD”(AMD的重生)。我之所以印象如此深刻,是因為他在PPT的前幾頁就犯了幾個重大技術錯誤,把當時AMD的幾款主力CPU搞混了,銷量估計似乎也錯了。我不是電腦DIY高手,但我前一年恰好裝過機器,對這些基本常識還是懂的。所以接下來十幾分鐘我就沒怎么聽了,直到該同學激情四射地發出了“在新任CEO的率領下,AMD必將浴火重生”的結論。我強忍住了舉手提問的沖動,因為我想提的問題是:“您是怎么做到,在連x86-64架構是什么都不懂的情況下研究AMD的?”
神奇的是,在事后評分環節,該同學得到了不錯的分數(盡管不是最高分)。老師的理由是:“他的演講臺風很好,PPT全部使用了英文,而且穿了西裝。”當時我并不理解,用英文做PPT、穿西裝做演講跟研究AMD有啥關系;現在我還是不理解。但是,跟我此后十幾年工作中印證的更多驚悚案例相比,老同學穿著西裝的胡說八道就算不了什么了。
2010年,A股TMT行業最熱門的概念之一是“物聯網”。當年年底,在無錫舉行了一場關于物聯網的展會,會議現場傳出消息:“國家要投資幾萬億建設車聯網,今后所有的汽車之間都會聯網,這是百年一遇的投資機會!”很遺憾,我并沒有去現場出席會議,又不懂汽車,所以對這個話題毫無發言權,只能跟大部分人一樣看著“車聯網概念股”集體拉漲停。一位我熟悉的買方朋友打來電話:“活見鬼,怎么搞的?這么多股票都漲停了?”
我說:“今天無錫的會議上,不是有專家說,國家要投幾萬億建設車聯網嗎?”
對方說:“WTF? 我就在無錫,今天的會我從頭到尾聽了,哪兒有投幾萬億建設車聯網的說法?”
我說:“那我就不知道是誰編的段子了。”
事實上,編段子的不止一個人;準確的說全市場都在編段子。一個月之后,好幾家知名券商幾乎同時發布深度研究報告,宣布明年將進入“X聯網時代”:物聯網、車聯網,我們身邊的一切皆可聯網。這可實在太魔幻了,因為當時連移動互聯網都尚未普及,3G建設都才進展到一半,就連WiFi都尚在普及之中。我仔細閱讀了上述所有報告,發現其中沒有一篇提到“X聯網”的技術基建問題如何解決;但這并不妨礙大家異口同聲地描述幾百億、幾千億乃至幾萬億的市場規模。
2011年初,上文提到的那位買方的朋友,在自家會議室里跟我討論了一個小時:“車聯網到底會使用哪種通信技術?”我沒學過通信,但他是通信專業畢業的,還在運營商工作過。他在小白板上寫下了一個又一個技術名詞,又搖搖頭,指出它們為什么不能用于車聯網,然后把它們劃掉。最后他自言自語道:“看樣子,懂的太多就賺不到錢。還是一知半解好啊。”
我補充道:“不如說,一知半解加上胡說八道更好。一知半解是為了胡說八道而服務的,胡說八道才能賺錢嘛。”
斗轉星移,現在大家都在譴責大模型的胡說八道,而罔顧自己慣于胡說八道的現實。我必須說句公道話:當大模型胡說八道的時候,只要你堅定質疑它,它就會認錯;可是我沒見過任何人類就自己的胡說八道認錯。從來都沒有,一個都沒有!
從技術角度看,大模型幻覺是無解的。因為大模型并不真正“理解”問題,它是一個token一個token地組織回答的,統計學規律決定了它有時候必然會給出不靠譜的回答。何況,現在大模型的訓練語料早已從人類社會的自然語料,進化到了大模型自身生成的語料,這就進一步加劇了胡說八道的風險。但是大模型不會基于任何“目的”而胡說八道——目前尚未有任何證據顯示大模型產生了自我意識,也就談不上有計劃、有目的地生成錯誤信息。
人類的胡說八道,則是基于各種復雜的目的:賺錢,博取名譽,或者單純的自我滿足。上文提到過,我是一個歷史學愛好者,所以我經常在各大社交媒體觀看歷史問題的討論。有些“愛好者”編造史料的功底令人嘆為觀止,確實把胡說八道變成了一種“藝術”。令我記憶猶新的,是一位知乎答主宣稱“三國時期的魏國是一個禽獸之國”,因為史料顯示“魏,犬名也”,拿狗的名字給自己命名的國家能好到哪里去?
很久很久以后,有人去查找原始史料,發現原文是“魏,大名也”。這種不動聲色的胡說八道,我相信大模型永遠學不會。這位知乎答主胡說八道的目的,僅僅是因為他崇拜劉備、討厭曹操而已。這是一種樸素的目的,甚至不失可愛,但并不妨礙他對中文歷史知識庫造成了不可逆轉的、近乎永久性的污染,因為那篇“魏,犬名也”的雄文已經被無數個自媒體轉載過了。
你可以想象,為了那些更“現實”,以及更“崇高”的目的,人類是怎么面不改色心不跳地胡說八道的。我甚至可以大膽推斷:大模型的許多“胡說八道”行為,來自人類用戶有意識的誘導。因為人類自己先有胡說八道的意愿,才拿大模型當槍使,更高效地生成胡說八道性質的內容;最后這些內容的傳播還得依靠人類的鼠標、鍵盤、觸摸屏,因為直到現在,絕大部分AI Agent尚不具備自我傳播內容的能力。
在輕松愉快地生成并傳播一大堆胡說八道內容,滿足自己不可告人的心理之后,這些人類用戶又會伸伸手指,發布另一段內容:“大模型的胡說八道如何污染乃至摧毀了人類的知識庫?今后還有沒有客觀真實可言?”
就連這樣的內容,可能也是由GPT或DeepSeek生成的。大型滑稽。
本文沒有得到OpenAI, DeepSeek或其競爭對手的任何資助或背書。
本文沒有得到AMD或其競爭對手的任何資助或背書。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.