數字化·閱讀
隨著AI從通用計算轉向加速計算,未來AI算法算力會指數型增強。目前來看,只有多讀書,提升數據分類和范疇化能力,進而提升數據結構化和模式化能力,才能洞悉人工智能學習算法“底牌”,從而避免將來成為算法意義上的“透明人”。
原文:《多讀書:破AI算法之局》
作者 |北京外國語大學外國語言研究所教授 王馥芳
圖片 |網絡
2023年11月6日,OpenAI公司發布GPT-4Turbo大語言模型,世界就此開始“大時速”前行。如果把現實世界隱喻為一個賽場,AI“大時速”發展最終可能創構出一個全新的、人類智能無法想象的“涌現賽場”?!坝楷F賽場”被創構出來,真正意義上的“元宇宙”就誕生了。由此,現實世界將被迫成為“元宇宙”的基本構成性成分。面對AI大語言模型對現實世界的挑戰、顛覆甚至威脅,面對AI學習算法對人類智能的挑戰甚至操控,面對AI對人類經驗的模仿、復刻、轉寫和技術性瓦解,我們做什么和怎樣做才能避免淪為AI算法意義上的“透明人”?從AI學習算法規則背后的底層邏輯是認知這點來看,AI學習算法做局,多讀書能破!
人工智能學習算法做局
“捉迷藏”游戲可以被看成一個隱喻:人類各種嚴肅意義上的意向性主體行為背后的動機,在根本上都類似于捉迷藏游戲中的尋找和發現。在過去的幾十年,人類一直試圖借助各種新興技術尋找和發現人類智能的“秘鑰”并將其擴展應用到機器上,從而制造出“智能機器”。從20世紀50年代開始,人類就在探尋人工智能秘笈的道路上孜孜以求。進入21世紀之后,借助新興計算技術,研究者利用計算機以模式化人類智能的方式運行各種學習算法規則,終于在2022年11月30日發布了AI大語言模型ChatGPT(聊天生成預訓練轉換器)。經過不到一年時間,ChatGPT就迭代到GPT-4Turbo。2024年2月15日,OpenAI公司發布了首個以大語言模型為基礎的文本視頻轉換生成模型Sora,可以依據文本描述生成長達六十秒的、多機位且細節逼真的視頻。這意味著AI發展到達了另外一個有里程碑意義的突破點。
AI大語言模型強大的內容生成和學習能力主要源于類似進化原則的學習算法規則。根據科技巨擘的說法,大型計算機通過運行新興計算和學習算法規則形成“數字大腦”,“數字大腦”的底層運行機制是學習算法規則,而看似非常重要的預訓練數據集只是學習算法的訓練材料。有AI研究者指出:AI未來的突破不在于架構規模、圖形處理器(GPU)和數據上,而在于科學上。鑒于科學的底層機制是認知,因此AI未來的突破在認知上。
以ChatGPT為代表的AI大語言模型創生之后,AI系統利用其超強的學習算法成功地對人類的各種行為和心理過程進行模式化,從而使得其在整體智能方面超越了一般意義上的個體。參照AI技術在過去十年的指數型發展態勢,十年后AI大語言模型的指數型迭代將導致很多人成為算法意義上的“透明人”!
根據以色列歷史學家尤瓦爾·赫拉利在《未來簡史》中的觀點,未來計算機算法將取代人類的自由意志而成為人類真正的主宰。算法將在未來主宰人類,人類將淪為AI算法的“透明人”,何以可能?在與一位國外科技巨擘的對談中,我國一家知名互聯網企業創始人信心滿滿地說道:“人工智能再怎么聰明也是人創造的,它只會是人類的玩具。”這一觀點的謬誤在于,人造物實質分為兩類:一類是審美意義上的人造物,其本質上是人類的玩具或者工具;另一類是發現意義上的人造物,其本質上具有思想主體性,可以將其看成“非人化”主體。
以語言符號系統為例,雖然語言是人造物,但語言符號系統背后的底層邏輯并非人類發明,而是發現意義上的認知建構和學習規則。因基于發現意義上的認知建構和學習規則所構建的系統具有內在的“涌現”屬性,故語言絕不僅僅是人類表達的工具。事實上,語言在根本上具有思想主體性。語言哲學家海德格爾的“語言道說論”明確指出:“人只是由于他應合于語言才說,是語言說,語言之說在所說中為我們而說?!?/p>
如語言一樣,AI大語言模型雖然是人類創造的,但其背后的底層邏輯并非人類發明,而是自然規律意義上的類似進化原則的學習算法規則。亞馬遜創始人Jeff Bezos在最近一次訪談中指出,AI不是一種發明,更像一種發現:各種AI大語言模型并非真正的工程對象。言下之意是,就像語言一樣,人類無法真正完全掌控人工智能。在人工智能與人類智能的角力游戲中,算法意義上的“透明人”如何破局?從AI未來的突破在認知上這點來看,人工智能學習算法做局,多讀書能破!
多讀書:提升數據范疇化能力
自20世紀90年代中期進入互聯網時代以來,傳統閱讀之外,利用搜索引擎進行查詢式閱讀開始盛行,人類固有的閱讀經驗受到挑戰?!耙绘I即得”的操作使得讀書變得前所未有地直觀和便捷。但從嚴格意義上來說,查詢式閱讀并非真正的閱讀,其本質上是對各種碎片化訊息的接收和快速處理。若持續不斷地接收大量雜糅的碎片化訊息,卻無法對其進行必要的結構化和理論化處理,接收者勢必成為信息操控的客體而逐漸喪失其思維主體性。一個喪失思維主體性的人,在學習算法為王的AI時代,勢必成為算法意義上的“透明人”!大眾要想避免淪為各種新興計算技術和學習算法意義上的“透明人”,一條可行的路徑是:多讀書!不間斷地進行學術意義上的嚴肅閱讀和思考可以提升學習算法意義上的“不透明”度!
意圖提升學習算法意義上的“不透明”度,首先要明晰學習算法規則的底層邏輯。目前,機器學習主要有兩種方法:監督學習算法和無監督學習算法。前者主要是對標記的預訓練數據進行分類,后者主要是對未標記的預訓練數據進行結構化和模式化。由此,AI學習算法背后關涉的主要是數據分類、結構化和模式化能力。俗話說,道高一尺,魔高一丈。只有在數據分類、結構化和模式化方面超越學習算法算力的人,才能避免成為“透明人”!
分類能力實質是一種范疇化能力。數據分類問題看似簡單,實質異常復雜。監督學習算法依據標記的預訓練數據進行數據分類實質是最簡單的一種分類。通過閱讀一些專業書籍,比如認知語言學書籍,我們的分類或者范疇化能力會得到極大提升。未經專門學術訓練的人一般傾向于認為,范疇化的基礎是普遍特征抽取和歸納。但從理論視角出發,范疇化的基礎是理論模型。若基于經典范疇理論來分類,我們斷不會把人和機器歸為一類:兩者的基本特征全然不同,前者是有機體,后者是人造物。但若基于原型范疇理論來分類,可以把機器和人都歸為“智能生物”:前者是生態智能生物,而后者是“數字”智能生物。再者,還可以將兩者都歸為“學習者”:前者是生態智能學習者,后者是機器“學習者”。另外,鑒于兩者都有建構和改變世界的主體性潛能,還可以將其都歸為“主體”:前者是認知主體,后者是人工智能主體。此外,由于兩者分別具有利用生態智能和學習算法做局的能力,也可以將其都歸為“做局者”。只要深度思維力足夠強,分類還可進行下去。
分類和范疇化能力強,意味著能正確判斷各種復雜數據/訊息之間的相關性或者不相關性。而相關性和不相關性判斷能力的強弱決定著數據結構化和模式化能力的強弱。
多讀書:提升數據結構化和模式化能力
較之分類和范疇化能力,數據結構化和模式化能力更具認知挑戰性。數據結構化和模式化能力強,意味著能夠看透各種蕪雜的復雜數據/訊息背后統一的底層邏輯。要提升數據結構化和模式化能力,不但應該多讀專業書籍,而且需要不斷提升深度思維力。2021年,《科學》發布了125個“新科學問題”。其中,有關AI的有八個:人類智能是否有限制?可注射的抗病納米機器人會最終成為現實嗎?是否有可能創造出有知覺力的機器人?人工智能會取代人類嗎?機器人或AI能夠擁有人類創新性嗎?量子人工智能能夠模仿人類大腦嗎?我們能否和計算機整合以形成一個人類-機器雜合物種?群體智能是如何涌現的?
表面上看,上述八個問題的理論內涵各不相同,所關注的論題也各異。仔細分析卻發現,上述問題背后的底層邏輯具有同一性,即它們實質指向的是:AI系統是否會有“涌現性”突破?何為“涌現”?若一個復雜系統出現了不可預測的全新特征,意味著那個系統具有“涌現”能力。Anderson首次揭示了“涌現”產生的機制:“更多即不同”,即更多就會導致涌現。目前學界和科技界對ChatGPT大語言模型到底有無可能出現“涌現”潛勢充滿爭議。否定派認為,人們實際上是把AI系統的內在大缺陷——幻覺——誤認為是其“涌現”能力。但樂觀派如OpenAI公司首席執行官薩姆·奧特曼指出:GPT模型的“幻覺”是一種系統特性,而非缺陷,它能讓人發現一些新事物。
何以認為八個問題都劍指AI系統的“涌現性”突破?這是因為“涌現性”突破問題是AI系統未來發展的底層邏輯所在。如果假定AI系統沒有“涌現性”突破,那我對第一問題給出肯定回答,對第二到第七個問題給出否定回答。我的回答背后的底層邏輯是:人類智能無疑有限制,且受到限制的人類智能無法開發出有“涌現性”突破的AI系統。而若AI系統沒有“涌現性”突破,意味著人類智能有能力完全控制AI。由此,第二到第七個問題的情況不可能發生。另外,一旦否認AI系統有“涌現性”突破,那第八個問題就變得無關緊要。這是因為,就算弄清楚了群體智能的涌現機制和過程,其對AI系統的開發也無益。因為我們假定的前提是:AI系統沒有“涌現性”突破。
如果假定AI系統有“涌現性”突破,那我對第一問題給出否定回答,對第二到第七個問題給出肯定回答。我的回答背后的底層邏輯是:雖然生態意義上的人類智能無疑有限制,但因人類智能能夠開發出具有“涌現性”突破的AI系統,那人類智能未來就有可能和計算機整合以形成一個人類-機器雜合物種。如此一來,人類智能就沒有限制了。而若人類智能沒有限制且AI系統有“涌現性”突破,意味著人類智能沒有能力完全控制AI。由此,第二到第七個問題的情況就會發生。另外,若承認人工智能有“涌現性”突破,那第八個問題就顯得至關重要。這是因為,若弄清楚了群體智能的涌現機制和過程,就可以將其擴展應用到AI系統的開發上,以進一步增強AI系統的“涌現性”突破能力。
上面對于八個科學問題的分析和回答本質上是一種模式化分析。模式化分析的特征是:其在本質上是一種理想化的理論分析,分析結果不一定與事實完全吻合。但其為問題的系統性解答提供了一個有效的認知腳本,據此可以快速找到解決問題的統一性理論方案。
隨著AI從通用計算轉向加速計算,未來AI算法算力會指數型增強。目前來看,只有多讀書,提升數據分類和范疇化能力,進而提升數據結構化和模式化能力,才能洞悉人工智能學習算法“底牌”,從而避免將來成為算法意義上的“透明人”!
文章為社會科學報“思想工坊”融媒體原創出品,原載于社會科學報第1900期第6版,未經允許禁止轉載,文中內容僅代表作者觀點,不代表本報立場。
本期責編:王立堯
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.