https://pubsonline.informs.org/doi/full/10.1287/stsc.2024.0189
Theory Is All You Need: AI, Human Cognition, and Causal Reasoning
理論即一切:人工智能、人類認(rèn)知與因果推理
摘要:
學(xué)者們認(rèn)為,人工智能(AI)能夠創(chuàng)造出真正的創(chuàng)新成果和新知識(shí),并且反過來,人工智能和認(rèn)知的計(jì)算模型將取代人類在不確定性條件下的決策。我們對(duì)此持不同觀點(diǎn)。我們認(rèn)為,人工智能基于數(shù)據(jù)的預(yù)測(cè)與人類基于理論的因果邏輯和推理不同。我們以大型語言模型為例,指出將計(jì)算機(jī)和人腦視為輸入-輸出設(shè)備的類比存在已久,但問題重重。人類認(rèn)知更適于被視為一種基于理論的因果推理形式,而非人工智能所強(qiáng)調(diào)的信息處理和基于數(shù)據(jù)的預(yù)測(cè)。人工智能采用基于概率的方法獲取知識(shí),主要具有向后看和模仿性,而人類認(rèn)知?jiǎng)t具有前瞻性,能夠創(chuàng)造出真正的創(chuàng)新成果。我們引入數(shù)據(jù)-信念不對(duì)稱性的概念,以重于空氣的飛行為例來闡述我們的觀點(diǎn),說明人工智能和人類認(rèn)知之間的差異。基于理論的因果推理為人類提供了一種認(rèn)知機(jī)制,使其能夠干預(yù)世界,并通過定向?qū)嶒?yàn)生成新數(shù)據(jù)。在文章中,我們討論了我們的觀點(diǎn)對(duì)于理解創(chuàng)新成果、新知識(shí)和不確定性決策的含義。
關(guān)鍵詞:認(rèn)知 ? 人工智能 ? 預(yù)測(cè) ? 因果推理 ? 決策制定 ? 戰(zhàn)略 ? 基于理論的視角
引言
人工智能(AI)如今在許多涉及高級(jí)思維和戰(zhàn)略推理的游戲中、標(biāo)準(zhǔn)化測(cè)試中以及認(rèn)知任務(wù)中,已經(jīng)能夠與人類相匹敵甚至超越人類。例如,AI引擎能夠在國際象棋中輕松擊敗人類,而國際象棋數(shù)十年來一直是衡量AI能力的關(guān)鍵基準(zhǔn)(Simon 1985a, Bory 2019)。AI系統(tǒng)還在涉及復(fù)雜談判、與他人復(fù)雜互動(dòng)、聯(lián)盟、欺騙以及理解其他玩家意圖的復(fù)雜棋盤游戲中表現(xiàn)出色(例如,Ananthaswamy 2022)。當(dāng)前的AI模型還在各種職業(yè)資格考試中的表現(xiàn)超過了90%以上的人類,例如法律領(lǐng)域的律師資格考試和會(huì)計(jì)領(lǐng)域的注冊(cè)會(huì)計(jì)師考試(Achiam et al. 2023)。AI在醫(yī)學(xué)診斷方面也取得了突破性進(jìn)展,在某些疾病的診斷上超越了經(jīng)過高度訓(xùn)練的醫(yī)學(xué)專業(yè)人士(例如,Zhou et al. 2023)。這些快速進(jìn)步促使一些AI學(xué)者認(rèn)為,即使是人類最具特色的特質(zhì),如意識(shí),也將很快被機(jī)器復(fù)制(例如,Goyal and Bengio 2022, Butlin et al. 2023)。總的來說,AI正在迅速開發(fā)出能夠“像人類一樣思考”“理性思考”“像人類一樣行動(dòng)”和“理性行動(dòng)”的算法(Csaszar and Steinberger 2022,第2—3頁)。
鑒于AI令人驚嘆的進(jìn)展,丹尼爾·卡尼曼(Daniel Kahneman 2018,第609—610頁,強(qiáng)調(diào)部分為原文所有)提出了(并回答了)下一個(gè)合乎邏輯的問題:“是否還會(huì)有一些事情是專屬于人類的?坦率地說,我沒有看到任何理由去限制AI能夠做什么……因此,很難想象在擁有足夠數(shù)據(jù)的情況下,還會(huì)有一些事情是只有人類才能做到的……只要可能,就應(yīng)該用算法取代人類。”
卡尼曼并非唯一持這種觀點(diǎn)的人。達(dá)文波特和柯比(Davenport and Kirby 2016,第29頁)認(rèn)為,“我們已經(jīng)知道,分析和算法在從數(shù)據(jù)中提煉洞察方面比大多數(shù)人更好”,而且“這種人類/機(jī)器表現(xiàn)差距只會(huì)進(jìn)一步擴(kuò)大”。許多學(xué)者聲稱,AI很可能在大多數(shù)——如果不是全部——推理和決策形式中超越人類(例如,Legg and Hutter 2007, Morris et al. 2023, Grace et al. 2024)。有人認(rèn)為,戰(zhàn)略決策也可能被AI接管(Csaszar et al. 2024),甚至科學(xué)本身也將被“AI科學(xué)家”自動(dòng)化(例如,Lu et al. 2024, Manning et al. 2024)。AI的先驅(qū)之一杰弗里·辛頓(Geoffrey Hinton)認(rèn)為,大型語言模型(LLMs)已經(jīng)具有感知能力和智能,“數(shù)字智能”不可避免地將超越人類的“生物智能”——如果它還沒有做到的話(參見Hinton 2023;還可參見Bengio et al. 2023)。
與機(jī)器相比,人類的認(rèn)知和計(jì)算局限性顯而易見。人類是有偏見的(Kahneman 2011, Chater et al. 2018)。人類在關(guān)注和采樣數(shù)據(jù)時(shí)是有選擇性的,并且容易受到確認(rèn)偏誤、動(dòng)機(jī)性推理以及數(shù)百種其他認(rèn)知偏誤的影響(截至最近統(tǒng)計(jì),已接近200種)。簡(jiǎn)而言之,人類是有限理性的——其計(jì)算和處理信息的能力受到顯著限制(Simon 1955),尤其是與計(jì)算機(jī)相比(參見Simon 1990)。而那些使人類表現(xiàn)出有限理性和決策能力差的特質(zhì),似乎正是使計(jì)算機(jī)在認(rèn)知任務(wù)上表現(xiàn)出色的原因。計(jì)算機(jī)和AI的優(yōu)勢(shì)在于它們能夠處理海量數(shù)據(jù),并以快速且強(qiáng)大的方式對(duì)其進(jìn)行處理。
在本文中,我們提出了與人類認(rèn)知相關(guān)的AI的對(duì)立觀點(diǎn),包括其對(duì)戰(zhàn)略、新奇性的產(chǎn)生以及不確定性下的決策的影響。AI基于一種觀念,即無論是機(jī)器還是人類的認(rèn)知,都是一種廣義的信息處理形式:一種輸入-輸出設(shè)備。為了說明人類與計(jì)算機(jī)之間的認(rèn)知差異,我們以大型語言模型與人類語言學(xué)習(xí)的對(duì)比為例。我們引入了數(shù)據(jù)-信念(不)對(duì)稱性的概念,并分別探討其在解釋AI和人類認(rèn)知中的作用,以重于空氣的飛行為例進(jìn)行詳細(xì)說明。人類認(rèn)知是前瞻性的,需要數(shù)據(jù)-信念不對(duì)稱性,這些不對(duì)稱性體現(xiàn)在理論、因果推理和實(shí)驗(yàn)中。我們認(rèn)為,人類認(rèn)知是由前瞻性、基于理論的因果邏輯驅(qū)動(dòng)的,這與AI和認(rèn)知計(jì)算模型所強(qiáng)調(diào)的預(yù)測(cè)和回溯性數(shù)據(jù)截然不同。基于理論的因果推理能夠產(chǎn)生新的、與眾不同的數(shù)據(jù)、觀察和實(shí)驗(yàn)。我們強(qiáng)調(diào)這些觀點(diǎn)對(duì)于理解新奇性、新知識(shí)的起源以及不確定性下的決策的影響。
AI 與心智:認(rèn)知是計(jì)算嗎?
從20世紀(jì)40年代到今天,模擬人類心智——包括思考、理性和認(rèn)知——一直是人工智能(AI)的核心追求。正如1956年達(dá)特茅斯會(huì)議上所提出的,AI的目標(biāo)是“基于這樣的猜想:學(xué)習(xí)或智能的任何方面原則上都可以被精確描述,從而讓機(jī)器能夠模擬它”。這種將心智視為計(jì)算的觀點(diǎn)不僅歷史悠久,而且在過去幾十年中不斷加深。例如,認(rèn)知科學(xué)家Johnson-Laird甚至認(rèn)為“任何關(guān)于心智的科學(xué)理論都必須將其視為自動(dòng)機(jī)”。
AI將認(rèn)知視為一種廣義的信息處理形式,其中“人類思考完全是一種信息處理活動(dòng)”。這種觀點(diǎn)認(rèn)為,心智和機(jī)器都是廣義的輸入-輸出設(shè)備,輸入如刺激和線索(數(shù)據(jù))被處理以產(chǎn)生各種輸出,包括決策、能力、行為和行動(dòng)。這種信息處理模型被廣泛應(yīng)用于AI與認(rèn)知的交叉領(lǐng)域,包括感知、學(xué)習(xí)、記憶、專長(zhǎng)、搜索和決策制定。此外,將人類心智活動(dòng)視為計(jì)算的觀點(diǎn)也廣泛存在于進(jìn)化論的論證中。
然而,我們對(duì)這種將AI與人類認(rèn)知視為計(jì)算的觀點(diǎn)持不同看法。盡管AI和人類認(rèn)知之間存在一些相似性,但AI基于預(yù)測(cè)(依賴過去數(shù)據(jù))的模型無法捕捉人類認(rèn)知的本質(zhì),也無法解釋新奇性、新知識(shí)的產(chǎn)生或不確定性下的決策。
在這些研究中,我們更全面地指出,從20世紀(jì)50年代至今,學(xué)者們一直試圖在人工智能(AI)、機(jī)器和人類認(rèn)知之間建立一種等價(jià)關(guān)系。在所有這些工作中,認(rèn)知、計(jì)算(以及人工智能)被視為緊密相連的:這些工作的基本前提是,機(jī)器和人類是一種輸入-輸出設(shè)備,其中信息處理和學(xué)習(xí)的相同底層機(jī)制在起作用。對(duì)計(jì)算和信息處理的關(guān)注也是有限理性概念的公理基礎(chǔ)(參見Felin等人2017年的綜述)。有限理性關(guān)注人類的“計(jì)算能力”及其局限性(Simon 1955, 第99頁),這一觀點(diǎn)深刻地塑造了經(jīng)濟(jì)學(xué)、決策理論、戰(zhàn)略和認(rèn)知科學(xué)等領(lǐng)域(例如,Chater等人2018年,Kahneman 2003年,Puranam等人2015年,Gigerenzer和Goldstein 2024年)。
我們不同意AI和人類認(rèn)知在計(jì)算形式上具有顯著相似性的觀點(diǎn),原因?qū)⒃谙挛闹杏懻摗T掚m如此,我們提出這一觀點(diǎn)的目的并不是削弱AI領(lǐng)域令人興奮的突破。相反,我們強(qiáng)調(diào),當(dāng)涉及到理解心智和認(rèn)知時(shí),AI與人類之間的類比很快就會(huì)失效,這對(duì)我們?nèi)绾慰创缕嫘缘漠a(chǎn)生、新知識(shí)以及不確定性下的決策有著重要的衍生性后果。在接下來的部分中,我們將深入探討一個(gè)具體例子,即機(jī)器與人類的語言學(xué)習(xí),以更細(xì)致地闡述這一點(diǎn)。
機(jī)器與人類學(xué)習(xí):不同的輸入,不同的輸出
盡管心智和機(jī)器的輸入-輸出模型——無論我們討論的是符號(hào)化方法還是亞符號(hào)化方法(更多細(xì)節(jié)見附錄)——一直是人工智能和認(rèn)知科學(xué)的核心重點(diǎn),接下來我們將強(qiáng)調(diào)機(jī)器學(xué)習(xí)和人類學(xué)習(xí)之間的一些重要差異。以語言為背景來突出這些差異是一個(gè)恰當(dāng)?shù)恼Z境。語言可以說是“人類認(rèn)知的最典型特征(語言及其與思維的關(guān)系)”,因此它“可以成為真正的‘洞察心智的窗口’”(Chomsky和Gallega 2020,第321頁;還可參見Pinker 1994)。語言為理解人類和人工智能提供了一個(gè)重要的測(cè)試和背景。此外,已經(jīng)有人認(rèn)為大型語言模型具有感知能力,甚至有人認(rèn)為它們已經(jīng)接近或超越了人類的認(rèn)知能力(例如,Binz和Schulz 2023, Hinton 2023)——這是一個(gè)我們所質(zhì)疑的假設(shè)。
在最基本的層面上,要研究任何系統(tǒng)及其行為,我們需要理解它的輸入和輸出。圖靈(Turing 1948/1992)認(rèn)為,無論是人類還是機(jī)器的任何智能形式,都可以被研究為一個(gè)輸入-輸出系統(tǒng)。在討論人工智能的可能性——或者用他的話說,“智能機(jī)器”——時(shí),圖靈(1950,第456頁,強(qiáng)調(diào)部分為原文所有)將嬰兒大腦比作“未經(jīng)訓(xùn)練的嬰兒大腦”,稱嬰兒大腦幾乎是一張白紙,“就像一個(gè)筆記本”,有“很少的機(jī)制和許多空白頁”(參見Turing 1948/1992)。根據(jù)圖靈的說法,這些空白頁需要通過訓(xùn)練和教育的過程用輸入來填充。在嬰兒或兒童生命的早期,他們通過語言和聽到的單詞獲得輸入,這些輸入最終構(gòu)成了人類的語言能力和輸出。同樣地,圖靈(1948/1992,第107頁)認(rèn)為,可以想象一個(gè)“應(yīng)用于機(jī)器的類似教學(xué)過程”,機(jī)器通過輸入進(jìn)行學(xué)習(xí)。圖靈列舉了智能機(jī)器可能展示其學(xué)習(xí)成果的各種場(chǎng)景,包括國際象棋或撲克等游戲、密碼學(xué)或數(shù)學(xué),并且他認(rèn)為,“學(xué)習(xí)語言將是最令人印象深刻的,因?yàn)檫@是這些活動(dòng)中最具人類特征的活動(dòng)”(Turing 1948/1992,第117頁)。由于人類學(xué)習(xí)和機(jī)器學(xué)習(xí)通常被視為類似的過程,接下來我們將以語言學(xué)習(xí)為例,聚焦于其中的關(guān)鍵差異,并進(jìn)一步探討這些學(xué)習(xí)差異對(duì)于科學(xué)和經(jīng)濟(jì)背景下的決策和知識(shí)生成的影響。
機(jī)器如何學(xué)習(xí)語言。為了說明機(jī)器學(xué)習(xí)的過程,接下來我們仔細(xì)探討現(xiàn)代大型語言模型(LLMs)及其學(xué)習(xí)方式。LLMs是機(jī)器學(xué)習(xí)的一個(gè)有用實(shí)例。學(xué)習(xí)本質(zhì)上是從零開始——自下而上,直接從數(shù)據(jù)中生成——通過引入海量訓(xùn)練數(shù)據(jù)以及對(duì)這些數(shù)據(jù)中的統(tǒng)計(jì)關(guān)聯(lián)和相互作用進(jìn)行算法處理。在LLMs的背景下,訓(xùn)練數(shù)據(jù)由從各種公共來源和互聯(lián)網(wǎng)收集的海量詞匯和文本組成。為了體會(huì)這些模型整合了多少數(shù)據(jù)和訓(xùn)練,截至2024年初的最新LLMs估計(jì)包含約13萬億個(gè)標(biāo)記(一個(gè)標(biāo)記大致相當(dāng)于一個(gè)詞)。為了形象說明,如果一個(gè)人試圖以每小時(shí)9000詞(每分鐘150詞)的速度閱讀這些文本,那么閱讀一個(gè)包含13萬億詞的訓(xùn)練數(shù)據(jù)集將需要超過16.4萬年。
用于訓(xùn)練LLM的龐大文本語料庫被標(biāo)記化以便進(jìn)行自然語言處理。這通常涉及將單詞(或子詞單元或字符)轉(zhuǎn)換為數(shù)值序列或向量。例如,句子“貓坐在墊子上”可能會(huì)被標(biāo)記化為一個(gè)序列,如[10, 123, 56, 21, 90, 78]。每個(gè)標(biāo)記通過一個(gè)嵌入層,該層將標(biāo)記轉(zhuǎn)換為密集向量表示,捕捉其語義信息,例如其頻率和位置嵌入。嵌入層有自己的參數(shù)集(權(quán)重),這些參數(shù)在訓(xùn)練過程中被學(xué)習(xí)。我們之前提到的Transformer架構(gòu)(Vaswani et al. 2017)引入的注意力機(jī)制允許模型在所有其他周圍標(biāo)記的上下文中考慮每個(gè)標(biāo)記,從而獲得更廣泛的上下文理解。深度人工神經(jīng)網(wǎng)絡(luò)被證明極為通用,不僅適用于文本,還適用于圖像識(shí)別和計(jì)算機(jī)視覺等多樣化領(lǐng)域,包括結(jié)合不同類型數(shù)據(jù)的多模態(tài)應(yīng)用(例如,通過文本提示生成圖像)。
從作為訓(xùn)練輸入的海量數(shù)據(jù)中,LLM學(xué)習(xí)語言的各種統(tǒng)計(jì)和分布元素之間的關(guān)聯(lián)和相關(guān)性:特定單詞之間的相對(duì)關(guān)系、它們的關(guān)系、順序、頻率等。這些統(tǒng)計(jì)關(guān)聯(lián)基于訓(xùn)練數(shù)據(jù)集中發(fā)現(xiàn)的單詞使用模式、上下文、句法和語義。模型發(fā)展出對(duì)單詞和短語在不同上下文中傾向于共現(xiàn)的理解。模型不僅學(xué)習(xí)關(guān)聯(lián),還理解不同語言元素之間的相關(guān)性。換句話說,它識(shí)別出某些單詞更有可能出現(xiàn)在特定上下文中。
現(xiàn)在,盡管上述內(nèi)容并非對(duì)LLMs的技術(shù)性介紹,但它提供了與我們的論點(diǎn)相關(guān)的這一過程的大致輪廓(詳細(xì)綜述見Naveed et al. 2023, Chang et al. 2024, Minaee et al. 2024;還可參見Resnik 2024)。這種訓(xùn)練的結(jié)果是一個(gè)能夠使用語言的人工智能模型:更具體地說,該模型能夠通過基于提示的下一個(gè)單詞的隨機(jī)預(yù)測(cè)方法生成流暢且連貫的文本。簡(jiǎn)而言之,LLM的輸出基于其在訓(xùn)練數(shù)據(jù)中遇到的輸入結(jié)構(gòu)的條件概率。
基于對(duì)LLM訓(xùn)練方式的大致描述,我們將此與人類學(xué)習(xí)語言的方式進(jìn)行比較。正如本文開頭所討論的,AI模型的基本前提是機(jī)器和人類學(xué)習(xí)之間存在對(duì)稱性。我們認(rèn)為,仔細(xì)指出這些差異非常重要,因?yàn)檫@些差異為我們后續(xù)關(guān)于認(rèn)知和新奇性產(chǎn)生的論證奠定了基礎(chǔ)。
人類與機(jī)器學(xué)習(xí)語言的對(duì)比。在語言學(xué)習(xí)(以及其他領(lǐng)域)方面,人類和機(jī)器學(xué)習(xí)之間的差異是顯著的。盡管LLMs(大型語言模型)接觸并用萬億級(jí)的文本詞匯進(jìn)行訓(xùn)練,人類的語言學(xué)習(xí)過程卻要緩慢得多。以說明,人類嬰兒或兒童從父母、教師、兄弟姐妹、朋友以及周圍環(huán)境中聽到的平均詞匯量每天大約為2萬個(gè)(例如,Hart和Risley 2003, Gilkerson等人 2017)。因此,在最初的五年里,一個(gè)孩子可能會(huì)接觸到——或者說用這些詞匯進(jìn)行訓(xùn)練——大約3650萬詞匯。相比之下,LLMs在短短數(shù)周或數(shù)月的時(shí)間內(nèi)就用萬億級(jí)的標(biāo)記進(jìn)行訓(xùn)練。
輸入在數(shù)量(絕對(duì)數(shù)量)和質(zhì)量方面都存在根本差異。具體來說,嬰兒或幼兒主要接觸的口語與LLMs訓(xùn)練所用的書面語不同。口語在性質(zhì)、結(jié)構(gòu)和目的上與書面語存在顯著差異。在這里,關(guān)于口語與書面語差異的研究極具啟發(fā)性(例如,Biber 1991)。口語是自發(fā)的(沒有經(jīng)過有意義的編輯),非正式的,重復(fù)的,且往往是短暫的。而書面語——另一方面——是視覺的、持久的,經(jīng)過更精心的構(gòu)思、計(jì)劃和編輯。它也更密集,包含更復(fù)雜的詞匯(例如,Halliday 1989, Tannen 2007)。重要的是,口語與書面語的功能目的和用途也存在顯著差異。口語是即時(shí)的、互動(dòng)的,專注于協(xié)調(diào)、表達(dá)和實(shí)際做事。盡管書面語也服務(wù)于這些目的,但重點(diǎn)更多在于復(fù)雜信息的傳遞。LLMs的大部分訓(xùn)練數(shù)據(jù)并非對(duì)話式的(對(duì)于用口語或原始音頻訓(xùn)練的模型,見Lakhotia等人 2021)。相反,書面語經(jīng)過更周密的思考。LLMs可能會(huì)用莎士比亞和柏拉圖的作品、學(xué)術(shù)出版物、公共領(lǐng)域書籍(例如,來自古騰堡計(jì)劃的書籍)、歌詞、博客文章、新聞報(bào)道以及互聯(lián)網(wǎng)上的各種材料進(jìn)行訓(xùn)練。這些數(shù)據(jù)更干凈、語法更正確,且更有條理。可以說,LLMs接收到的輸入——以書面、編輯和出版的文本形式——在語言學(xué)上遠(yuǎn)勝一籌。從統(tǒng)計(jì)學(xué)角度看,LLMs的訓(xùn)練數(shù)據(jù)包含更少的噪聲,因此具有更強(qiáng)的預(yù)測(cè)能力。即使是大多數(shù)LLMs訓(xùn)練數(shù)據(jù)集中包含的大量維基百科文章,也是經(jīng)過數(shù)千次編輯以確保可讀性、準(zhǔn)確性和連貫性的最終結(jié)果。
顯然,人類在不同的條件下、通過不同類型的輸入學(xué)習(xí)語言。簡(jiǎn)而言之,可以合理地認(rèn)為,人類的語言能力發(fā)展方式與機(jī)器學(xué)習(xí)語言的方式在數(shù)量和質(zhì)量上都截然不同。人類(不知何故)從極其稀疏、貧乏且高度不系統(tǒng)的輸入和數(shù)據(jù)中學(xué)習(xí)語言(Chomsky 1975)。與LLMs相比,人類的語言能力在輸入方面被“嚴(yán)重地”未充分決定。也就是說,相對(duì)稀疏的語言輸入幾乎無法解釋人類生成的極具創(chuàng)新性的輸出。
除了輸入在數(shù)量和質(zhì)量上的差異外,LLMs的預(yù)測(cè)(句子中的下一個(gè)詞)與實(shí)際結(jié)果(真正的下一個(gè)詞)之間存在顯著差異。預(yù)測(cè)處理作為一種認(rèn)知理論,認(rèn)為大腦不斷預(yù)測(cè)感官輸入,并最小化預(yù)測(cè)與實(shí)際感官輸入之間的誤差。每種預(yù)測(cè)能力——無論是預(yù)測(cè)一個(gè)詞還是一個(gè)感知——都是基于過去的輸入。大型語言模型試圖根據(jù)訓(xùn)練數(shù)據(jù)預(yù)測(cè)最有可能出現(xiàn)的下一個(gè)詞,而主動(dòng)推理試圖預(yù)測(cè)最有可能出現(xiàn)的下一個(gè)感知或行動(dòng)。這兩種方法都極為保守(依賴于過去的數(shù)據(jù)),因?yàn)樗鼈冊(cè)噲D減少意外——或者說將預(yù)測(cè)視為誤差最小化(Hohwy 2013)。
反向傳播——訓(xùn)練神經(jīng)網(wǎng)絡(luò)的基本機(jī)制——以及預(yù)測(cè)處理中誤差最小化的概念(Friston和Kiebel 2009)在概念上存在廣泛的相似性,因?yàn)閮烧叨忌婕暗{(diào)整以最小化某種形式的誤差或差異。兩者都基于過去的輸入生成預(yù)測(cè)。反向傳播和預(yù)測(cè)處理中的誤差最小化都涉及調(diào)整內(nèi)部模型(在人工智能中是神經(jīng)網(wǎng)絡(luò)權(quán)重,在神經(jīng)科學(xué)中是分層大腦模型)以減少誤差(或者用機(jī)器學(xué)習(xí)的術(shù)語來說,最小化損失函數(shù))。
在這種以誤差最小化和意外減少為重點(diǎn)的架構(gòu)下,LLMs或任何以預(yù)測(cè)為導(dǎo)向的認(rèn)知AI能否真正生成某種形式的新知識(shí)?除了記憶、翻譯、重述或鏡像其訓(xùn)練文本之外,LLMs能否生成新知識(shí)?
我們不認(rèn)為L(zhǎng)LMs或基于輸入-輸出的認(rèn)知系統(tǒng)能夠做到這一點(diǎn)——至少不會(huì)超出由于其隨機(jī)性而可能出現(xiàn)的偶然情況。這些系統(tǒng)中沒有內(nèi)置任何前瞻性機(jī)制或獨(dú)特的因果邏輯。明確這一點(diǎn)非常重要,因?yàn)橛行┤苏J(rèn)為并預(yù)測(cè)LLMs將在戰(zhàn)略和科學(xué)等不確定情境中取代人類決策者。例如,Csaszar等人(2024)認(rèn)為,“用于訓(xùn)練LLMs的語料庫包含了對(duì)戰(zhàn)略決策管理(SDM)有價(jià)值的信息,如消費(fèi)者偏好、競(jìng)爭(zhēng)對(duì)手信息和戰(zhàn)略知識(shí)”,并指出人工智能如何可以使用各種決策工具生成商業(yè)計(jì)劃和戰(zhàn)略(Csaszar等人 2024,第2頁)。Manning等人(2024)甚至認(rèn)為L(zhǎng)LMs將自動(dòng)化社會(huì)科學(xué),因?yàn)樗鼈兯坪跄軌蛏杉僭O(shè)和因果模型,包括測(cè)試它們(還可參見Lu等人 2024)。
這些說法被嚴(yán)重夸大了。一種思考方式是,像LLM這樣以預(yù)測(cè)為導(dǎo)向的人工智能本質(zhì)上可以被視為擁有維基百科級(jí)別的知識(shí)。在許多主題上(如果包含在訓(xùn)練數(shù)據(jù)中),LLM能夠以各種不同且新穎的方式總結(jié)、呈現(xiàn)并鏡像它所遇到的詞匯。在任何一個(gè)特定主題上——同樣,如果在訓(xùn)練數(shù)據(jù)中得到充分呈現(xiàn)——LLM可以通過利用它所學(xué)到的條件概率,生成無數(shù)篇連貫、流暢且寫得很好的維基百科文章。然而,正如一個(gè)領(lǐng)域?qū)<也惶赡軓钠鋵I(yè)領(lǐng)域內(nèi)的維基百科文章中學(xué)到關(guān)于其專長(zhǎng)的新知識(shí)一樣,LLM也不太可能通過某種方式從它過去遇到的詞匯關(guān)聯(lián)的組合可能性中提升知識(shí)。它沒有用于這樣做的前瞻性機(jī)制。
還有充分的證據(jù)表明,當(dāng)LLM遇到(被提示)一個(gè)推理任務(wù)時(shí),它僅僅復(fù)制了它在訓(xùn)練數(shù)據(jù)中遇到的關(guān)于推理的語言答案,而不是進(jìn)行任何形式的實(shí)際即時(shí)推理。如果對(duì)推理任務(wù)的措辭——例如沃森選擇任務(wù)或蒙提霍爾問題——只進(jìn)行輕微的改變,LLM的表現(xiàn)就會(huì)顯著低于人類表現(xiàn),而LLM的錯(cuò)誤對(duì)人類來說是顯而易見的(例如,Hong等人2024)。LLM并沒有真正參與任何形式的實(shí)時(shí)推理(正如Lu等人2024、Manning等人2024所假設(shè)的)。相反,它們只是重復(fù)它們?cè)谟?xùn)練數(shù)據(jù)中遇到的與推理相關(guān)的詞匯結(jié)構(gòu)。這種效應(yīng)也可以通過實(shí)驗(yàn)證明,即對(duì)LLM進(jìn)行其過去輸出的訓(xùn)練會(huì)導(dǎo)致其表現(xiàn)迅速下降,甚至崩潰(Shumailov等人2024)。重要的是,LLM記憶并復(fù)述與推理相關(guān)的詞匯,但并不進(jìn)行任何形式的即時(shí)推理。這就是為什么Francois Chollet(2019)創(chuàng)建了“抽象與推理語料庫”,作為一種挑戰(zhàn)或測(cè)試,看看人工智能系統(tǒng)是否能夠真正解決新問題(即它在訓(xùn)練數(shù)據(jù)中沒有遇到的問題),而不僅僅是依賴于過去遇到的、記憶中的答案和解決方案(這反映了當(dāng)前人工智能系統(tǒng),包括LLM的現(xiàn)狀)。
話雖如此,我們的目標(biāo)并不是貶低LLM或其他形式人工智能或機(jī)器學(xué)習(xí)應(yīng)用的驚人成就。LLM在各種測(cè)試和考試中超越大多數(shù)人類的表現(xiàn)是令人驚嘆的(Achiam等人2023)。但這僅僅是因?yàn)樗佑|過這些信息,記住了它們,并能夠以流暢的方式復(fù)述它們。LLM本質(zhì)上擁有超人類的記憶能力,并能夠以多樣化的方式總結(jié)記憶中的詞匯結(jié)構(gòu)。總的來說,將LLM稱為“隨機(jī)鸚鵡”或“高級(jí)自動(dòng)完成功能”(Bender等人2021)確實(shí)低估了它們的能力。然而,同樣地,認(rèn)為L(zhǎng)LM能夠真正推理并產(chǎn)生新知識(shí)則極大地高估了它們的能力。LLM本質(zhì)上是強(qiáng)大的、富有創(chuàng)造力的模仿引擎,能夠隨機(jī)且概率性地組合詞匯,盡管與兒童相比,它們?cè)谡Z言上并不具有創(chuàng)新性(參見Yiu等人2023)。認(rèn)為L(zhǎng)LM能夠以某種方式產(chǎn)生世界上全新的知識(shí)——或者具有類似人類意識(shí)的特征——似乎是一種相當(dāng)牽強(qiáng)的說法(盡管參見Butlin等人2023,Hinton 2023)。總之,這些模型的生成性是一種小寫的“g”生成性,表現(xiàn)為獨(dú)特句子,創(chuàng)造性地總結(jié)和重新包裝現(xiàn)有知識(shí)。
為了說明LLM產(chǎn)生某種新穎事物——例如新知識(shí)——的問題,想象以下思想實(shí)驗(yàn)。想象一個(gè)處于1633年的LLM,其訓(xùn)練數(shù)據(jù)包含了人類到那時(shí)為止出版的所有科學(xué)和其他文本。如果被問及伽利略的日心說觀點(diǎn),LLM會(huì)如何回應(yīng)?由于LLM會(huì)從其龐大的訓(xùn)練數(shù)據(jù)中基于關(guān)聯(lián)和相關(guān)性的詞匯結(jié)構(gòu)中進(jìn)行概率性采樣——再次強(qiáng)調(diào),迄今為止所寫的一切(包括所有關(guān)于宇宙結(jié)構(gòu)的科學(xué)著作)——它只會(huì)重述、呈現(xiàn)并鏡像累積的科學(xué)共識(shí)。LLM的訓(xùn)練數(shù)據(jù)集將壓倒性地包含支持地心說的文本,形式為亞里士多德、托勒密以及許多其他人的著作。托勒密精心的三角學(xué)和幾何計(jì)算,以及他的天文觀測(cè),將被包含在內(nèi),以支持在許多總結(jié)地心說的文本中所代表的地心說(例如de Sacrobosco的流行教科書《De sphaera mundi》)。這些文本將突出顯示如何用地心說來預(yù)測(cè)行星的運(yùn)動(dòng)和軌跡,其準(zhǔn)確性令人驚嘆。從訓(xùn)練數(shù)據(jù)中反復(fù)出現(xiàn)的詞匯關(guān)聯(lián)中推斷出的證據(jù)將壓倒性地反對(duì)伽利略。LLM沒有超出鏡像和重述文本中內(nèi)容之外的任何方式來獲取真相(例如,通過實(shí)驗(yàn)或反事實(shí))。
即使訓(xùn)練數(shù)據(jù)中包含了替代或異端的觀點(diǎn)(例如哥白尼的作品,盡管他的作品大多被禁),這些作品的邏輯也會(huì)被支持主流地心范式的所有文本和材料所淹沒。數(shù)千年的地心文本的龐大語料庫將遠(yuǎn)遠(yuǎn)壓倒伽利略的觀點(diǎn)或任何支持它的觀點(diǎn)。LLM對(duì)真相或知識(shí)的模型完全是統(tǒng)計(jì)性的,依賴于頻率和概率。輸出受到訓(xùn)練數(shù)據(jù)中提到一個(gè)觀點(diǎn)的頻率的影響,這反映在相關(guān)的詞匯結(jié)構(gòu)中。例如,地心說在訓(xùn)練數(shù)據(jù)中被提及、總結(jié)和討論的頻率必然在LLM的輸出中被印刻為真相。由于LLM除了詞匯之間的統(tǒng)計(jì)關(guān)系之外沒有任何實(shí)際的真相基礎(chǔ),它會(huì)說伽利略的觀點(diǎn)和信念是妄想的,與科學(xué)毫無關(guān)聯(lián)。
像LLM這樣的神經(jīng)網(wǎng)絡(luò)實(shí)際上可能包含任何數(shù)量的妄想性信念,包括最終被證明是正確的信念(如伽利略的信念)以及客觀上是(并且仍然是)妄想的信念。事前,LLM無法在兩者之間做出裁決。例如,杰出的天文學(xué)家第谷·布拉赫曾廣泛聲稱并著名地發(fā)表了關(guān)于占星術(shù)的主張,即天體及其運(yùn)動(dòng)直接影響個(gè)人命運(yùn)以及政治和其他事務(wù)。他的占星術(shù)著作不僅在一些科學(xué)家中廣受歡迎,也在受過教育的精英中廣受歡迎。一個(gè)假想的LLM(在1633年)將無法在伽利略關(guān)于日心說的(看似)妄想和布拉赫關(guān)于占星術(shù)的(實(shí)際)妄想之間做出裁決。我們的假想LLM更有可能聲稱布拉赫的占星術(shù)主張是真實(shí)的,而不是伽利略關(guān)于日心說的論點(diǎn)是真實(shí)的。LLM只能代表并鏡像其訓(xùn)練數(shù)據(jù)中詞匯的頻率和統(tǒng)計(jì)關(guān)聯(lián)所反映的主流和現(xiàn)有觀念——在這種情況下,是支持地心宇宙觀。
總之,重要的是要認(rèn)識(shí)到LLM獲取真相和知識(shí)的方式是通過一種統(tǒng)計(jì)練習(xí),即尋找(希望是)真實(shí)主張的更頻繁提及(以詞匯之間的統(tǒng)計(jì)關(guān)聯(lián)形式)和虛假主張的較少提及。LLM的輸出是基于其在訓(xùn)練過程中遇到的詞匯的統(tǒng)計(jì)關(guān)聯(lián)概率性地抽取的。當(dāng)LLM做出真實(shí)主張時(shí),這只是因?yàn)檎鎸?shí)主張碰巧被更頻繁地提及。LLM沒有其他方式來評(píng)估真相或進(jìn)行推理。真相——如果它碰巧出現(xiàn)——是統(tǒng)計(jì)模式和頻率的副產(chǎn)品,而不是LLM發(fā)展出對(duì)現(xiàn)實(shí)中的真假的內(nèi)在理解或推理能力的結(jié)果。
一些LLM試圖通過創(chuàng)建所謂的“專家混合”模型來解決其基于頻率和概率的方法的問題,其中輸出不僅僅是超大型神經(jīng)網(wǎng)絡(luò)的平均結(jié)果,而是可以針對(duì)某些形式的專業(yè)知識(shí)進(jìn)行微調(diào)(Shazeer等人2017,Du等人2022)。另一種方法是檢索增強(qiáng)生成,它利用LLM的一般語言能力,但將用于預(yù)測(cè)的數(shù)據(jù)限制在一個(gè)有限且預(yù)先選定的來源集合中(Lewis等人2020)。此外,還開發(fā)了集成方法——這些方法結(jié)合或聚合多樣化的架構(gòu)或輸出(Friedman和Popescu 2008,Russell和Norvig 2022)。然而,即使在這里,輸出也必然反映了訓(xùn)練數(shù)據(jù)中任何特定專家所說的,而不是LLM的任何前瞻性預(yù)測(cè)或即時(shí)因果推理的形式。
這一問題在具有高度不確定性和新奇性的情境中進(jìn)一步加劇(例如許多形式的決策制定),在這種情況下,鑒于不斷演變和變化的世界,專家知識(shí)甚至有限理性的概念都難以明確界定(Felin等人2014)。
最后,至關(guān)重要的是要記住,任何LLM的輸入都是人類過去的輸入,因此,輸出也大致代表了我們到目前為止所知道的內(nèi)容。本質(zhì)上,LLM無法超越輸入所涵蓋的范圍。它沒有某種機(jī)制去產(chǎn)生關(guān)于未來的前瞻性信念——或者因果邏輯或知識(shí)——這些都無法從訓(xùn)練數(shù)據(jù)中詞匯所包含的現(xiàn)有統(tǒng)計(jì)關(guān)聯(lián)和相關(guān)性中推斷出來。
數(shù)據(jù)至上與數(shù)據(jù)-信念不對(duì)稱性
我們迄今為止所強(qiáng)調(diào)的核心問題是,機(jī)器和人工智能的學(xué)習(xí)本質(zhì)上是回溯性的和模仿性的。再次強(qiáng)調(diào),這不應(yīng)被理解為對(duì)這些模型的批評(píng),而僅僅是對(duì)其結(jié)構(gòu)限制的描述。盡管它們?cè)谠S多方面都很有用,但像LLM這樣的人工智能模型無法產(chǎn)生新知識(shí)或解決新問題。LLM不會(huì)推理。而且,LLM無法超越其訓(xùn)練數(shù)據(jù)中遇到的內(nèi)容進(jìn)行假設(shè)。
接下來,我們將這一問題擴(kuò)展到人工智能和認(rèn)知科學(xué)中對(duì)數(shù)據(jù)至上的更一般性強(qiáng)調(diào)。數(shù)據(jù)本身當(dāng)然不是問題。相反,問題是數(shù)據(jù)被以一種理論無關(guān)的方式使用(Anderson 2008)。為了確保我們沒有通過僅僅關(guān)注LLM來歪曲現(xiàn)有的與人工智能相關(guān)的認(rèn)知模型,我們還將論證擴(kuò)展到其他形式的認(rèn)知人工智能。
將心智和機(jī)器視為輸入-輸出設(shè)備的一般觀點(diǎn),強(qiáng)調(diào)了數(shù)據(jù)的首要性。這暗示了一個(gè)模型,其中數(shù)據(jù)——如線索、刺激、文本、圖像——本質(zhì)上被一個(gè)系統(tǒng)(無論是人類還是計(jì)算系統(tǒng))讀取、學(xué)習(xí)和表示。世界(任何大量的圖像、文本或環(huán)境)具有特定的統(tǒng)計(jì)和物理結(jié)構(gòu),而一個(gè)系統(tǒng)的目標(biāo)是從中準(zhǔn)確學(xué)習(xí)并反映這種結(jié)構(gòu)。這被認(rèn)為是智能的基礎(chǔ)。正如Poldrack(2021,第1307頁,強(qiáng)調(diào)部分為原文所有)所說:“任何要在世界中表現(xiàn)出智能的系統(tǒng),都必須包含反映世界結(jié)構(gòu)的表征”(參見Yin 2020)。基于神經(jīng)網(wǎng)絡(luò)的方法和強(qiáng)調(diào)自下而上表征的機(jī)器學(xué)習(xí)為實(shí)現(xiàn)這一目標(biāo)提供了完美的機(jī)制,因?yàn)樗鼈兛梢浴爸苯訌臄?shù)據(jù)中學(xué)習(xí)”(Lansdell和Kording 2019;還可參見Baker等人2022)。學(xué)習(xí)是數(shù)據(jù)驅(qū)動(dòng)的。當(dāng)然,認(rèn)知系統(tǒng)可能無法完美學(xué)習(xí),但主體或機(jī)器可以通過“反復(fù)與環(huán)境互動(dòng)”來推斷其本質(zhì)和結(jié)構(gòu)(Binz等人2023)。這是“行為的概率模型”的基礎(chǔ),該模型將“人類在復(fù)雜環(huán)境中的行為視為解決一個(gè)統(tǒng)計(jì)推斷問題”(Tervo等人2016)。
貝葉斯認(rèn)知也認(rèn)為,人類和機(jī)器的學(xué)習(xí)可以通過貝葉斯統(tǒng)計(jì)方法所捕捉的對(duì)環(huán)境的概率推理來理解(例如,Griffiths等人2010)。這一框架將感官輸入、感知和經(jīng)驗(yàn)性證據(jù)視為數(shù)據(jù),這些數(shù)據(jù)不斷從環(huán)境中獲取,然后用于更新一個(gè)人對(duì)世界的模型(或特定假設(shè))。認(rèn)知過程涉及從可能狀態(tài)或結(jié)果的概率分布中抽樣,這些抽樣由傳入的數(shù)據(jù)提供信息。至關(guān)重要的是,貝葉斯及相關(guān)認(rèn)知方法強(qiáng)調(diào)通過動(dòng)態(tài)更新信念來整合先驗(yàn)知識(shí)(先驗(yàn))和新證據(jù),以修正信念(后驗(yàn)),這一過程通過貝葉斯公式數(shù)學(xué)化描述(Pinker 2021)。這種迭代更新反映了持續(xù)的學(xué)習(xí)過程,承認(rèn)并量化了不確定性,將理解和決策制定視為本質(zhì)上是概率性的。這種概率架構(gòu)也是人工智能和認(rèn)知科學(xué)中大部分領(lǐng)域的基礎(chǔ)。
值得反思的是這里所假定的認(rèn)識(shí)論立場(chǎng)——或潛在的知識(shí)理論。知識(shí)傳統(tǒng)上被定義為經(jīng)過證明的信念,而信念是通過數(shù)據(jù)和證據(jù)來證明的。正如貝葉斯模型所暗示的,我們相信或知道某件事情的程度取決于我們對(duì)它們的數(shù)據(jù)和證據(jù)的程度(Pinker 2021)。信念應(yīng)該與手頭的證據(jù)成比例,因?yàn)槿绻黧w對(duì)其環(huán)境和世界有一個(gè)準(zhǔn)確的表征或概念,他們會(huì)過得更好(例如,Schw?bel等人2018)。知識(shí)可以被視為構(gòu)成我們信念的累積輸入、數(shù)據(jù)和證據(jù)。任何信念的強(qiáng)度或程度應(yīng)該與支持?jǐn)?shù)據(jù)的量成對(duì)稱,或者換句話說,與證據(jù)的權(quán)重成比例(Pinker 2021;還可參見Griffin和Tversky 1992, Kvam和Pleskac 2016, Dasgupta等人2020)。這是認(rèn)知系統(tǒng)概率模型的基礎(chǔ)。這些方法關(guān)注于“逆向工程化心智”——從輸入到輸出——它們“與計(jì)算機(jī)科學(xué)、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)的最新觀點(diǎn)建立了強(qiáng)有力的聯(lián)系”(Griffiths等人2010,第363頁)。總體而言,這代表了一種相對(duì)廣泛認(rèn)同的認(rèn)識(shí)論立場(chǎng),也符合以輸入-輸出為導(dǎo)向的“心智的計(jì)算理論”(例如,Rescorla 2015),其中人類或機(jī)器通過“反復(fù)與環(huán)境互動(dòng)”進(jìn)行學(xué)習(xí)——無需“任何先驗(yàn)規(guī)定”(Binz等人2023)。總結(jié)上述文獻(xiàn)的一種方式是,一個(gè)人的信念與支持?jǐn)?shù)據(jù)之間需要有一種對(duì)稱性。理性決策者將通過考慮可用數(shù)據(jù)和證據(jù)來形成(并權(quán)衡)關(guān)于任何給定事物的信念。
但如果出現(xiàn)邊緣情況呢?也就是說,在主體正確地吸收了所有數(shù)據(jù)和證據(jù)的情況下,卻以某種方式得出錯(cuò)誤的結(jié)論?基于理性信息處理的模型并沒有提供一個(gè)機(jī)制來解釋變化或新知識(shí),或者解釋數(shù)據(jù)和證據(jù)推理可能導(dǎo)致不良結(jié)果的情況(參見Felin和Koenderink 2022)。此外,盡管基于學(xué)習(xí)的知識(shí)模型能夠根據(jù)新證據(jù)更新信念,但并沒有機(jī)制來解釋新數(shù)據(jù)來自何處,或者哪些數(shù)據(jù)應(yīng)被視為相關(guān),哪些數(shù)據(jù)應(yīng)被忽略。如果數(shù)據(jù)和證據(jù)存在爭(zhēng)議呢?在充滿不確定性的情境中,包括任何類型的前瞻性決策和科學(xué)推理,這是一個(gè)特別重要的問題。
對(duì)于假設(shè)數(shù)據(jù)-信念對(duì)稱性的計(jì)算性、輸入-輸出認(rèn)知模型來說,解釋新奇性和新知識(shí)的產(chǎn)生是高度有問題的。知識(shí)的基礎(chǔ)是對(duì)真理的追求(Pinker 2021),這集中在現(xiàn)有證據(jù)和數(shù)據(jù)上。但我們認(rèn)為,數(shù)據(jù)-信念不對(duì)稱性實(shí)際上對(duì)于新知識(shí)的產(chǎn)生和相關(guān)決策制定是必不可少的。現(xiàn)有的認(rèn)知科學(xué)文獻(xiàn)關(guān)注數(shù)據(jù)-信念不對(duì)稱性的一面,即其負(fù)面:數(shù)據(jù)-信念不對(duì)稱性的消極方面(例如,Kunda 1990, Scheffer等人2022)。這種負(fù)面包括人類盡管有看似明確的相反證據(jù)卻仍然堅(jiān)持相信某事的所有方式(Pinker 2021)。這包括大量關(guān)于人類信息處理偏見的文獻(xiàn)——人類處理、感知和使用數(shù)據(jù)以及未能適當(dāng)?shù)馗缕湫拍畹拇蝺?yōu)和有偏見的方式。這在關(guān)注各種數(shù)據(jù)相關(guān)病理和偏見的廣泛文獻(xiàn)中是顯而易見的,包括動(dòng)機(jī)性推理、確認(rèn)偏誤、選擇性感知和抽樣以及可用性偏誤。對(duì)錯(cuò)誤信念和人類偏見的強(qiáng)調(diào)有力地影響了我們對(duì)人類本性和決策的看法,這些看法在各種社會(huì)和經(jīng)濟(jì)領(lǐng)域中都有所體現(xiàn)(例如,Kahneman 2011, Bénabou和Tirole 2016, Chater 2018, Genakoplos和Shleifer 2018, Kahneman等人2021, Bordalo等人2023)。
但是數(shù)據(jù)-信念不對(duì)稱性的積極一面呢?那些看似與既定證據(jù)和事實(shí)相悖,但卻最終被證明是正確的信念呢?在這里,我們特別指的是那些可能超越、忽視并超越現(xiàn)有證據(jù)的信念。前瞻性、反傳統(tǒng)的觀點(diǎn)對(duì)于新奇性和新知識(shí)的產(chǎn)生至關(guān)重要。由于基于人工智能的計(jì)算和認(rèn)知系統(tǒng)具有統(tǒng)計(jì)性和回溯性(專注于過去數(shù)據(jù)中的相關(guān)性、關(guān)聯(lián)性和平均值),它們無法以反傳統(tǒng)的方式進(jìn)行預(yù)測(cè)或推理,因?yàn)樗鼈冸[含地堅(jiān)持?jǐn)?shù)據(jù)和信念之間的對(duì)稱性。
盡管如此,需要注意的是,正如我們所討論的,我們對(duì)數(shù)據(jù)-信念不對(duì)稱性的關(guān)注并不是某種與數(shù)據(jù)無關(guān)或脫離現(xiàn)實(shí)的。相反,這種數(shù)據(jù)-信念不對(duì)稱性是前瞻性的,因?yàn)樾拍詈鸵蚬评砟軌蜃R(shí)別新的數(shù)據(jù)和實(shí)驗(yàn)干預(yù),并最終驗(yàn)證那些之前被視為扭曲或妄想基礎(chǔ)的信念。
為了提供一個(gè)實(shí)際且生動(dòng)的說明,說明數(shù)據(jù)-信念對(duì)稱性可能存在的問題,可以考慮19世紀(jì)末和20世紀(jì)初關(guān)于重于空氣的有人駕駛和可控飛行的可能性的信念(我們?cè)诒疚闹幸脒@個(gè)例子,并在其余部分中多次提及)。要形成關(guān)于人力飛行可能性的信念——甚至為其分配一個(gè)概率——我們首先會(huì)查看現(xiàn)有的數(shù)據(jù)和證據(jù)。那么,當(dāng)時(shí)關(guān)于人力飛行可能性的證據(jù)是什么?當(dāng)時(shí)最明顯的數(shù)據(jù)點(diǎn)是人力飛行尚未成為現(xiàn)實(shí)。當(dāng)然,這本身并不能否定這種可能性。因此,我們可能希望查看所有與人類飛行嘗試相關(guān)的數(shù)據(jù),以評(píng)估其可能性。在這里,我們會(huì)發(fā)現(xiàn)人類數(shù)百年來一直在嘗試制造飛行機(jī)器,而與飛行相關(guān)的試驗(yàn)實(shí)際上在19世紀(jì)大幅加速。所有這些飛行試驗(yàn)都可以被視為我們應(yīng)該用來更新我們對(duì)飛行不可能性信念的數(shù)據(jù)和證據(jù)。所有證據(jù)都清楚地表明,相信人力飛行是妄想的。妄想可以被定義為與證據(jù)和現(xiàn)實(shí)相悖的信念(Pinker 2021, Scheffer等人 2022):一種與公認(rèn)事實(shí)不一致的信念。事實(shí)上,《精神障礙診斷與統(tǒng)計(jì)手冊(cè)》第四版和第五版——精神障礙的權(quán)威手冊(cè)——將妄想定義為“由于對(duì)外部現(xiàn)實(shí)的錯(cuò)誤推斷而產(chǎn)生的錯(cuò)誤信念”或“在面對(duì)矛盾證據(jù)時(shí)無法改變的固定信念”。
請(qǐng)注意,當(dāng)時(shí)許多人——天真地認(rèn)為——以鳥類作為人類可能飛行的證據(jù)。這是一個(gè)常見的論點(diǎn)。但科學(xué)家們認(rèn)為,鳥類飛行以某種方式為人類飛行的可能性提供了希望和證據(jù),這種觀點(diǎn)是妄想的,并且被著名科學(xué)家約瑟夫·勒孔特(Joseph LeConte 1888,第69頁)駁斥,他斷言飛行“不可能,盡管有鳥類的證據(jù)”。像一個(gè)好科學(xué)家和貝葉斯主義者一樣,勒孔特引用數(shù)據(jù)來支持他的觀點(diǎn)。他研究了鳥類物種——那些會(huì)飛的和不會(huì)飛的——并得出結(jié)論“飛行動(dòng)物的大小和重量存在極限”。根據(jù)勒孔特的說法,重量是飛行的關(guān)鍵決定因素。憑借他的數(shù)據(jù),他明確指出,沒有超過50磅的鳥類能夠飛行,因此得出結(jié)論認(rèn)為人類不能飛行。畢竟,像鴕鳥和鴯鹋這樣的大型鳥類是無法飛行的。他甚至認(rèn)為,即使是最大的飛行鳥類——如火雞和鴇——“起飛困難”且“顯然接近極限”(勒孔特1888,第69-76頁)。飛行與重量是相關(guān)的。對(duì)此,當(dāng)時(shí)的頂尖天文學(xué)家和數(shù)學(xué)家之一西蒙·紐康姆(Simon Newcomb 1901,第435頁)補(bǔ)充說:“最多的飛行者是小昆蟲,而上升的系列以禿鷹結(jié)束,盡管禿鷹的重量遠(yuǎn)小于人類,但據(jù)說它在吃飽后飛行困難。”
勒孔特強(qiáng)調(diào)鳥類的重量以駁斥人力飛行的可能性,這突顯了基于證據(jù)的數(shù)據(jù)和信念更新的一個(gè)問題。很難知道哪些數(shù)據(jù)和證據(jù)可能與某個(gè)信念或假設(shè)相關(guān)。問題是——正如波蘭尼(Polanyi 1958,第31頁)簡(jiǎn)潔地指出的——“自然中沒有標(biāo)記為證據(jù)的事物。”小型鳥類能飛而大型鳥類不能飛的事實(shí)是否與人類能否飛行的問題相關(guān)?在這種情況下,什么是相關(guān)數(shù)據(jù)和證據(jù)?飛行是否與重量或大小有關(guān),還是與其他特征(如翅膀)有關(guān)?它是否與翅膀的拍打(如雅各布·德根所假設(shè)的)有關(guān)?還是與翅膀的形狀、大小或重量有關(guān)?也許羽毛對(duì)飛行至關(guān)重要。簡(jiǎn)而言之,很難知道哪些數(shù)據(jù)可能是相關(guān)且有用的。
當(dāng)然,并非我們所有的信念都能通過我們自己驗(yàn)證的直接實(shí)證數(shù)據(jù)得到充分證明。我們無法——也并不希望——直接驗(yàn)證支撐我們信念和知識(shí)的所有數(shù)據(jù)和觀察。在大多數(shù)情況下,我們正確地依賴他人的專業(yè)知識(shí)、信念或科學(xué)論證作為我們所持信念的證據(jù)(Coady 1992, Goldman 1999)。認(rèn)知科學(xué)也開始強(qiáng)調(diào)這一點(diǎn)。貝葉斯和其他概率認(rèn)知模型引入了在考慮使用哪些數(shù)據(jù)或證據(jù)來更新信念和知識(shí)時(shí),來源可靠性的概念(例如,Hahn等人2018,Merdes等人2021)。這種方法認(rèn)識(shí)到并非所有數(shù)據(jù)和證據(jù)都是平等的。誰說了什么確實(shí)很重要。證據(jù)的來源需要被考慮。例如,科學(xué)專業(yè)知識(shí)和共識(shí)是信念和知識(shí)的關(guān)鍵來源。
這可以通過重于空氣的飛行的例子來清楚地說明。那么,如果我們通過關(guān)注可靠、科學(xué)的來源和共識(shí)來權(quán)衡我們對(duì)人類飛行可能性的信念,會(huì)發(fā)生什么?在大多數(shù)情況下,這是一種理性的策略。然而,在這個(gè)時(shí)期,基于此更新我們對(duì)重于空氣飛行的信念將進(jìn)一步強(qiáng)化人力飛行是妄想且不可能的結(jié)論。同樣,像勒孔特和紐康姆這樣的科學(xué)家通過引用看似確鑿的數(shù)據(jù)和證據(jù)來論證飛行是不可能的。而且,我們不僅應(yīng)該基于這些證據(jù)更新我們的信念,還應(yīng)該根據(jù)這些證據(jù)來自在該領(lǐng)域具有看似相關(guān)知識(shí)的杰出科學(xué)家這一事實(shí),進(jìn)一步權(quán)衡這些證據(jù)。例如,勒孔特最終成為了美國頂尖科學(xué)協(xié)會(huì)(美國科學(xué)促進(jìn)會(huì))的主席。勒孔特并不孤單。他是更廣泛的科學(xué)共識(shí)的一部分,這一共識(shí)堅(jiān)持認(rèn)為人力飛行是不可能的。例如,開爾文勛爵在擔(dān)任英國皇家學(xué)會(huì)會(huì)長(zhǎng)時(shí)斷言“重于空氣的飛行機(jī)器是不可能的”。這具有諷刺意味,因?yàn)殚_爾文在熱力學(xué)和流體動(dòng)力學(xué)、氣體在不同條件下的行為(以及其他物理學(xué)領(lǐng)域)方面的科學(xué)專長(zhǎng),實(shí)際上對(duì)人力飛行具有極其相關(guān)的實(shí)際意義。上述著名的數(shù)學(xué)家-天文學(xué)家西蒙·紐康姆(1901)也在他的文章《飛艇來了嗎?》中論證說,飛行的不可能性是一個(gè)科學(xué)事實(shí),因?yàn)闆]有任何物理材料的組合能夠?qū)崿F(xiàn)人類飛行(關(guān)于歷史細(xì)節(jié),參見Crouch 2002, Anderson 2004)。
那么問題來了,一個(gè)人如何仍然——盡管有看似明確的證據(jù)和科學(xué)共識(shí)——堅(jiān)持一個(gè)看似妄想的信念?在人類飛行的案例中,數(shù)據(jù)、證據(jù)和科學(xué)共識(shí)都堅(jiān)決反對(duì)這種可能性。沒有理性的貝葉斯主義者應(yīng)該相信重于空氣的飛行。同樣,反對(duì)它的證據(jù)不僅僅是實(shí)證的(以勒孔特的鳥類和其他數(shù)據(jù)的形式)并且基于科學(xué)和科學(xué)共識(shí)(以開爾文和紐康姆的與物理學(xué)相關(guān)的論證形式),而且它在觀察上也是顯著的。許多航空先驅(qū)不僅失敗并受傷,有些人甚至死亡。例如,1896年,德國航空先驅(qū)奧托·利林塔爾在嘗試飛行時(shí)死亡,萊特兄弟對(duì)此非常熟悉(因?yàn)樗麄冸S后研究了利林塔爾的筆記本和數(shù)據(jù))。1903年——就在萊特兄弟成功前的九周——科學(xué)家塞繆爾·蘭利在飛行嘗試中慘敗,大量科學(xué)界和普通觀眾目睹了這些失敗。回顧最近的飛行嘗試(包括蘭利的突出失敗),《紐約時(shí)報(bào)》的編輯委員會(huì)(1903)估計(jì),要實(shí)現(xiàn)人力飛行,需要“數(shù)學(xué)家和機(jī)械師的聯(lián)合且持續(xù)努力,從一百萬年到一千萬年不等”。
當(dāng)然,我們選擇了一個(gè)歷史案例,其中一種看似妄想的信念——與現(xiàn)有數(shù)據(jù)、證據(jù)和科學(xué)共識(shí)相悖——最終被證明是正確的。認(rèn)知和社會(huì)心理學(xué)家經(jīng)常進(jìn)行“相反”的練習(xí),他們回顧性地指出,由于有偏見的信息處理、選擇性感知或有偏見的數(shù)據(jù)采樣,人類頑固地堅(jiān)持持有那些與證據(jù)相悖的妄想性信念(Festinger等人1956,Kunda 1990,Kahneman 2011,Pinker 2021;盡管參見Anglin 2019)。陰謀論提供了一個(gè)經(jīng)常被討論的例子,這些信念似乎對(duì)證據(jù)無動(dòng)于衷(Gagliardi 2024,Rao和Greve 2024)。經(jīng)濟(jì)學(xué)家更廣泛地指出,人類可能對(duì)許多形式的證據(jù)“具有抵抗力,個(gè)體表現(xiàn)出非貝葉斯行為,如不想知道、一廂情愿和現(xiàn)實(shí)否認(rèn)”(Bénabou和Tirole 2016,第142頁)。當(dāng)然,有些信念確實(shí)是妄想的。但其他信念——如飛行——可能只是看起來妄想。
我們認(rèn)為,信念的另一面——那些目前可能看起來妄想的信念(與證據(jù)相悖的信念)以及那些看似由動(dòng)機(jī)性推理驅(qū)動(dòng)但最終被證明是正確的信念——也需要被關(guān)注。我們以飛行為例,說明了一個(gè)更普遍的過程,其中數(shù)據(jù)-信念不對(duì)稱性對(duì)于新奇性和新知識(shí)的產(chǎn)生至關(guān)重要。異質(zhì)性信念和數(shù)據(jù)-信念不對(duì)稱性是新思想、新實(shí)驗(yàn)形式和新知識(shí)的生命線,正如我們?cè)诮酉聛淼挠懻撝兴赋龅摹4送猓@最終對(duì)以計(jì)算為導(dǎo)向的人工智能和認(rèn)知形式具有重要意義。
基于理論的因果邏輯與認(rèn)知
在上述數(shù)據(jù)-信念不對(duì)稱性的基礎(chǔ)上,接下來我們討論人類如何進(jìn)行前瞻性理論化和因果推理,這使他們能夠超越數(shù)據(jù)——更具體地說,超越現(xiàn)有數(shù)據(jù)進(jìn)行實(shí)驗(yàn)并產(chǎn)生新的數(shù)據(jù)和新奇性。我們特別強(qiáng)調(diào)這種認(rèn)知和實(shí)踐活動(dòng)的形式與以數(shù)據(jù)驅(qū)動(dòng)和信息處理為導(dǎo)向的認(rèn)知形式——人工智能和計(jì)算性認(rèn)知的標(biāo)志——之間的差異,并使人類能夠以前瞻性的方式干預(yù)世界。以數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法接受并分析世界本來的樣子,而沒有認(rèn)識(shí)到人類干預(yù)的能力(Pearl和Mackenzie 2018),以及實(shí)現(xiàn)那些因缺乏數(shù)據(jù)和證據(jù)而看似不可信的信念的能力。我們將重于空氣的飛行的例子擴(kuò)展,以提供一個(gè)實(shí)踐說明,努力為我們認(rèn)為是一個(gè)更普遍和普遍的過程提供獨(dú)特的視角。
我們的基礎(chǔ)出發(fā)點(diǎn)——基于Felin和Zenger(2017)——是認(rèn)知活動(dòng)是一種理論化或科學(xué)活動(dòng)。也就是說,人類生成前瞻性理論來指導(dǎo)他們的感知、搜索和行動(dòng)。正如Peirce(1957,第71頁)指出的,“人類的心智天生適應(yīng)于想象某些類型的正確理論……如果人類沒有適應(yīng)其需求的心智天賦,他就無法獲得任何知識(shí)。”正如我們?cè)谡Z言例子中提到的,兒童稀少的語言輸入幾乎無法解釋其豐富的輸出,這指向了人類的理論化能力。人類的理論化能力——參與新問題解決和實(shí)驗(yàn)的能力——具有進(jìn)化起源,并為技術(shù)的出現(xiàn)和進(jìn)化飛躍提供了非常合理的解釋(Felin和Kauffman 2023)。
重要的是,基于理論的認(rèn)知使人類能夠采取行動(dòng),進(jìn)行實(shí)驗(yàn)。這也就是兒童發(fā)展中的“核心知識(shí)論點(diǎn)”的基礎(chǔ)(例如,Spelke等人1992,Carey和Spelke 1996)。人類通過假設(shè)、因果推理和實(shí)驗(yàn)的過程像科學(xué)家一樣發(fā)展知識(shí)。與認(rèn)知的計(jì)算方法側(cè)重于數(shù)據(jù)和環(huán)境輸入的首要性不同,基于理論的認(rèn)知觀側(cè)重于人類不僅學(xué)習(xí)周圍環(huán)境,而且在積極生成新知識(shí)方面的積極作用(Felin和Zenger 2017)。如果沒有這種積極的、生成性的、前瞻性的理論化成分,很難想象知識(shí)如何增長(zhǎng),無論我們討論的是實(shí)踐知識(shí)還是科學(xué)知識(shí)。這在發(fā)展心理學(xué)的一篇文章標(biāo)題中得到了很好的體現(xiàn):“如果你想取得進(jìn)步,就去構(gòu)建一個(gè)理論”(Karmiloff-Smith和Inhelder 1974)。這也呼應(yīng)了Lewin(1943,第118頁)的名言:“沒有什么比一個(gè)好的理論更實(shí)用的了。”這里的核心觀點(diǎn)是,理論不僅僅是科學(xué)家的專屬。理論對(duì)于任何試圖理解和影響周圍環(huán)境的人來說都是實(shí)用的;理論幫助我們采取行動(dòng)。理論化是人類認(rèn)知和實(shí)踐活動(dòng)的核心方面。因此,正如杜威(Dewey 1916,第438—442頁)所論證的,“科學(xué)的實(shí)體不僅來自科學(xué)家”,并且“在人類事業(yè)的每一個(gè)分支中,個(gè)體都應(yīng)該是實(shí)驗(yàn)者。”我們?cè)诖嘶A(chǔ)上進(jìn)行擴(kuò)展,將其引入新的和獨(dú)特的領(lǐng)域,并將其與人工智能啟發(fā)的認(rèn)知模型進(jìn)行對(duì)比。
在決策和戰(zhàn)略的背景下,基于理論的觀點(diǎn)擴(kuò)展了上述邏輯,強(qiáng)調(diào)了理論化和理論在經(jīng)濟(jì)情境中的重要性,這對(duì)認(rèn)知有著廣泛的影響(Felin和Zenger 2017)。基于理論的觀點(diǎn)的核心思想是,經(jīng)濟(jì)主體能夠(并且需要)發(fā)展獨(dú)特的企業(yè)特定理論。理論并不是試圖映射現(xiàn)有的現(xiàn)實(shí),而是生成未被看見的未來可能性,重要的是,理論提出了因果干預(yù)措施(需要采取的實(shí)驗(yàn)和行動(dòng)),以實(shí)現(xiàn)這些可能性。理論也可以被視為一種機(jī)制,用于破解競(jìng)爭(zhēng)性要素市場(chǎng)(參見Barney 1986),使經(jīng)濟(jì)主體能夠以不同的方式看待和探索世界。對(duì)新可能性的意識(shí)是通過認(rèn)知自上而下發(fā)展的(Felin和Koenderink 2022)。理論還對(duì)如何高效組織或治理實(shí)現(xiàn)新事物的過程有著核心意義(Wuebker等人 2023)。這種方法已經(jīng)通過實(shí)證測(cè)試并得到驗(yàn)證(例如,Camuffo等人 2020,Novelli和Spina 2022,Agarwal等人 2023),包括重要的理論擴(kuò)展(例如,Ehrig和Schmidt 2022,Zellweger和Zenger 2023)。基于理論的觀點(diǎn)的實(shí)踐意義也促成了管理工具的開發(fā),以幫助初創(chuàng)企業(yè)、經(jīng)濟(jì)主體和組織創(chuàng)造經(jīng)濟(jì)價(jià)值(Felin等人 2021a)。
本文這一部分的目標(biāo)并不是全面回顧基于理論的觀點(diǎn)。相反,我們的目標(biāo)是進(jìn)一步構(gòu)建基于理論的觀點(diǎn)的認(rèn)知和實(shí)踐方面,特別強(qiáng)調(diào)因果推理以及它與以數(shù)據(jù)為中心、回溯性的AI和認(rèn)知方法的對(duì)比。我們強(qiáng)調(diào)人類的理論化和因果推理能力與AI對(duì)數(shù)據(jù)驅(qū)動(dòng)預(yù)測(cè)的強(qiáng)調(diào)之間的差異。基于理論的認(rèn)知觀使人類能夠在給定數(shù)據(jù)之外干預(yù)世界——不僅僅是處理、表征或從現(xiàn)有數(shù)據(jù)中推斷。理論通過實(shí)驗(yàn)識(shí)別或生成非顯而易見的數(shù)據(jù)和新知識(shí)。這與計(jì)算、貝葉斯和AI啟發(fā)的認(rèn)知方法所提出的論點(diǎn)和建議有著顯著的不同。重要的是要仔細(xì)建立這些差異,因?yàn)榛贏I和計(jì)算的方法——正如本文開頭廣泛討論的那樣——被認(rèn)為優(yōu)于人類的判斷和認(rèn)知(例如,Kahneman 2018)。
認(rèn)知:重訪數(shù)據(jù)與信念的不對(duì)稱性
異質(zhì)性信念為基于理論的因果推理和認(rèn)知提供了初始動(dòng)力。從我們的角度來看,為了使信念成為理解認(rèn)知和決策的相關(guān)概念,信念并不一定——至少在最初——需要基于數(shù)據(jù)。我們特別關(guān)注前瞻性信念,即目前缺乏證據(jù)甚至與現(xiàn)有數(shù)據(jù)相悖,但最終可能被證明是正確的信念。因此,前瞻性信念更像是在尋找數(shù)據(jù),而不是基于現(xiàn)有數(shù)據(jù)。在知識(shí)的前沿,數(shù)據(jù)是信念的產(chǎn)物——與因果推理和實(shí)驗(yàn)(我們?cè)谙乱还?jié)討論)相結(jié)合——而不是新知識(shí)是現(xiàn)有數(shù)據(jù)的直接產(chǎn)物。
問題是,很難事先區(qū)分哪些信念確實(shí)是妄想,哪些只是超前于時(shí)代。在數(shù)據(jù)滯后于信念(或數(shù)據(jù)可能目前不存在)的情況下,即在尚未識(shí)別、發(fā)現(xiàn)或?qū)嶒?yàn)生成支持性數(shù)據(jù)的情況下,數(shù)據(jù)與信念的不對(duì)稱性至關(guān)重要。在許多情況下,信念并不會(huì)自動(dòng)得到驗(yàn)證。相反,它們通常需要某種形式的針對(duì)性干預(yù)、行動(dòng)和實(shí)驗(yàn)。尋找支持一種不尋常、反向或不一致信念的數(shù)據(jù),必然看起來像是非理性的動(dòng)機(jī)性推理或確認(rèn)偏誤(Kunda, 1990;參見 Hahn 和 Harris, 2014)。為了簡(jiǎn)要說明,伽利略對(duì)日心說的信念與既定的科學(xué)數(shù)據(jù)和共識(shí)甚至常識(shí)相悖。地心宇宙觀在觀測(cè)上得到了很好的證實(shí),它們是成功的:它們能夠精確預(yù)測(cè)行星和恒星的運(yùn)動(dòng)。即使是日常觀察也證實(shí)了地球是靜止的,而太陽似乎圍繞地球轉(zhuǎn)動(dòng)。伽利略的反對(duì)者基本上認(rèn)為,伽利略試圖通過反對(duì)天主教會(huì)的偏見性動(dòng)機(jī)推理,將人類和不可移動(dòng)的地球從上帝創(chuàng)造的中心移開。
在討論因果推理對(duì)于實(shí)現(xiàn)反向或妄想性信念的重要性之前,值得強(qiáng)調(diào)信念作為行動(dòng)動(dòng)機(jī)的作用。也就是說,一個(gè)人信念的強(qiáng)度或程度可以通過他因該信念而采取行動(dòng)的可能性來衡量(Ramsey, 1931;另見 Felin 等人, 2021a)。相比之下,基于概率或貝葉斯認(rèn)知模型的信念強(qiáng)度(參見 Pinker, 2021)直接與現(xiàn)有數(shù)據(jù)和可用證據(jù)的權(quán)重相關(guān),而不是與采取行動(dòng)的可能性——這是一個(gè)顯著的差異。
注意在我們之前提到的例子中,人類飛行的情境下,信念的含義。盡管有壓倒性的數(shù)據(jù)和證據(jù)反對(duì)這一信念,信念在激勵(lì)航空先驅(qū)采取行動(dòng)方面發(fā)揮了核心作用。從某種意義上說,那些追求飛行的人并沒有適當(dāng)?shù)馗滤麄兊男拍睢4蠖鄶?shù)證據(jù)都對(duì)萊特兄弟不利,但他們?nèi)匀幌嘈棚w行的可能性。萊特兄弟之一的威爾伯在 1899 年寫信給科學(xué)家和航空先驅(qū)塞繆爾·蘭利,并承認(rèn):“多年來,我一直受飛行可能實(shí)現(xiàn)的信念困擾。我的病情愈發(fā)嚴(yán)重,我感覺它很快就會(huì)讓我花費(fèi)更多金錢,甚至可能危及我的生命”(萊特和萊特, 1881–1940,強(qiáng)調(diào)為原文所加)。威爾伯顯然認(rèn)識(shí)到,他對(duì)飛行的信念在他人看來似乎是妄想的,這從他的信件中可以看出。但這種信念激勵(lì)他進(jìn)行因果推理和實(shí)驗(yàn),使他和他的兄弟將看似妄想的信念變?yōu)楝F(xiàn)實(shí)(僅僅四年之后)。將萊特兄弟的信念與當(dāng)時(shí)最偉大的科學(xué)頭腦之一開爾文勛爵的信念對(duì)比一下。當(dāng)被邀請(qǐng)加入十年前新成立的航空學(xué)會(huì)時(shí),開爾文拒絕了,并說:“我對(duì)空中航行連一丁點(diǎn)信念都沒有。”開爾文可能是在表達(dá)他的一位科學(xué)同時(shí)代人的觀點(diǎn):數(shù)學(xué)家威廉·克利福德(2010, p. 79),他認(rèn)為“在任何地方、任何時(shí)候、對(duì)任何人都不應(yīng)該在沒有足夠證據(jù)的情況下相信任何事情。”由于沒有對(duì)人類飛行可能性的絲毫信念,開爾文自然不想支持任何暗示人類飛行可能實(shí)現(xiàn)的事情。但對(duì)于萊特兄弟來說,動(dòng)力飛行的可能性是一個(gè)“活生生的假設(shè)”(詹姆斯, 1967)。盡管有數(shù)據(jù),他們?nèi)匀幌嘈湃祟愶w行可能是可能的,并采取了具體步驟來實(shí)現(xiàn)他們的信念。
數(shù)據(jù)與信念之間的不對(duì)稱性對(duì)理性這一概念本身提出了問題(參見 Chater 等人, 2018;Felin 和 Koenderink, 2022)。畢竟,作為一個(gè)理性的人,我們的知識(shí)應(yīng)該基于證據(jù)。我們的信念和知識(shí)應(yīng)該與手頭的證據(jù)成比例。嚴(yán)格來說,信念這一概念甚至不需要存在,因?yàn)槿藗兛梢灾苯诱務(wù)撝R(shí),即由證據(jù)證明的信念。這種觀點(diǎn)簡(jiǎn)潔地體現(xiàn)在 Pinker(2021, p. 244)的話中,他認(rèn)為“我不相信任何你必須相信的東西。”這似乎是一個(gè)合理的立場(chǎng)。這也是貝葉斯方法的基礎(chǔ),即新數(shù)據(jù)(不知何故)出現(xiàn),我們可以據(jù)此更新我們的信念和知識(shí),為我們提供“根據(jù)新證據(jù)更新信念的最優(yōu)方式”(Pilgrim 等人, 2024)。這確實(shí)是關(guān)注計(jì)算和概率信念更新的認(rèn)知方法的隱含立場(chǎng)(例如,Dasgupta 等人, 2020)。
然而,數(shù)據(jù)與信念的不對(duì)稱性——現(xiàn)有數(shù)據(jù)目前不支持信念甚至與之相悖——可以非常有用,甚至是必不可少的。它們是技術(shù)和科學(xué)進(jìn)步的原材料。它們是不確定性決策的核心要素。數(shù)據(jù)與信念的不對(duì)稱性引導(dǎo)我們的注意力尋找新數(shù)據(jù)和可能的實(shí)驗(yàn),以生成支持信念的證據(jù)。當(dāng)然,尋求數(shù)據(jù)來驗(yàn)證特定信念的想法正是妄想和一系列相關(guān)偏見的定義,包括確認(rèn)偏誤、動(dòng)機(jī)性推理、選擇性證據(jù)收集、否認(rèn)主義、自我欺騙和信念堅(jiān)持。對(duì)于局外人來說,這看起來像是“尋找支持信念的證據(jù)并對(duì)他可能證偽它的證據(jù)漠不關(guān)心的壞習(xí)慣”的完美例子(Pinker, 2021, p. 13;另見 Hahn 和 Harris, 2014)。人類動(dòng)力飛行的信念很好地說明了這一點(diǎn),因?yàn)橛凶銐虻淖C據(jù)可以證偽萊特兄弟對(duì)重于空氣飛行可能性的信念。持有不對(duì)稱信念似乎等同于“一廂情愿”或“在面對(duì)新證據(jù)時(shí)保護(hù)自己的信念”(Kruglanski 等人, 2020, p. 413;盡管參見 Anglin, 2019)。萊特兄弟不斷面臨證偽其信念的證據(jù),包括塞繆爾·蘭利在飛行上的公開失敗,或者李林塔爾飛行嘗試失敗(以及因此喪生)的知識(shí)。但在這些情況下,忽視顯著的數(shù)據(jù)和證據(jù)——不根據(jù)看似有力的證據(jù)甚至科學(xué)共識(shí)更新信念——最終被證明是正確的行動(dòng)方向。
有時(shí)候,看似非理性——忽視證據(jù)、對(duì)其解釋存在分歧,或者有選擇性地尋找正確的數(shù)據(jù)——最終被證明是正確的行動(dòng)方向。人類動(dòng)力飛行當(dāng)然是一個(gè)特別生動(dòng)的例子,盡管更平凡的人類行為也從根本上被類似的過程所刻畫(Felin 和 Koenderink, 2022)。對(duì)于目前的目的來說,最重要的是,我們的論點(diǎn)是信念本身具有因果作用,并可以通過我們采取行動(dòng)的傾向來衡量(Ramsey, 1931;Felin 等人, 2021a)。當(dāng)然,擁有信念或愿意采取行動(dòng)并不保證它們是真實(shí)的。但它們是行動(dòng)的重要?jiǎng)訖C(jī)(Bratman, 1987;Ajzen, 1991)。
再次強(qiáng)調(diào),我們對(duì)信念的強(qiáng)調(diào)不應(yīng)被視為試圖貶低數(shù)據(jù)的重要性。相反,正如我們?cè)诮酉聛硪獜?qiáng)調(diào)的,信念可以激勵(lì)基于理論的因果推理,引導(dǎo)人類注意力朝著能夠產(chǎn)生新數(shù)據(jù)、證據(jù)和實(shí)現(xiàn)新知識(shí)的行動(dòng)和實(shí)驗(yàn)方向發(fā)展。
從信念到因果推理與實(shí)驗(yàn)
信念的實(shí)現(xiàn)并非自動(dòng)的。信念的一個(gè)核心特征是它們傾向于引發(fā)因果推理和某種形式的定向?qū)嶒?yàn)。信念使行動(dòng)者能夠闡述如何干預(yù)周圍環(huán)境并生成所需證據(jù)的路徑(Felin 等人,2021b)。我們對(duì)認(rèn)知和行動(dòng)的看法更廣泛地受到理論化可以引導(dǎo)人類開發(fā)出一種底層因果邏輯的觀點(diǎn)的啟發(fā),這種邏輯使我們能夠干預(yù)世界(Pearl 和 Mackenzie, 2018;另見 Ehrig 等人, 2024)。這種對(duì)干預(yù)的傾向意味著我們并不簡(jiǎn)單地接受世界本來的樣子;相反,我們反事實(shí)地思考可能性和未來狀態(tài),并著眼于采取具體行動(dòng)、進(jìn)行實(shí)驗(yàn)和生成正確的證據(jù)。這將焦點(diǎn)從以過去為導(dǎo)向的信息處理和預(yù)測(cè)(其中數(shù)據(jù)是既定的)轉(zhuǎn)移到行動(dòng)和實(shí)驗(yàn)(其中正確的數(shù)據(jù)和證據(jù)被識(shí)別或生成)。這涉及積極質(zhì)疑和操縱因果結(jié)構(gòu),從而能夠更深入地探索假設(shè)性情境。反事實(shí)思維賦予人類探索假設(shè)性替代方案和剖析因果機(jī)制的能力,為結(jié)果的必要和充分條件提供見解(Felin 等人,2024)。這種方法與以輸入-輸出和信息處理為導(dǎo)向的人工智能和計(jì)算認(rèn)知模型以及各種以數(shù)據(jù)驅(qū)動(dòng)或貝葉斯方法為基礎(chǔ)的決策制定方法有顯著不同。基于人工智能的認(rèn)知模型主要關(guān)注基于過去關(guān)聯(lián)和相關(guān)性的模式;預(yù)測(cè)基于過去的數(shù)據(jù)。但這些方法缺乏理解底層因果結(jié)構(gòu)、假設(shè)性可能性以及可能干預(yù)的能力(參見 Felin 等人, 2021a;Ehrig 等人, 2024)。這是基于理論的因果邏輯的作用。
關(guān)注合理的干預(yù)和實(shí)驗(yàn)可以通過擴(kuò)展我們關(guān)于人類動(dòng)力飛行的例子來說明。這個(gè)例子也很好地說明了數(shù)據(jù)導(dǎo)向和基于證據(jù)的科學(xué)家對(duì)人類動(dòng)力飛行可能性的看法與像萊特兄弟這樣更具干預(yù)導(dǎo)向和基于因果邏輯的實(shí)踐者之間的區(qū)別。為了理解飛行,萊特兄弟深入研究了為什么之前的飛行嘗試未能成功,更重要的是,他們發(fā)展了一種關(guān)于飛行的因果理論。盡管失敗的飛行嘗試以及李林達(dá)爾(和其他人)的死亡被許多人用作數(shù)據(jù)來聲稱飛行是不可能的,但萊特兄弟研究了這些嘗試失敗的具體原因。諷刺的是,盡管鳥類數(shù)據(jù)的不同方面為支持和反對(duì)飛行的人提供了看似證據(jù),但科學(xué)家們利用鳥類數(shù)據(jù)來論證人類飛行是不可能的(因?yàn)橹亓繂栴})(例如 LeConte, 1888;Newcomb, 1901),而萊特兄弟則關(guān)注鳥類飛行的不同方面。萊特兄弟進(jìn)行了關(guān)于鳥類飛行和解剖學(xué)的觀察研究(為什么鳥類能夠飛行),例如仔細(xì)研究鳥類在轉(zhuǎn)彎和傾斜時(shí)的翅膀位置。
關(guān)鍵區(qū)別在于,萊特兄弟憑借他們對(duì)飛行可能性的信念,正在構(gòu)建一種關(guān)于飛行的因果理論,而不是尋找確認(rèn)或反駁飛行是否可能的數(shù)據(jù)。萊特兄弟忽視了反對(duì)者的數(shù)據(jù)和科學(xué)論點(diǎn)。從史密森學(xué)會(huì)那里,萊特兄弟請(qǐng)求并獲得了關(guān)于眾多歷史飛行嘗試的詳細(xì)信息,包括奧托·李林達(dá)爾的記錄。萊特兄弟的筆記和信件揭示了他們仔細(xì)研究了早期先驅(qū)如喬治·凱利、阿爾豐斯·佩諾和奧克塔夫·尚多的飛行嘗試和飛機(jī)(萊特和萊特,1841–1940;安德森,2004;麥卡洛,2015)。他們研究了過去飛行嘗試的各個(gè)方面:使用的飛機(jī)類型、機(jī)翼形狀和大小的細(xì)節(jié)、天氣條件以及底層的空氣動(dòng)力學(xué)假設(shè)。
萊特兄弟再次試圖發(fā)展他們自己的關(guān)于飛行的因果理論。他們的理論不僅僅是由他們反傳統(tǒng)的飛行可能的信念所驅(qū)動(dòng)(這種信念似乎沒有任何證據(jù)支持)。隨著他們仔細(xì)研究飛行的底層機(jī)制并調(diào)查飛行的因果邏輯,他們對(duì)飛行可能性的信心逐漸增強(qiáng)。最重要的是,他們的因果推理使他們能夠闡述實(shí)現(xiàn)人類動(dòng)力飛行所需解決的具體問題。萊特兄弟認(rèn)為,要實(shí)現(xiàn)飛行,必須解決三個(gè)與飛行相關(guān)的問題,即(a)升力,(b)推進(jìn)力,和(c)操控。為了說明開發(fā)基于理論的因果邏輯和識(shí)別具體問題以解決的力量,結(jié)合定向?qū)嶒?yàn),我們簡(jiǎn)要討論他們是如何解決其中一個(gè)問題的:升力問題。
在升力方面,萊特兄弟明白,要實(shí)現(xiàn)飛行,他們需要一種能夠提供足夠升力以克服飛機(jī)重量的機(jī)翼設(shè)計(jì)。事實(shí)上,著名科學(xué)家認(rèn)為人類飛行的限制因素是重量(再次引用昆蟲飛行和那些能飛與不能飛的鳥類的重量)。萊特兄弟認(rèn)為,對(duì)重量的擔(dān)憂并非不可克服。在對(duì)鳥類飛行(以及其他人的飛行嘗試)的研究基礎(chǔ)上,他們通過一系列實(shí)驗(yàn)來解決這個(gè)問題,包括構(gòu)建和測(cè)試各種翼型。他們的實(shí)驗(yàn)高度針對(duì)性且以數(shù)據(jù)為導(dǎo)向,測(cè)試了各種機(jī)翼的形狀、大小和角度。他們還很快意識(shí)到,并非一切都需要按比例測(cè)試,他們的升力實(shí)驗(yàn)可以在實(shí)驗(yàn)室條件下更安全、更經(jīng)濟(jì)地進(jìn)行。因此,他們建造了自己的風(fēng)洞。在這些風(fēng)洞中的針對(duì)性測(cè)試使萊特兄弟能夠?qū)W習(xí)升力的核心原理。他們測(cè)量了一切,并仔細(xì)記錄了他們的數(shù)據(jù)——這些數(shù)據(jù)是通過持續(xù)的實(shí)驗(yàn)操作和變化生成的。這種動(dòng)手實(shí)驗(yàn)使他們能夠收集關(guān)于不同形狀和迎風(fēng)角對(duì)升力的影響的數(shù)據(jù)。通過系統(tǒng)地變化這些參數(shù)并觀察結(jié)果,他們有效地運(yùn)用因果推理來識(shí)別升力最大化的條件。他們發(fā)現(xiàn)并完善了用于滾轉(zhuǎn)控制的機(jī)翼扭曲技術(shù),這是直接源于對(duì)機(jī)翼形狀、空氣壓力和升力之間因果關(guān)系的理解的結(jié)果。
同樣的因果推理和定向?qū)嶒?yàn)的過程對(duì)于解決另外兩個(gè)問題——推進(jìn)力和操控或控制——也是至關(guān)重要的。更廣泛地說,萊特兄弟在實(shí)現(xiàn)人類動(dòng)力飛行信念的各個(gè)方面都表現(xiàn)出了嚴(yán)謹(jǐn)?shù)目茖W(xué)態(tài)度。例如,為了確定一個(gè)適合進(jìn)行飛行嘗試的地點(diǎn),他們聯(lián)系了美國氣象局。他們已經(jīng)明確了測(cè)試飛行所需的最優(yōu)條件:他們需要四樣?xùn)|西——穩(wěn)定的風(fēng)(方向和強(qiáng)度)、開闊的空間、柔軟或沙質(zhì)的著陸面以及隱私。他們從美國氣象局收到了多個(gè)建議,并選擇了北卡羅來納州的基蒂霍克作為實(shí)地試驗(yàn)的地點(diǎn)。
萊特兄弟對(duì)飛行的探索提供了一個(gè)有用的案例研究,展示了基于理論的因果邏輯如何在信念似乎沒有得到現(xiàn)有數(shù)據(jù)、證據(jù)或科學(xué)支持的情況下實(shí)現(xiàn)信念。基于他們的理論化、研究和因果推理,萊特兄弟通過定向?qū)嶒?yàn)解決了升力、推進(jìn)力和操控等核心問題。他們的方法展示了如何在缺乏數(shù)據(jù)(甚至數(shù)據(jù)與信念相悖)的情況下,運(yùn)用因果邏輯理解和干預(yù)世界。他們?cè)陲w行方面的成功證明了如何通過系統(tǒng)化、干預(yù)導(dǎo)向的方法揭示復(fù)雜現(xiàn)象背后的因果機(jī)制,并克服現(xiàn)有數(shù)據(jù)的不足。
正如我們的論點(diǎn)所暗示的,我們認(rèn)為科學(xué)、經(jīng)濟(jì)和技術(shù)領(lǐng)域充滿了機(jī)會(huì),那些擁有不對(duì)稱信念的人可以利用基于理論的因果推理,進(jìn)行定向?qū)嶒?yàn)和問題解決(Felin 和 Zenger, 2017)。正如我們所論證的,現(xiàn)有的認(rèn)知理論過于關(guān)注數(shù)據(jù)與信念的對(duì)稱性,而不是數(shù)據(jù)與信念的不對(duì)稱性,以及后者如何能夠促進(jìn)因果推理,從而推動(dòng)異質(zhì)性的出現(xiàn)以及新奇和價(jià)值的創(chuàng)造。盡管目前對(duì)利用人工智能(AI)自動(dòng)化生成新知識(shí)和新奇性充滿熱情(例如 Csaszar 等人, 2024;Lu 等人, 2024;Manning 等人, 2024),甚至有人呼吁用 AI 替代有偏見的人類決策(例如 Kahneman, 2018),但我們認(rèn)為,至少在目前,人類的因果推理無法被 AI 系統(tǒng)或計(jì)算方法所模仿。接下來,我們將進(jìn)一步探討這一論點(diǎn)對(duì)不確定條件下的決策和戰(zhàn)略的啟示。
討論:預(yù)測(cè)在不確定性決策中的局限性
正如我們?cè)诒疚闹袕V泛討論的,人工智能(AI)和認(rèn)知科學(xué)使用了許多相同的隱喻、工具、方法以及對(duì)智力、理性和心智的推理方式。在認(rèn)知科學(xué)中,一個(gè)普遍的假設(shè)是人類心智是一種計(jì)算輸入-輸出系統(tǒng)(Christian 和 Griffiths, 2016)。計(jì)算和算法系統(tǒng)強(qiáng)調(diào)基于過去數(shù)據(jù)的預(yù)測(cè)能力。預(yù)測(cè)的核心地位得到了 AI 先驅(qū) LeCun(2017)的呼應(yīng),他認(rèn)為“預(yù)測(cè)是智能的本質(zhì)”。
顯然,AI 的預(yù)測(cè)能力是強(qiáng)大的。但在不確定性決策中(即在不可預(yù)測(cè)的情境中),預(yù)測(cè)是否也處于核心地位呢?許多人認(rèn)為情況就是這樣(例如 Davenport 和 Kirby, 2016;Kahneman, 2018)。例如,在他們的著作《預(yù)測(cè)機(jī)器:人工智能的簡(jiǎn)單經(jīng)濟(jì)學(xué)》中,Agrawal 等人(2022, 第 22–32 頁)強(qiáng)調(diào),簡(jiǎn)化到本質(zhì),“AI 是一種預(yù)測(cè)技術(shù)”。他們書中一個(gè)核心觀點(diǎn)是,“預(yù)測(cè)是不確定性決策的核心”(Agrawal 等人, 2022, 第 7 頁,強(qiáng)調(diào)為原文所加)。總結(jié)我們?cè)诒疚闹械恼擖c(diǎn),我們不同意對(duì)預(yù)測(cè)的重視程度——尤其是 AI 中所體現(xiàn)的預(yù)測(cè)形式(即基于過去數(shù)據(jù)的預(yù)測(cè))——特別是在不確定性情境中。由于對(duì)預(yù)測(cè)的重視是普遍存在的,因此值得仔細(xì)探討我們?yōu)楹尾煌鈱?duì)預(yù)測(cè)的重視。
Agrawal 等人(2022)的論點(diǎn)為我們提供了一個(gè)有用的方式,讓我們能夠清晰地表達(dá)我們對(duì)預(yù)測(cè)所受重視的更一般性擔(dān)憂。他們的論點(diǎn)可以總結(jié)為一種相對(duì)常見的因果鏈(某種意義上的),從數(shù)據(jù)到信息,再到預(yù)測(cè)和決策,簡(jiǎn)而言之,即數(shù)據(jù) → 信息 → 預(yù)測(cè) → 決策。他們特別指出,“數(shù)據(jù)提供了能夠?qū)崿F(xiàn)預(yù)測(cè)的信息”,而預(yù)測(cè)反過來則是“我們決策的一個(gè)關(guān)鍵輸入”。這種從數(shù)據(jù)到信息、再到預(yù)測(cè)和決策的因果鏈當(dāng)然具有直觀的吸引力,并且反映了 AI 系統(tǒng)所擅長(zhǎng)的:接收大量輸入和數(shù)據(jù),處理這些信息,然后做出可以用于決策的預(yù)測(cè)。簡(jiǎn)而言之,正如 Agrawal 等人(2022)和許多其他人所強(qiáng)調(diào)的,數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)不僅是語言模型的核心,也是更廣泛的 AI 的核心,并且在認(rèn)知中占據(jù)中心舞臺(tái)。
但正如我們?cè)诒疚闹卸啻螐?qiáng)調(diào)的,問題是現(xiàn)有的數(shù)據(jù)——目前可用或既定的數(shù)據(jù)——在做出前瞻性決策時(shí)不太可能是最佳的信息和預(yù)測(cè)來源。數(shù)據(jù)是對(duì)過去的快照或鏡像。即使是大量的數(shù)據(jù)也不太可能讓人能夠預(yù)見到未來(Felin 等人, 2014)。我們需要的是一種機(jī)制,用于投射未來,并識(shí)別相關(guān)的數(shù)據(jù)和證據(jù),或者更有可能的是,通過實(shí)驗(yàn)生成新的數(shù)據(jù)。這就是理論和某種形式的因果推理的作用,而這些是基于數(shù)據(jù)優(yōu)先和預(yù)測(cè)導(dǎo)向的 AI 和認(rèn)知方法中所缺失的關(guān)鍵要素。我們承認(rèn),在各種常規(guī)和重復(fù)性決策中,預(yù)測(cè)無疑是一個(gè)有用的工具。基于數(shù)據(jù)的預(yù)測(cè)在可預(yù)測(cè)的情境中可以非常強(qiáng)大:這些情境與過去匹配或從過去外推而來。這正是 AI 和基于預(yù)測(cè)的認(rèn)知所擅長(zhǎng)的,即最小化意外和減少誤差。更廣泛地說,這也與許多判斷和決策學(xué)者對(duì)一致性的強(qiáng)烈強(qiáng)調(diào)以及避免噪聲的急切愿望相符合(參見 Kahneman 等人, 2021)。
但許多重要決策并不是關(guān)于通過使用現(xiàn)有數(shù)據(jù)最小化誤差來減少不確定性。決策的很大一部分目的更多是關(guān)于(在某種意義上)最大化意外和誤差,或者對(duì)其他人來說可能看起來像是誤差。在戰(zhàn)略情境中,最具影響力的機(jī)會(huì)和價(jià)值來源并不是基于立即可用的數(shù)據(jù)。相反,像這樣的重要決策需要開發(fā)一種理論,基于某種異質(zhì)性信念,描繪出一條因果路徑或邏輯,用于測(cè)試?yán)碚摗⑦M(jìn)行實(shí)驗(yàn)并收集新證據(jù)以實(shí)現(xiàn)信念。在一個(gè)重要的意義上,戰(zhàn)略決策更多地與不可預(yù)測(cè)性和最大化意外有關(guān),而不是與預(yù)測(cè)和最小化意外有關(guān)。有些決策具有高度影響力、低頻率、罕見性,并充滿不確定性(Camuffo 等人, 2022),因此,它們根本無法通過使用現(xiàn)有數(shù)據(jù)的算法處理。這就是為什么基于理論的因果推理不是關(guān)于適當(dāng)?shù)乇硎经h(huán)境結(jié)構(gòu),也不是關(guān)于有限理性或傾聽客戶;而是關(guān)于開發(fā)一種前瞻性理論和因果邏輯,用于實(shí)驗(yàn)和創(chuàng)造價(jià)值(Felin 等人, 2024)。
請(qǐng)注意,我們對(duì)不可預(yù)測(cè)性和意外的強(qiáng)調(diào)并不意味著我們超出了科學(xué)或數(shù)據(jù)的范疇。恰恰相反。做出前瞻性決策的過程是關(guān)于開發(fā)一種基于理論的底層因果邏輯,用于干預(yù)世界:本質(zhì)上,描繪出一條因果路徑,說明如何從 A 點(diǎn)(當(dāng)前世界的狀態(tài))到達(dá) B 點(diǎn)(假設(shè)的未來世界狀態(tài))。理論為正確的干預(yù)、實(shí)驗(yàn)和新數(shù)據(jù)創(chuàng)造了顯著性,從而實(shí)現(xiàn)了最初看似不可信的信念。理論在生成對(duì)可觀察事物的顯著性方面發(fā)揮著核心作用;數(shù)據(jù)(或觀察)的概念本身是依賴于理論的。正如愛因斯坦所說:“你是否能夠觀察到某件事物取決于你所使用的理論。正是理論決定了什么是可以被觀察的”(Polanyi, 1974, 第 604 頁)。對(duì)正確的(或新的)數(shù)據(jù)或?qū)嶒?yàn)形式的顯著性是由理論賦予的,而不是由過去的數(shù)據(jù)賦予的。在這個(gè)意義上,理論可以說具有預(yù)測(cè)功能,盡管這里的預(yù)測(cè)并不是 AI(Agrawal 等人, 2022)和認(rèn)知科學(xué)(參見 Clark, 2018)中定義和操作化的那種數(shù)據(jù)驅(qū)動(dòng)或最小化誤差的過程。現(xiàn)在,如果手頭的任務(wù)是常規(guī)和平凡的——例如,“預(yù)測(cè)這句話中的下一個(gè)詞”或“告訴我你接下來期望看到什么”——那么基于現(xiàn)有數(shù)據(jù)的預(yù)測(cè)可能是有用的。但基于理論的觀點(diǎn)更多地關(guān)注認(rèn)知的前瞻性方面,以及人類主體如何通過開發(fā)一個(gè)多步驟的因果路徑來實(shí)現(xiàn)信念,通過實(shí)驗(yàn)和問題解決實(shí)現(xiàn)信念。這正是我們關(guān)于萊特兄弟的飛行理論——以及因果推理和實(shí)驗(yàn)——所展示的。它是一個(gè)微觀縮影,展示了人類如何更廣泛地干預(yù)他們的環(huán)境并實(shí)現(xiàn)新的信念。經(jīng)濟(jì)領(lǐng)域充滿了經(jīng)濟(jì)主體如何參與這一過程的例子(Felin 和 Zenger, 2017)。
我們對(duì)意外和不可預(yù)測(cè)性的強(qiáng)調(diào)——而不是可預(yù)測(cè)性和最小化誤差——在競(jìng)爭(zhēng)環(huán)境中尤其重要。如果每個(gè)人都能接觸到相同的預(yù)測(cè)機(jī)器和與 AI 相關(guān)的信息處理工具,那么結(jié)果很可能是同質(zhì)化的。戰(zhàn)略如果要真正創(chuàng)造新價(jià)值,就需要是獨(dú)特且企業(yè)特定的。而這種企業(yè)特定性與獨(dú)特信念和開發(fā)基于理論的價(jià)值創(chuàng)造邏輯有關(guān),這種邏輯對(duì)其他人來說是不可預(yù)見的(不可預(yù)測(cè)的)。理論使經(jīng)濟(jì)主體能夠破解競(jìng)爭(zhēng)性要素市場(chǎng)(Barney, 1986),以開發(fā)關(guān)于資產(chǎn)和活動(dòng)價(jià)值的獨(dú)特預(yù)期。理論還使企業(yè)能夠以更有針對(duì)性的方式進(jìn)行搜索(Felin 等人, 2023),而不是從事成本高昂且耗盡精力的全球搜索形式。盡管有嘗試對(duì)預(yù)測(cè)引擎進(jìn)行微調(diào),但它們本質(zhì)上是基于過去的頻率、相關(guān)性和平均值,而不是極端情況。而在許多情況下,正是極端情況最終更有趣,因?yàn)樗鼈兲峁┝撕髞砦覀円暈槔硭?dāng)然的(最終)信念和數(shù)據(jù)的種子。
總的來說,我們不同意在決策和認(rèn)知中對(duì)預(yù)測(cè)、算法處理和計(jì)算的重視(例如 Christian 和 Griffiths, 2016;Agrawal 等人, 2022)。人類決策不應(yīng)被交給人工智能(參見 Kahneman, 2018)。人工智能及其啟發(fā)的認(rèn)知模型基于回顧性數(shù)據(jù)和預(yù)測(cè),而不是任何前瞻性、基于理論的因果邏輯。強(qiáng)調(diào)或依賴數(shù)據(jù)和預(yù)測(cè),不僅是決策和認(rèn)知的嚴(yán)重局限,也是理解知識(shí)生成甚至科學(xué)進(jìn)步的嚴(yán)重局限。因此,我們強(qiáng)調(diào)異質(zhì)性信念在人類認(rèn)知中的重要性,以及開發(fā)基于理論的因果邏輯的重要性,這種邏輯能夠推動(dòng)實(shí)驗(yàn)和新數(shù)據(jù)以及新奇性的產(chǎn)生。
未來研究機(jī)會(huì)
上述論點(diǎn)揭示了許多研究機(jī)會(huì),尤其是在理解人工智能(AI)、新奇性產(chǎn)生以及不確定性決策方面。首先,研究人類(例如經(jīng)濟(jì)主體)何時(shí)以及如何利用與 AI 相關(guān)的工具來創(chuàng)造新價(jià)值或輔助決策是一個(gè)機(jī)會(huì)。如果 AI 作為一種認(rèn)知工具要成為競(jìng)爭(zhēng)優(yōu)勢(shì)的來源,它必須以獨(dú)特或企業(yè)特定的方式被利用。使用普遍可用的訓(xùn)練數(shù)據(jù)的 AI 必然會(huì)產(chǎn)生通用且非特定的輸出。存在一種風(fēng)險(xiǎn),即現(xiàn)成的 AI 解決方案容易受到信息技術(shù)“生產(chǎn)力悖論”的影響(Brynjolfsson 和 Hitt, 1998),在這種情況下,對(duì) AI 的投資實(shí)際上并沒有為購買這些工具的人帶來任何收益(而只是為出售這些技術(shù)的人帶來收益)。因此,研究特定決策者(例如企業(yè))自身的價(jià)值理論如何推動(dòng) AI 開發(fā)和采用的過程是一個(gè)機(jī)會(huì)。為了讓 AI 真正成為戰(zhàn)略和決策的有用工具,AI 需要被定制化、針對(duì)性訓(xùn)練和微調(diào)——它需要變得具體化——以適應(yīng)決策者的理論、獨(dú)特的因果推理、數(shù)據(jù)集和專有文件。例如,檢索增強(qiáng)生成的進(jìn)步似乎為在戰(zhàn)略決策中使用 AI 提供了一種增強(qiáng)特定性的有前景的途徑。在尋求獨(dú)特的 AI 驅(qū)動(dòng)輸出時(shí),任何 AI 的采用都應(yīng)該謹(jǐn)慎選擇哪些語料庫和訓(xùn)練數(shù)據(jù)被利用(以及哪些不被利用)。畢竟,AI 的輸出——被定制化為使用特定數(shù)據(jù)——也是人類主體的產(chǎn)物,他們決定哪些數(shù)據(jù)與手頭的決策相關(guān)(哪些不相關(guān))。正是在這里,我們看到了一個(gè)機(jī)會(huì),去理解人類如何獨(dú)特地與 AI 互動(dòng),以生成這些工具以及相關(guān)的人類-AI 接口。早期的研究已經(jīng)開始探討企業(yè)如何利用 AI 來增加創(chuàng)新,或者各種人類-AI 混合解決方案如何實(shí)現(xiàn)更好的決策(例如 Gregory 等人, 2021;Clough 和 Wu, 2022;Choudhary 等人, 2023;Girotra 等人, 2023;Kemp, 2023;Babina 等人, 2024;Bell 等人, 2024;Jia 等人, 2024;Kim 等人, 2024;Raisch 和 Fomina, 2024;Tranchero 等人, 2024)。然而,研究特定經(jīng)濟(jì)主體或企業(yè)自身的理論和因果邏輯——以及他們獨(dú)特或企業(yè)特定的數(shù)據(jù)和信息來源——如何塑造 AI 相關(guān)工具的開發(fā)或采用以執(zhí)行戰(zhàn)略和做出決策,仍有很大的機(jī)會(huì)。
其次,研究和開發(fā)人類與 AI 在不同類型任務(wù)、問題和決策中的各自能力的分類法,存在持續(xù)的機(jī)會(huì)。關(guān)于 AI 取代人類的前景,存在許多興奮、炒作和恐懼(參見 Grace 等人, 2024)。然而,在現(xiàn)實(shí)中,人類和 AI 之間可能會(huì)有一種分工,雙方各自專注于最適合它們的任務(wù)、問題和決策類型。研究經(jīng)濟(jì)主體和組織如何根據(jù)情境將人類(及其認(rèn)知能力、工作和角色)與算法(或 AI 相關(guān)工具)匹配到正確的任務(wù)和決策中,是一個(gè)機(jī)會(huì)。目前,顯然 AI 非常適合重復(fù)性、計(jì)算密集型的任務(wù)和決策,這些任務(wù)和決策直接從過去的數(shù)據(jù)中推導(dǎo)而來。人類做出的許多決策相對(duì)常規(guī),適合算法處理。因此,AI 毫無疑問將在管理的許多領(lǐng)域發(fā)揮關(guān)鍵作用,特別是在重復(fù)性流程的領(lǐng)域,例如運(yùn)營(Holmstr?m 等人, 2019;Amaya 和 Holweg, 2024;關(guān)于金融的研究,參見 Eisfeldt 和 Schubert, 2024)。然而,有些決策是低頻率且罕見的(Camuffo 等人, 2022),因此不適合 AI。在這里,我們預(yù)計(jì)人類將繼續(xù)發(fā)揮核心作用,因?yàn)槿祟惸軌蜻M(jìn)行前瞻性理論化和超越現(xiàn)有數(shù)據(jù)的因果邏輯開發(fā)。當(dāng)然,常規(guī)與非常規(guī)決策之間存在一個(gè)滑動(dòng)尺度(以及接口)。即使在罕見且影響重大的決策制定中,AI 也可能發(fā)揮作用,或許可以作為一種額外的聲音或在生成或考慮各種策略時(shí)的陪練伙伴。正如我們?cè)诒疚闹杏懻摰模珹I 和人類各自有其優(yōu)勢(shì)和局限性。現(xiàn)有研究?jī)A向于在相同的基準(zhǔn)上比較 AI 和人類,而不是認(rèn)識(shí)到各自的長(zhǎng)處。研究 AI 和人類的比較能力——它們各自的長(zhǎng)處、局限性和持續(xù)演變——為未來的研究提供了重要的機(jī)會(huì)。
第三,我們的論點(diǎn)指向了關(guān)于人類本質(zhì)——尤其是人類認(rèn)知的所謂計(jì)算性質(zhì)——的更基礎(chǔ)性問題。盡管關(guān)于認(rèn)知本質(zhì)的問題可能聽起來過于抽象和哲學(xué)化,但它們至關(guān)重要,因?yàn)樗鼈儗?duì)我們所做的假設(shè)和所采用的方法有下游影響。在這里,我們呼應(yīng)西蒙(Simon, 1985b, 第 303 頁,強(qiáng)調(diào)為原文所加)的觀點(diǎn),他認(rèn)為“沒有什么比我們對(duì)人類本質(zhì)的看法更重要,它決定了我們的研究議程和指導(dǎo)我們的研究方法,因?yàn)槲覀冄芯康氖侨祟惖男袨椤!蹦敲矗珹I 和認(rèn)知科學(xué)(進(jìn)而擴(kuò)展到經(jīng)濟(jì)學(xué)和戰(zhàn)略領(lǐng)域)中關(guān)于人類認(rèn)知的主導(dǎo)觀點(diǎn)是什么?人類的主導(dǎo)觀點(diǎn)是,他們是一種從事信息處理的輸入-輸出設(shè)備,類似于計(jì)算機(jī)。在本文中,我們指出了關(guān)于人類心智、大腦和認(rèn)知的計(jì)算機(jī)隱喻的長(zhǎng)期存在的問題。計(jì)算機(jī)已經(jīng)成為人類認(rèn)知的核心、組織性隱喻,從艾倫·圖靈和赫伯特·西蒙的工作到現(xiàn)代人工神經(jīng)網(wǎng)絡(luò)、預(yù)測(cè)處理和貝葉斯大腦的實(shí)例,這種隱喻已經(jīng)存在了超過七十年(例如 Knill 和 Pouget, 2004;Cosmides 和 Tooby, 2013;Kotseruba 和 Tsotsos, 2020;Russell 和 Norvig, 2022;Sun, 2023;Gigerenzer 和 Goldstein, 2024)。然而,對(duì)認(rèn)知的通用計(jì)算方法并沒有考慮到被研究生物體的比較性質(zhì),因?yàn)槿祟悺⑸矬w和機(jī)器都被視為相同的——不變的(參見 Simon, 1990;參見 Simon, 1980;Gershman 等人, 2015)。但認(rèn)知存在顯著差異,這些差異值得仔細(xì)關(guān)注。例如,計(jì)算機(jī)并不能有意義地決定哪些輸入可能是相關(guān)的,哪些可能不是,也不能有意義地識(shí)別一個(gè)新的輸入,而人類可以控制他們首先選擇或生成哪些輸入(Yin, 2020;Brembs, 2021;Felin 和 Koenderink, 2022)。正如我們所討論的,人類認(rèn)知是一種前瞻性理論化和因果推理的形式。請(qǐng)注意,我們并不是在這里試圖為某種人類例外主義辯護(hù),因?yàn)檫@些能力以不同的方式廣泛存在于更廣泛的生物有機(jī)體中(Riedl, 1984;參見 Popper, 1991)。研究使生物有機(jī)體和經(jīng)濟(jì)主體能夠進(jìn)行理論化、推理和實(shí)驗(yàn)的內(nèi)生和比較因素,并比較各種形式的生物智能與人工和非生物形式的智能,存在重要的研究機(jī)會(huì)(參見 Levin, 2024)。將所有認(rèn)知和智能視為通用計(jì)算,不必要地縮小了理論和實(shí)證工作的范圍,并從根本上錯(cuò)過了智能在不同系統(tǒng)中表現(xiàn)出來的豐富和異質(zhì)性方式。此外,生物和非生物智能形式之間的接口——正如人類在進(jìn)化中使用技術(shù)和工具所表現(xiàn)出來的(Felin 和 Kauffman, 2023)——為未來的研究提供了令人興奮的機(jī)會(huì)。
結(jié)論
在本文中,我們關(guān)注人工智能(AI)與人類之間的認(rèn)知差異。盡管受 AI 啟發(fā)的認(rèn)知模型繼續(xù)強(qiáng)調(diào)機(jī)器與人類之間的相似性,我們認(rèn)為 AI 對(duì)預(yù)測(cè)(基于過去數(shù)據(jù))的強(qiáng)調(diào)無法捕捉人類認(rèn)知的本質(zhì);也就是說,它既無法解釋新奇性或新知識(shí)的產(chǎn)生,也無法在不確定性決策中提供幫助。總體而言,我們承認(rèn) AI 與人類認(rèn)知之間存在一定的相似性。但我們特別強(qiáng)調(diào)人類認(rèn)知的前瞻性本質(zhì),以及基于理論的因果推理如何使人類能夠干預(yù)世界、進(jìn)行定向?qū)嶒?yàn)并發(fā)展新知識(shí)。異質(zhì)性信念和理論——數(shù)據(jù)與信念的不對(duì)稱性——使得人類能夠識(shí)別或生成新數(shù)據(jù)(例如通過實(shí)驗(yàn)),而不僅僅是依賴于基于過去數(shù)據(jù)的預(yù)測(cè)。基于 AI 的計(jì)算模型必然建立在數(shù)據(jù)與信念的對(duì)稱性之上。因此,AI 無法像大型語言模型(LLMs)所展示的那樣因果性地映射、投射或預(yù)見未來。當(dāng)然,我們的論點(diǎn)絕非否定或質(zhì)疑 AI 領(lǐng)域內(nèi)許多令人興奮的發(fā)展。我們預(yù)計(jì) AI 將幫助人類在許多領(lǐng)域做出更好的決策,尤其是在以常規(guī)和重復(fù)為特征的環(huán)境中。然而,不確定性決策——鑒于其對(duì)不可預(yù)測(cè)性、意外和新奇性的強(qiáng)調(diào)——提供了一個(gè)領(lǐng)域,這一領(lǐng)域并不容易適應(yīng)基于數(shù)據(jù)或頻率的預(yù)測(cè)以及相關(guān)的計(jì)算。因此,我們從根本上質(zhì)疑 AI 將(或應(yīng)該)取代人類決策的觀點(diǎn)(例如,Kahneman, 2018)。我們認(rèn)為,與計(jì)算機(jī)和 AI 相比,人類具有獨(dú)特的認(rèn)知能力,這些能力集中在前瞻性信念和理論化上:即從事新奇因果推理和實(shí)驗(yàn)的能力。
原文鏈接: https://pubsonline.informs.org/doi/full/10.1287/stsc.2024.0189
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.