99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

人工智能、人類認(rèn)知與因果推理

0
分享至

https://pubsonline.informs.org/doi/full/10.1287/stsc.2024.0189

Theory Is All You Need: AI, Human Cognition, and Causal Reasoning

理論即一切:人工智能、人類認(rèn)知與因果推理


摘要:

學(xué)者們認(rèn)為,人工智能(AI)能夠創(chuàng)造出真正的創(chuàng)新成果和新知識(shí),并且反過來,人工智能和認(rèn)知的計(jì)算模型將取代人類在不確定性條件下的決策。我們對(duì)此持不同觀點(diǎn)。我們認(rèn)為,人工智能基于數(shù)據(jù)的預(yù)測(cè)與人類基于理論的因果邏輯和推理不同。我們以大型語言模型為例,指出將計(jì)算機(jī)和人腦視為輸入-輸出設(shè)備的類比存在已久,但問題重重。人類認(rèn)知更適于被視為一種基于理論的因果推理形式,而非人工智能所強(qiáng)調(diào)的信息處理和基于數(shù)據(jù)的預(yù)測(cè)。人工智能采用基于概率的方法獲取知識(shí),主要具有向后看和模仿性,而人類認(rèn)知?jiǎng)t具有前瞻性,能夠創(chuàng)造出真正的創(chuàng)新成果。我們引入數(shù)據(jù)-信念不對(duì)稱性的概念,以重于空氣的飛行為例來闡述我們的觀點(diǎn),說明人工智能和人類認(rèn)知之間的差異。基于理論的因果推理為人類提供了一種認(rèn)知機(jī)制,使其能夠干預(yù)世界,并通過定向?qū)嶒?yàn)生成新數(shù)據(jù)。在文章中,我們討論了我們的觀點(diǎn)對(duì)于理解創(chuàng)新成果、新知識(shí)和不確定性決策的含義。

關(guān)鍵詞:認(rèn)知 ? 人工智能 ? 預(yù)測(cè) ? 因果推理 ? 決策制定 ? 戰(zhàn)略 ? 基于理論的視角

引言

人工智能(AI)如今在許多涉及高級(jí)思維和戰(zhàn)略推理的游戲中、標(biāo)準(zhǔn)化測(cè)試中以及認(rèn)知任務(wù)中,已經(jīng)能夠與人類相匹敵甚至超越人類。例如,AI引擎能夠在國際象棋中輕松擊敗人類,而國際象棋數(shù)十年來一直是衡量AI能力的關(guān)鍵基準(zhǔn)(Simon 1985a, Bory 2019)。AI系統(tǒng)還在涉及復(fù)雜談判、與他人復(fù)雜互動(dòng)、聯(lián)盟、欺騙以及理解其他玩家意圖的復(fù)雜棋盤游戲中表現(xiàn)出色(例如,Ananthaswamy 2022)。當(dāng)前的AI模型還在各種職業(yè)資格考試中的表現(xiàn)超過了90%以上的人類,例如法律領(lǐng)域的律師資格考試和會(huì)計(jì)領(lǐng)域的注冊(cè)會(huì)計(jì)師考試(Achiam et al. 2023)。AI在醫(yī)學(xué)診斷方面也取得了突破性進(jìn)展,在某些疾病的診斷上超越了經(jīng)過高度訓(xùn)練的醫(yī)學(xué)專業(yè)人士(例如,Zhou et al. 2023)。這些快速進(jìn)步促使一些AI學(xué)者認(rèn)為,即使是人類最具特色的特質(zhì),如意識(shí),也將很快被機(jī)器復(fù)制(例如,Goyal and Bengio 2022, Butlin et al. 2023)。總的來說,AI正在迅速開發(fā)出能夠“像人類一樣思考”“理性思考”“像人類一樣行動(dòng)”和“理性行動(dòng)”的算法(Csaszar and Steinberger 2022,第2—3頁)。

鑒于AI令人驚嘆的進(jìn)展,丹尼爾·卡尼曼(Daniel Kahneman 2018,第609—610頁,強(qiáng)調(diào)部分為原文所有)提出了(并回答了)下一個(gè)合乎邏輯的問題:“是否還會(huì)有一些事情是專屬于人類的?坦率地說,我沒有看到任何理由去限制AI能夠做什么……因此,很難想象在擁有足夠數(shù)據(jù)的情況下,還會(huì)有一些事情是只有人類才能做到的……只要可能,就應(yīng)該用算法取代人類。”

卡尼曼并非唯一持這種觀點(diǎn)的人。達(dá)文波特和柯比(Davenport and Kirby 2016,第29頁)認(rèn)為,“我們已經(jīng)知道,分析和算法在從數(shù)據(jù)中提煉洞察方面比大多數(shù)人更好”,而且“這種人類/機(jī)器表現(xiàn)差距只會(huì)進(jìn)一步擴(kuò)大”。許多學(xué)者聲稱,AI很可能在大多數(shù)——如果不是全部——推理和決策形式中超越人類(例如,Legg and Hutter 2007, Morris et al. 2023, Grace et al. 2024)。有人認(rèn)為,戰(zhàn)略決策也可能被AI接管(Csaszar et al. 2024),甚至科學(xué)本身也將被“AI科學(xué)家”自動(dòng)化(例如,Lu et al. 2024, Manning et al. 2024)。AI的先驅(qū)之一杰弗里·辛頓(Geoffrey Hinton)認(rèn)為,大型語言模型(LLMs)已經(jīng)具有感知能力和智能,“數(shù)字智能”不可避免地將超越人類的“生物智能”——如果它還沒有做到的話(參見Hinton 2023;還可參見Bengio et al. 2023)。

與機(jī)器相比,人類的認(rèn)知和計(jì)算局限性顯而易見。人類是有偏見的(Kahneman 2011, Chater et al. 2018)。人類在關(guān)注和采樣數(shù)據(jù)時(shí)是有選擇性的,并且容易受到確認(rèn)偏誤、動(dòng)機(jī)性推理以及數(shù)百種其他認(rèn)知偏誤的影響(截至最近統(tǒng)計(jì),已接近200種)。簡(jiǎn)而言之,人類是有限理性的——其計(jì)算和處理信息的能力受到顯著限制(Simon 1955),尤其是與計(jì)算機(jī)相比(參見Simon 1990)。而那些使人類表現(xiàn)出有限理性和決策能力差的特質(zhì),似乎正是使計(jì)算機(jī)在認(rèn)知任務(wù)上表現(xiàn)出色的原因。計(jì)算機(jī)和AI的優(yōu)勢(shì)在于它們能夠處理海量數(shù)據(jù),并以快速且強(qiáng)大的方式對(duì)其進(jìn)行處理。

在本文中,我們提出了與人類認(rèn)知相關(guān)的AI的對(duì)立觀點(diǎn),包括其對(duì)戰(zhàn)略、新奇性的產(chǎn)生以及不確定性下的決策的影響。AI基于一種觀念,即無論是機(jī)器還是人類的認(rèn)知,都是一種廣義的信息處理形式:一種輸入-輸出設(shè)備。為了說明人類與計(jì)算機(jī)之間的認(rèn)知差異,我們以大型語言模型與人類語言學(xué)習(xí)的對(duì)比為例。我們引入了數(shù)據(jù)-信念(不)對(duì)稱性的概念,并分別探討其在解釋AI和人類認(rèn)知中的作用,以重于空氣的飛行為例進(jìn)行詳細(xì)說明。人類認(rèn)知是前瞻性的,需要數(shù)據(jù)-信念不對(duì)稱性,這些不對(duì)稱性體現(xiàn)在理論、因果推理和實(shí)驗(yàn)中。我們認(rèn)為,人類認(rèn)知是由前瞻性、基于理論的因果邏輯驅(qū)動(dòng)的,這與AI和認(rèn)知計(jì)算模型所強(qiáng)調(diào)的預(yù)測(cè)和回溯性數(shù)據(jù)截然不同。基于理論的因果推理能夠產(chǎn)生新的、與眾不同的數(shù)據(jù)、觀察和實(shí)驗(yàn)。我們強(qiáng)調(diào)這些觀點(diǎn)對(duì)于理解新奇性、新知識(shí)的起源以及不確定性下的決策的影響。

AI 與心智:認(rèn)知是計(jì)算嗎?

從20世紀(jì)40年代到今天,模擬人類心智——包括思考、理性和認(rèn)知——一直是人工智能(AI)的核心追求。正如1956年達(dá)特茅斯會(huì)議上所提出的,AI的目標(biāo)是“基于這樣的猜想:學(xué)習(xí)或智能的任何方面原則上都可以被精確描述,從而讓機(jī)器能夠模擬它”。這種將心智視為計(jì)算的觀點(diǎn)不僅歷史悠久,而且在過去幾十年中不斷加深。例如,認(rèn)知科學(xué)家Johnson-Laird甚至認(rèn)為“任何關(guān)于心智的科學(xué)理論都必須將其視為自動(dòng)機(jī)”。

AI將認(rèn)知視為一種廣義的信息處理形式,其中“人類思考完全是一種信息處理活動(dòng)”。這種觀點(diǎn)認(rèn)為,心智和機(jī)器都是廣義的輸入-輸出設(shè)備,輸入如刺激和線索(數(shù)據(jù))被處理以產(chǎn)生各種輸出,包括決策、能力、行為和行動(dòng)。這種信息處理模型被廣泛應(yīng)用于AI與認(rèn)知的交叉領(lǐng)域,包括感知、學(xué)習(xí)、記憶、專長(zhǎng)、搜索和決策制定。此外,將人類心智活動(dòng)視為計(jì)算的觀點(diǎn)也廣泛存在于進(jìn)化論的論證中。

然而,我們對(duì)這種將AI與人類認(rèn)知視為計(jì)算的觀點(diǎn)持不同看法。盡管AI和人類認(rèn)知之間存在一些相似性,但AI基于預(yù)測(cè)(依賴過去數(shù)據(jù))的模型無法捕捉人類認(rèn)知的本質(zhì),也無法解釋新奇性、新知識(shí)的產(chǎn)生或不確定性下的決策。

在這些研究中,我們更全面地指出,從20世紀(jì)50年代至今,學(xué)者們一直試圖在人工智能(AI)、機(jī)器和人類認(rèn)知之間建立一種等價(jià)關(guān)系。在所有這些工作中,認(rèn)知、計(jì)算(以及人工智能)被視為緊密相連的:這些工作的基本前提是,機(jī)器和人類是一種輸入-輸出設(shè)備,其中信息處理和學(xué)習(xí)的相同底層機(jī)制在起作用。對(duì)計(jì)算和信息處理的關(guān)注也是有限理性概念的公理基礎(chǔ)(參見Felin等人2017年的綜述)。有限理性關(guān)注人類的“計(jì)算能力”及其局限性(Simon 1955, 第99頁),這一觀點(diǎn)深刻地塑造了經(jīng)濟(jì)學(xué)、決策理論、戰(zhàn)略和認(rèn)知科學(xué)等領(lǐng)域(例如,Chater等人2018年,Kahneman 2003年,Puranam等人2015年,Gigerenzer和Goldstein 2024年)。

我們不同意AI和人類認(rèn)知在計(jì)算形式上具有顯著相似性的觀點(diǎn),原因?qū)⒃谙挛闹杏懻摗T掚m如此,我們提出這一觀點(diǎn)的目的并不是削弱AI領(lǐng)域令人興奮的突破。相反,我們強(qiáng)調(diào),當(dāng)涉及到理解心智和認(rèn)知時(shí),AI與人類之間的類比很快就會(huì)失效,這對(duì)我們?nèi)绾慰创缕嫘缘漠a(chǎn)生、新知識(shí)以及不確定性下的決策有著重要的衍生性后果。在接下來的部分中,我們將深入探討一個(gè)具體例子,即機(jī)器與人類的語言學(xué)習(xí),以更細(xì)致地闡述這一點(diǎn)。

機(jī)器與人類學(xué)習(xí):不同的輸入,不同的輸出

盡管心智和機(jī)器的輸入-輸出模型——無論我們討論的是符號(hào)化方法還是亞符號(hào)化方法(更多細(xì)節(jié)見附錄)——一直是人工智能和認(rèn)知科學(xué)的核心重點(diǎn),接下來我們將強(qiáng)調(diào)機(jī)器學(xué)習(xí)和人類學(xué)習(xí)之間的一些重要差異。以語言為背景來突出這些差異是一個(gè)恰當(dāng)?shù)恼Z境。語言可以說是“人類認(rèn)知的最典型特征(語言及其與思維的關(guān)系)”,因此它“可以成為真正的‘洞察心智的窗口’”(Chomsky和Gallega 2020,第321頁;還可參見Pinker 1994)。語言為理解人類和人工智能提供了一個(gè)重要的測(cè)試和背景。此外,已經(jīng)有人認(rèn)為大型語言模型具有感知能力,甚至有人認(rèn)為它們已經(jīng)接近或超越了人類的認(rèn)知能力(例如,Binz和Schulz 2023, Hinton 2023)——這是一個(gè)我們所質(zhì)疑的假設(shè)。

在最基本的層面上,要研究任何系統(tǒng)及其行為,我們需要理解它的輸入和輸出。圖靈(Turing 1948/1992)認(rèn)為,無論是人類還是機(jī)器的任何智能形式,都可以被研究為一個(gè)輸入-輸出系統(tǒng)。在討論人工智能的可能性——或者用他的話說,“智能機(jī)器”——時(shí),圖靈(1950,第456頁,強(qiáng)調(diào)部分為原文所有)將嬰兒大腦比作“未經(jīng)訓(xùn)練的嬰兒大腦”,稱嬰兒大腦幾乎是一張白紙,“就像一個(gè)筆記本”,有“很少的機(jī)制和許多空白頁”(參見Turing 1948/1992)。根據(jù)圖靈的說法,這些空白頁需要通過訓(xùn)練和教育的過程用輸入來填充。在嬰兒或兒童生命的早期,他們通過語言和聽到的單詞獲得輸入,這些輸入最終構(gòu)成了人類的語言能力和輸出。同樣地,圖靈(1948/1992,第107頁)認(rèn)為,可以想象一個(gè)“應(yīng)用于機(jī)器的類似教學(xué)過程”,機(jī)器通過輸入進(jìn)行學(xué)習(xí)。圖靈列舉了智能機(jī)器可能展示其學(xué)習(xí)成果的各種場(chǎng)景,包括國際象棋或撲克等游戲、密碼學(xué)或數(shù)學(xué),并且他認(rèn)為,“學(xué)習(xí)語言將是最令人印象深刻的,因?yàn)檫@是這些活動(dòng)中最具人類特征的活動(dòng)”(Turing 1948/1992,第117頁)。由于人類學(xué)習(xí)和機(jī)器學(xué)習(xí)通常被視為類似的過程,接下來我們將以語言學(xué)習(xí)為例,聚焦于其中的關(guān)鍵差異,并進(jìn)一步探討這些學(xué)習(xí)差異對(duì)于科學(xué)和經(jīng)濟(jì)背景下的決策和知識(shí)生成的影響。

機(jī)器如何學(xué)習(xí)語言。為了說明機(jī)器學(xué)習(xí)的過程,接下來我們仔細(xì)探討現(xiàn)代大型語言模型(LLMs)及其學(xué)習(xí)方式。LLMs是機(jī)器學(xué)習(xí)的一個(gè)有用實(shí)例。學(xué)習(xí)本質(zhì)上是從零開始——自下而上,直接從數(shù)據(jù)中生成——通過引入海量訓(xùn)練數(shù)據(jù)以及對(duì)這些數(shù)據(jù)中的統(tǒng)計(jì)關(guān)聯(lián)和相互作用進(jìn)行算法處理。在LLMs的背景下,訓(xùn)練數(shù)據(jù)由從各種公共來源和互聯(lián)網(wǎng)收集的海量詞匯和文本組成。為了體會(huì)這些模型整合了多少數(shù)據(jù)和訓(xùn)練,截至2024年初的最新LLMs估計(jì)包含約13萬億個(gè)標(biāo)記(一個(gè)標(biāo)記大致相當(dāng)于一個(gè)詞)。為了形象說明,如果一個(gè)人試圖以每小時(shí)9000詞(每分鐘150詞)的速度閱讀這些文本,那么閱讀一個(gè)包含13萬億詞的訓(xùn)練數(shù)據(jù)集將需要超過16.4萬年。

用于訓(xùn)練LLM的龐大文本語料庫被標(biāo)記化以便進(jìn)行自然語言處理。這通常涉及將單詞(或子詞單元或字符)轉(zhuǎn)換為數(shù)值序列或向量。例如,句子“貓坐在墊子上”可能會(huì)被標(biāo)記化為一個(gè)序列,如[10, 123, 56, 21, 90, 78]。每個(gè)標(biāo)記通過一個(gè)嵌入層,該層將標(biāo)記轉(zhuǎn)換為密集向量表示,捕捉其語義信息,例如其頻率和位置嵌入。嵌入層有自己的參數(shù)集(權(quán)重),這些參數(shù)在訓(xùn)練過程中被學(xué)習(xí)。我們之前提到的Transformer架構(gòu)(Vaswani et al. 2017)引入的注意力機(jī)制允許模型在所有其他周圍標(biāo)記的上下文中考慮每個(gè)標(biāo)記,從而獲得更廣泛的上下文理解。深度人工神經(jīng)網(wǎng)絡(luò)被證明極為通用,不僅適用于文本,還適用于圖像識(shí)別和計(jì)算機(jī)視覺等多樣化領(lǐng)域,包括結(jié)合不同類型數(shù)據(jù)的多模態(tài)應(yīng)用(例如,通過文本提示生成圖像)。

從作為訓(xùn)練輸入的海量數(shù)據(jù)中,LLM學(xué)習(xí)語言的各種統(tǒng)計(jì)和分布元素之間的關(guān)聯(lián)和相關(guān)性:特定單詞之間的相對(duì)關(guān)系、它們的關(guān)系、順序、頻率等。這些統(tǒng)計(jì)關(guān)聯(lián)基于訓(xùn)練數(shù)據(jù)集中發(fā)現(xiàn)的單詞使用模式、上下文、句法和語義。模型發(fā)展出對(duì)單詞和短語在不同上下文中傾向于共現(xiàn)的理解。模型不僅學(xué)習(xí)關(guān)聯(lián),還理解不同語言元素之間的相關(guān)性。換句話說,它識(shí)別出某些單詞更有可能出現(xiàn)在特定上下文中。

現(xiàn)在,盡管上述內(nèi)容并非對(duì)LLMs的技術(shù)性介紹,但它提供了與我們的論點(diǎn)相關(guān)的這一過程的大致輪廓(詳細(xì)綜述見Naveed et al. 2023, Chang et al. 2024, Minaee et al. 2024;還可參見Resnik 2024)。這種訓(xùn)練的結(jié)果是一個(gè)能夠使用語言的人工智能模型:更具體地說,該模型能夠通過基于提示的下一個(gè)單詞的隨機(jī)預(yù)測(cè)方法生成流暢且連貫的文本。簡(jiǎn)而言之,LLM的輸出基于其在訓(xùn)練數(shù)據(jù)中遇到的輸入結(jié)構(gòu)的條件概率。

基于對(duì)LLM訓(xùn)練方式的大致描述,我們將此與人類學(xué)習(xí)語言的方式進(jìn)行比較。正如本文開頭所討論的,AI模型的基本前提是機(jī)器和人類學(xué)習(xí)之間存在對(duì)稱性。我們認(rèn)為,仔細(xì)指出這些差異非常重要,因?yàn)檫@些差異為我們后續(xù)關(guān)于認(rèn)知和新奇性產(chǎn)生的論證奠定了基礎(chǔ)。

人類與機(jī)器學(xué)習(xí)語言的對(duì)比。在語言學(xué)習(xí)(以及其他領(lǐng)域)方面,人類和機(jī)器學(xué)習(xí)之間的差異是顯著的。盡管LLMs(大型語言模型)接觸并用萬億級(jí)的文本詞匯進(jìn)行訓(xùn)練,人類的語言學(xué)習(xí)過程卻要緩慢得多。以說明,人類嬰兒或兒童從父母、教師、兄弟姐妹、朋友以及周圍環(huán)境中聽到的平均詞匯量每天大約為2萬個(gè)(例如,Hart和Risley 2003, Gilkerson等人 2017)。因此,在最初的五年里,一個(gè)孩子可能會(huì)接觸到——或者說用這些詞匯進(jìn)行訓(xùn)練——大約3650萬詞匯。相比之下,LLMs在短短數(shù)周或數(shù)月的時(shí)間內(nèi)就用萬億級(jí)的標(biāo)記進(jìn)行訓(xùn)練。

輸入在數(shù)量(絕對(duì)數(shù)量)和質(zhì)量方面都存在根本差異。具體來說,嬰兒或幼兒主要接觸的口語與LLMs訓(xùn)練所用的書面語不同。口語在性質(zhì)、結(jié)構(gòu)和目的上與書面語存在顯著差異。在這里,關(guān)于口語與書面語差異的研究極具啟發(fā)性(例如,Biber 1991)。口語是自發(fā)的(沒有經(jīng)過有意義的編輯),非正式的,重復(fù)的,且往往是短暫的。而書面語——另一方面——是視覺的、持久的,經(jīng)過更精心的構(gòu)思、計(jì)劃和編輯。它也更密集,包含更復(fù)雜的詞匯(例如,Halliday 1989, Tannen 2007)。重要的是,口語與書面語的功能目的和用途也存在顯著差異。口語是即時(shí)的、互動(dòng)的,專注于協(xié)調(diào)、表達(dá)和實(shí)際做事。盡管書面語也服務(wù)于這些目的,但重點(diǎn)更多在于復(fù)雜信息的傳遞。LLMs的大部分訓(xùn)練數(shù)據(jù)并非對(duì)話式的(對(duì)于用口語或原始音頻訓(xùn)練的模型,見Lakhotia等人 2021)。相反,書面語經(jīng)過更周密的思考。LLMs可能會(huì)用莎士比亞和柏拉圖的作品、學(xué)術(shù)出版物、公共領(lǐng)域書籍(例如,來自古騰堡計(jì)劃的書籍)、歌詞、博客文章、新聞報(bào)道以及互聯(lián)網(wǎng)上的各種材料進(jìn)行訓(xùn)練。這些數(shù)據(jù)更干凈、語法更正確,且更有條理。可以說,LLMs接收到的輸入——以書面、編輯和出版的文本形式——在語言學(xué)上遠(yuǎn)勝一籌。從統(tǒng)計(jì)學(xué)角度看,LLMs的訓(xùn)練數(shù)據(jù)包含更少的噪聲,因此具有更強(qiáng)的預(yù)測(cè)能力。即使是大多數(shù)LLMs訓(xùn)練數(shù)據(jù)集中包含的大量維基百科文章,也是經(jīng)過數(shù)千次編輯以確保可讀性、準(zhǔn)確性和連貫性的最終結(jié)果。

顯然,人類在不同的條件下、通過不同類型的輸入學(xué)習(xí)語言。簡(jiǎn)而言之,可以合理地認(rèn)為,人類的語言能力發(fā)展方式與機(jī)器學(xué)習(xí)語言的方式在數(shù)量和質(zhì)量上都截然不同。人類(不知何故)從極其稀疏、貧乏且高度不系統(tǒng)的輸入和數(shù)據(jù)中學(xué)習(xí)語言(Chomsky 1975)。與LLMs相比,人類的語言能力在輸入方面被“嚴(yán)重地”未充分決定。也就是說,相對(duì)稀疏的語言輸入幾乎無法解釋人類生成的極具創(chuàng)新性的輸出。

除了輸入在數(shù)量和質(zhì)量上的差異外,LLMs的預(yù)測(cè)(句子中的下一個(gè)詞)與實(shí)際結(jié)果(真正的下一個(gè)詞)之間存在顯著差異。預(yù)測(cè)處理作為一種認(rèn)知理論,認(rèn)為大腦不斷預(yù)測(cè)感官輸入,并最小化預(yù)測(cè)與實(shí)際感官輸入之間的誤差。每種預(yù)測(cè)能力——無論是預(yù)測(cè)一個(gè)詞還是一個(gè)感知——都是基于過去的輸入。大型語言模型試圖根據(jù)訓(xùn)練數(shù)據(jù)預(yù)測(cè)最有可能出現(xiàn)的下一個(gè)詞,而主動(dòng)推理試圖預(yù)測(cè)最有可能出現(xiàn)的下一個(gè)感知或行動(dòng)。這兩種方法都極為保守(依賴于過去的數(shù)據(jù)),因?yàn)樗鼈冊(cè)噲D減少意外——或者說將預(yù)測(cè)視為誤差最小化(Hohwy 2013)。

反向傳播——訓(xùn)練神經(jīng)網(wǎng)絡(luò)的基本機(jī)制——以及預(yù)測(cè)處理中誤差最小化的概念(Friston和Kiebel 2009)在概念上存在廣泛的相似性,因?yàn)閮烧叨忌婕暗{(diào)整以最小化某種形式的誤差或差異。兩者都基于過去的輸入生成預(yù)測(cè)。反向傳播和預(yù)測(cè)處理中的誤差最小化都涉及調(diào)整內(nèi)部模型(在人工智能中是神經(jīng)網(wǎng)絡(luò)權(quán)重,在神經(jīng)科學(xué)中是分層大腦模型)以減少誤差(或者用機(jī)器學(xué)習(xí)的術(shù)語來說,最小化損失函數(shù))。

在這種以誤差最小化和意外減少為重點(diǎn)的架構(gòu)下,LLMs或任何以預(yù)測(cè)為導(dǎo)向的認(rèn)知AI能否真正生成某種形式的新知識(shí)?除了記憶、翻譯、重述或鏡像其訓(xùn)練文本之外,LLMs能否生成新知識(shí)?

我們不認(rèn)為L(zhǎng)LMs或基于輸入-輸出的認(rèn)知系統(tǒng)能夠做到這一點(diǎn)——至少不會(huì)超出由于其隨機(jī)性而可能出現(xiàn)的偶然情況。這些系統(tǒng)中沒有內(nèi)置任何前瞻性機(jī)制或獨(dú)特的因果邏輯。明確這一點(diǎn)非常重要,因?yàn)橛行┤苏J(rèn)為并預(yù)測(cè)LLMs將在戰(zhàn)略和科學(xué)等不確定情境中取代人類決策者。例如,Csaszar等人(2024)認(rèn)為,“用于訓(xùn)練LLMs的語料庫包含了對(duì)戰(zhàn)略決策管理(SDM)有價(jià)值的信息,如消費(fèi)者偏好、競(jìng)爭(zhēng)對(duì)手信息和戰(zhàn)略知識(shí)”,并指出人工智能如何可以使用各種決策工具生成商業(yè)計(jì)劃和戰(zhàn)略(Csaszar等人 2024,第2頁)。Manning等人(2024)甚至認(rèn)為L(zhǎng)LMs將自動(dòng)化社會(huì)科學(xué),因?yàn)樗鼈兯坪跄軌蛏杉僭O(shè)和因果模型,包括測(cè)試它們(還可參見Lu等人 2024)。

這些說法被嚴(yán)重夸大了。一種思考方式是,像LLM這樣以預(yù)測(cè)為導(dǎo)向的人工智能本質(zhì)上可以被視為擁有維基百科級(jí)別的知識(shí)。在許多主題上(如果包含在訓(xùn)練數(shù)據(jù)中),LLM能夠以各種不同且新穎的方式總結(jié)、呈現(xiàn)并鏡像它所遇到的詞匯。在任何一個(gè)特定主題上——同樣,如果在訓(xùn)練數(shù)據(jù)中得到充分呈現(xiàn)——LLM可以通過利用它所學(xué)到的條件概率,生成無數(shù)篇連貫、流暢且寫得很好的維基百科文章。然而,正如一個(gè)領(lǐng)域?qū)<也惶赡軓钠鋵I(yè)領(lǐng)域內(nèi)的維基百科文章中學(xué)到關(guān)于其專長(zhǎng)的新知識(shí)一樣,LLM也不太可能通過某種方式從它過去遇到的詞匯關(guān)聯(lián)的組合可能性中提升知識(shí)。它沒有用于這樣做的前瞻性機(jī)制。

還有充分的證據(jù)表明,當(dāng)LLM遇到(被提示)一個(gè)推理任務(wù)時(shí),它僅僅復(fù)制了它在訓(xùn)練數(shù)據(jù)中遇到的關(guān)于推理的語言答案,而不是進(jìn)行任何形式的實(shí)際即時(shí)推理。如果對(duì)推理任務(wù)的措辭——例如沃森選擇任務(wù)或蒙提霍爾問題——只進(jìn)行輕微的改變,LLM的表現(xiàn)就會(huì)顯著低于人類表現(xiàn),而LLM的錯(cuò)誤對(duì)人類來說是顯而易見的(例如,Hong等人2024)。LLM并沒有真正參與任何形式的實(shí)時(shí)推理(正如Lu等人2024、Manning等人2024所假設(shè)的)。相反,它們只是重復(fù)它們?cè)谟?xùn)練數(shù)據(jù)中遇到的與推理相關(guān)的詞匯結(jié)構(gòu)。這種效應(yīng)也可以通過實(shí)驗(yàn)證明,即對(duì)LLM進(jìn)行其過去輸出的訓(xùn)練會(huì)導(dǎo)致其表現(xiàn)迅速下降,甚至崩潰(Shumailov等人2024)。重要的是,LLM記憶并復(fù)述與推理相關(guān)的詞匯,但并不進(jìn)行任何形式的即時(shí)推理。這就是為什么Francois Chollet(2019)創(chuàng)建了“抽象與推理語料庫”,作為一種挑戰(zhàn)或測(cè)試,看看人工智能系統(tǒng)是否能夠真正解決新問題(即它在訓(xùn)練數(shù)據(jù)中沒有遇到的問題),而不僅僅是依賴于過去遇到的、記憶中的答案和解決方案(這反映了當(dāng)前人工智能系統(tǒng),包括LLM的現(xiàn)狀)。

話雖如此,我們的目標(biāo)并不是貶低LLM或其他形式人工智能或機(jī)器學(xué)習(xí)應(yīng)用的驚人成就。LLM在各種測(cè)試和考試中超越大多數(shù)人類的表現(xiàn)是令人驚嘆的(Achiam等人2023)。但這僅僅是因?yàn)樗佑|過這些信息,記住了它們,并能夠以流暢的方式復(fù)述它們。LLM本質(zhì)上擁有超人類的記憶能力,并能夠以多樣化的方式總結(jié)記憶中的詞匯結(jié)構(gòu)。總的來說,將LLM稱為“隨機(jī)鸚鵡”或“高級(jí)自動(dòng)完成功能”(Bender等人2021)確實(shí)低估了它們的能力。然而,同樣地,認(rèn)為L(zhǎng)LM能夠真正推理并產(chǎn)生新知識(shí)則極大地高估了它們的能力。LLM本質(zhì)上是強(qiáng)大的、富有創(chuàng)造力的模仿引擎,能夠隨機(jī)且概率性地組合詞匯,盡管與兒童相比,它們?cè)谡Z言上并不具有創(chuàng)新性(參見Yiu等人2023)。認(rèn)為L(zhǎng)LM能夠以某種方式產(chǎn)生世界上全新的知識(shí)——或者具有類似人類意識(shí)的特征——似乎是一種相當(dāng)牽強(qiáng)的說法(盡管參見Butlin等人2023,Hinton 2023)。總之,這些模型的生成性是一種小寫的“g”生成性,表現(xiàn)為獨(dú)特句子,創(chuàng)造性地總結(jié)和重新包裝現(xiàn)有知識(shí)。

為了說明LLM產(chǎn)生某種新穎事物——例如新知識(shí)——的問題,想象以下思想實(shí)驗(yàn)。想象一個(gè)處于1633年的LLM,其訓(xùn)練數(shù)據(jù)包含了人類到那時(shí)為止出版的所有科學(xué)和其他文本。如果被問及伽利略的日心說觀點(diǎn),LLM會(huì)如何回應(yīng)?由于LLM會(huì)從其龐大的訓(xùn)練數(shù)據(jù)中基于關(guān)聯(lián)和相關(guān)性的詞匯結(jié)構(gòu)中進(jìn)行概率性采樣——再次強(qiáng)調(diào),迄今為止所寫的一切(包括所有關(guān)于宇宙結(jié)構(gòu)的科學(xué)著作)——它只會(huì)重述、呈現(xiàn)并鏡像累積的科學(xué)共識(shí)。LLM的訓(xùn)練數(shù)據(jù)集將壓倒性地包含支持地心說的文本,形式為亞里士多德、托勒密以及許多其他人的著作。托勒密精心的三角學(xué)和幾何計(jì)算,以及他的天文觀測(cè),將被包含在內(nèi),以支持在許多總結(jié)地心說的文本中所代表的地心說(例如de Sacrobosco的流行教科書《De sphaera mundi》)。這些文本將突出顯示如何用地心說來預(yù)測(cè)行星的運(yùn)動(dòng)和軌跡,其準(zhǔn)確性令人驚嘆。從訓(xùn)練數(shù)據(jù)中反復(fù)出現(xiàn)的詞匯關(guān)聯(lián)中推斷出的證據(jù)將壓倒性地反對(duì)伽利略。LLM沒有超出鏡像和重述文本中內(nèi)容之外的任何方式來獲取真相(例如,通過實(shí)驗(yàn)或反事實(shí))。

即使訓(xùn)練數(shù)據(jù)中包含了替代或異端的觀點(diǎn)(例如哥白尼的作品,盡管他的作品大多被禁),這些作品的邏輯也會(huì)被支持主流地心范式的所有文本和材料所淹沒。數(shù)千年的地心文本的龐大語料庫將遠(yuǎn)遠(yuǎn)壓倒伽利略的觀點(diǎn)或任何支持它的觀點(diǎn)。LLM對(duì)真相或知識(shí)的模型完全是統(tǒng)計(jì)性的,依賴于頻率和概率。輸出受到訓(xùn)練數(shù)據(jù)中提到一個(gè)觀點(diǎn)的頻率的影響,這反映在相關(guān)的詞匯結(jié)構(gòu)中。例如,地心說在訓(xùn)練數(shù)據(jù)中被提及、總結(jié)和討論的頻率必然在LLM的輸出中被印刻為真相。由于LLM除了詞匯之間的統(tǒng)計(jì)關(guān)系之外沒有任何實(shí)際的真相基礎(chǔ),它會(huì)說伽利略的觀點(diǎn)和信念是妄想的,與科學(xué)毫無關(guān)聯(lián)。

像LLM這樣的神經(jīng)網(wǎng)絡(luò)實(shí)際上可能包含任何數(shù)量的妄想性信念,包括最終被證明是正確的信念(如伽利略的信念)以及客觀上是(并且仍然是)妄想的信念。事前,LLM無法在兩者之間做出裁決。例如,杰出的天文學(xué)家第谷·布拉赫曾廣泛聲稱并著名地發(fā)表了關(guān)于占星術(shù)的主張,即天體及其運(yùn)動(dòng)直接影響個(gè)人命運(yùn)以及政治和其他事務(wù)。他的占星術(shù)著作不僅在一些科學(xué)家中廣受歡迎,也在受過教育的精英中廣受歡迎。一個(gè)假想的LLM(在1633年)將無法在伽利略關(guān)于日心說的(看似)妄想和布拉赫關(guān)于占星術(shù)的(實(shí)際)妄想之間做出裁決。我們的假想LLM更有可能聲稱布拉赫的占星術(shù)主張是真實(shí)的,而不是伽利略關(guān)于日心說的論點(diǎn)是真實(shí)的。LLM只能代表并鏡像其訓(xùn)練數(shù)據(jù)中詞匯的頻率和統(tǒng)計(jì)關(guān)聯(lián)所反映的主流和現(xiàn)有觀念——在這種情況下,是支持地心宇宙觀。

總之,重要的是要認(rèn)識(shí)到LLM獲取真相和知識(shí)的方式是通過一種統(tǒng)計(jì)練習(xí),即尋找(希望是)真實(shí)主張的更頻繁提及(以詞匯之間的統(tǒng)計(jì)關(guān)聯(lián)形式)和虛假主張的較少提及。LLM的輸出是基于其在訓(xùn)練過程中遇到的詞匯的統(tǒng)計(jì)關(guān)聯(lián)概率性地抽取的。當(dāng)LLM做出真實(shí)主張時(shí),這只是因?yàn)檎鎸?shí)主張碰巧被更頻繁地提及。LLM沒有其他方式來評(píng)估真相或進(jìn)行推理。真相——如果它碰巧出現(xiàn)——是統(tǒng)計(jì)模式和頻率的副產(chǎn)品,而不是LLM發(fā)展出對(duì)現(xiàn)實(shí)中的真假的內(nèi)在理解或推理能力的結(jié)果。

一些LLM試圖通過創(chuàng)建所謂的“專家混合”模型來解決其基于頻率和概率的方法的問題,其中輸出不僅僅是超大型神經(jīng)網(wǎng)絡(luò)的平均結(jié)果,而是可以針對(duì)某些形式的專業(yè)知識(shí)進(jìn)行微調(diào)(Shazeer等人2017,Du等人2022)。另一種方法是檢索增強(qiáng)生成,它利用LLM的一般語言能力,但將用于預(yù)測(cè)的數(shù)據(jù)限制在一個(gè)有限且預(yù)先選定的來源集合中(Lewis等人2020)。此外,還開發(fā)了集成方法——這些方法結(jié)合或聚合多樣化的架構(gòu)或輸出(Friedman和Popescu 2008,Russell和Norvig 2022)。然而,即使在這里,輸出也必然反映了訓(xùn)練數(shù)據(jù)中任何特定專家所說的,而不是LLM的任何前瞻性預(yù)測(cè)或即時(shí)因果推理的形式。

這一問題在具有高度不確定性和新奇性的情境中進(jìn)一步加劇(例如許多形式的決策制定),在這種情況下,鑒于不斷演變和變化的世界,專家知識(shí)甚至有限理性的概念都難以明確界定(Felin等人2014)。

最后,至關(guān)重要的是要記住,任何LLM的輸入都是人類過去的輸入,因此,輸出也大致代表了我們到目前為止所知道的內(nèi)容。本質(zhì)上,LLM無法超越輸入所涵蓋的范圍。它沒有某種機(jī)制去產(chǎn)生關(guān)于未來的前瞻性信念——或者因果邏輯或知識(shí)——這些都無法從訓(xùn)練數(shù)據(jù)中詞匯所包含的現(xiàn)有統(tǒng)計(jì)關(guān)聯(lián)和相關(guān)性中推斷出來。

數(shù)據(jù)至上與數(shù)據(jù)-信念不對(duì)稱性

我們迄今為止所強(qiáng)調(diào)的核心問題是,機(jī)器和人工智能的學(xué)習(xí)本質(zhì)上是回溯性的和模仿性的。再次強(qiáng)調(diào),這不應(yīng)被理解為對(duì)這些模型的批評(píng),而僅僅是對(duì)其結(jié)構(gòu)限制的描述。盡管它們?cè)谠S多方面都很有用,但像LLM這樣的人工智能模型無法產(chǎn)生新知識(shí)或解決新問題。LLM不會(huì)推理。而且,LLM無法超越其訓(xùn)練數(shù)據(jù)中遇到的內(nèi)容進(jìn)行假設(shè)。

接下來,我們將這一問題擴(kuò)展到人工智能和認(rèn)知科學(xué)中對(duì)數(shù)據(jù)至上的更一般性強(qiáng)調(diào)。數(shù)據(jù)本身當(dāng)然不是問題。相反,問題是數(shù)據(jù)被以一種理論無關(guān)的方式使用(Anderson 2008)。為了確保我們沒有通過僅僅關(guān)注LLM來歪曲現(xiàn)有的與人工智能相關(guān)的認(rèn)知模型,我們還將論證擴(kuò)展到其他形式的認(rèn)知人工智能。

將心智和機(jī)器視為輸入-輸出設(shè)備的一般觀點(diǎn),強(qiáng)調(diào)了數(shù)據(jù)的首要性。這暗示了一個(gè)模型,其中數(shù)據(jù)——如線索、刺激、文本、圖像——本質(zhì)上被一個(gè)系統(tǒng)(無論是人類還是計(jì)算系統(tǒng))讀取、學(xué)習(xí)和表示。世界(任何大量的圖像、文本或環(huán)境)具有特定的統(tǒng)計(jì)和物理結(jié)構(gòu),而一個(gè)系統(tǒng)的目標(biāo)是從中準(zhǔn)確學(xué)習(xí)并反映這種結(jié)構(gòu)。這被認(rèn)為是智能的基礎(chǔ)。正如Poldrack(2021,第1307頁,強(qiáng)調(diào)部分為原文所有)所說:“任何要在世界中表現(xiàn)出智能的系統(tǒng),都必須包含反映世界結(jié)構(gòu)的表征”(參見Yin 2020)。基于神經(jīng)網(wǎng)絡(luò)的方法和強(qiáng)調(diào)自下而上表征的機(jī)器學(xué)習(xí)為實(shí)現(xiàn)這一目標(biāo)提供了完美的機(jī)制,因?yàn)樗鼈兛梢浴爸苯訌臄?shù)據(jù)中學(xué)習(xí)”(Lansdell和Kording 2019;還可參見Baker等人2022)。學(xué)習(xí)是數(shù)據(jù)驅(qū)動(dòng)的。當(dāng)然,認(rèn)知系統(tǒng)可能無法完美學(xué)習(xí),但主體或機(jī)器可以通過“反復(fù)與環(huán)境互動(dòng)”來推斷其本質(zhì)和結(jié)構(gòu)(Binz等人2023)。這是“行為的概率模型”的基礎(chǔ),該模型將“人類在復(fù)雜環(huán)境中的行為視為解決一個(gè)統(tǒng)計(jì)推斷問題”(Tervo等人2016)。

貝葉斯認(rèn)知也認(rèn)為,人類和機(jī)器的學(xué)習(xí)可以通過貝葉斯統(tǒng)計(jì)方法所捕捉的對(duì)環(huán)境的概率推理來理解(例如,Griffiths等人2010)。這一框架將感官輸入、感知和經(jīng)驗(yàn)性證據(jù)視為數(shù)據(jù),這些數(shù)據(jù)不斷從環(huán)境中獲取,然后用于更新一個(gè)人對(duì)世界的模型(或特定假設(shè))。認(rèn)知過程涉及從可能狀態(tài)或結(jié)果的概率分布中抽樣,這些抽樣由傳入的數(shù)據(jù)提供信息。至關(guān)重要的是,貝葉斯及相關(guān)認(rèn)知方法強(qiáng)調(diào)通過動(dòng)態(tài)更新信念來整合先驗(yàn)知識(shí)(先驗(yàn))和新證據(jù),以修正信念(后驗(yàn)),這一過程通過貝葉斯公式數(shù)學(xué)化描述(Pinker 2021)。這種迭代更新反映了持續(xù)的學(xué)習(xí)過程,承認(rèn)并量化了不確定性,將理解和決策制定視為本質(zhì)上是概率性的。這種概率架構(gòu)也是人工智能和認(rèn)知科學(xué)中大部分領(lǐng)域的基礎(chǔ)。

值得反思的是這里所假定的認(rèn)識(shí)論立場(chǎng)——或潛在的知識(shí)理論。知識(shí)傳統(tǒng)上被定義為經(jīng)過證明的信念,而信念是通過數(shù)據(jù)和證據(jù)來證明的。正如貝葉斯模型所暗示的,我們相信或知道某件事情的程度取決于我們對(duì)它們的數(shù)據(jù)和證據(jù)的程度(Pinker 2021)。信念應(yīng)該與手頭的證據(jù)成比例,因?yàn)槿绻黧w對(duì)其環(huán)境和世界有一個(gè)準(zhǔn)確的表征或概念,他們會(huì)過得更好(例如,Schw?bel等人2018)。知識(shí)可以被視為構(gòu)成我們信念的累積輸入、數(shù)據(jù)和證據(jù)。任何信念的強(qiáng)度或程度應(yīng)該與支持?jǐn)?shù)據(jù)的量成對(duì)稱,或者換句話說,與證據(jù)的權(quán)重成比例(Pinker 2021;還可參見Griffin和Tversky 1992, Kvam和Pleskac 2016, Dasgupta等人2020)。這是認(rèn)知系統(tǒng)概率模型的基礎(chǔ)。這些方法關(guān)注于“逆向工程化心智”——從輸入到輸出——它們“與計(jì)算機(jī)科學(xué)、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)的最新觀點(diǎn)建立了強(qiáng)有力的聯(lián)系”(Griffiths等人2010,第363頁)。總體而言,這代表了一種相對(duì)廣泛認(rèn)同的認(rèn)識(shí)論立場(chǎng),也符合以輸入-輸出為導(dǎo)向的“心智的計(jì)算理論”(例如,Rescorla 2015),其中人類或機(jī)器通過“反復(fù)與環(huán)境互動(dòng)”進(jìn)行學(xué)習(xí)——無需“任何先驗(yàn)規(guī)定”(Binz等人2023)。總結(jié)上述文獻(xiàn)的一種方式是,一個(gè)人的信念與支持?jǐn)?shù)據(jù)之間需要有一種對(duì)稱性。理性決策者將通過考慮可用數(shù)據(jù)和證據(jù)來形成(并權(quán)衡)關(guān)于任何給定事物的信念。

但如果出現(xiàn)邊緣情況呢?也就是說,在主體正確地吸收了所有數(shù)據(jù)和證據(jù)的情況下,卻以某種方式得出錯(cuò)誤的結(jié)論?基于理性信息處理的模型并沒有提供一個(gè)機(jī)制來解釋變化或新知識(shí),或者解釋數(shù)據(jù)和證據(jù)推理可能導(dǎo)致不良結(jié)果的情況(參見Felin和Koenderink 2022)。此外,盡管基于學(xué)習(xí)的知識(shí)模型能夠根據(jù)新證據(jù)更新信念,但并沒有機(jī)制來解釋新數(shù)據(jù)來自何處,或者哪些數(shù)據(jù)應(yīng)被視為相關(guān),哪些數(shù)據(jù)應(yīng)被忽略。如果數(shù)據(jù)和證據(jù)存在爭(zhēng)議呢?在充滿不確定性的情境中,包括任何類型的前瞻性決策和科學(xué)推理,這是一個(gè)特別重要的問題。

對(duì)于假設(shè)數(shù)據(jù)-信念對(duì)稱性的計(jì)算性、輸入-輸出認(rèn)知模型來說,解釋新奇性和新知識(shí)的產(chǎn)生是高度有問題的。知識(shí)的基礎(chǔ)是對(duì)真理的追求(Pinker 2021),這集中在現(xiàn)有證據(jù)和數(shù)據(jù)上。但我們認(rèn)為,數(shù)據(jù)-信念不對(duì)稱性實(shí)際上對(duì)于新知識(shí)的產(chǎn)生和相關(guān)決策制定是必不可少的。現(xiàn)有的認(rèn)知科學(xué)文獻(xiàn)關(guān)注數(shù)據(jù)-信念不對(duì)稱性的一面,即其負(fù)面:數(shù)據(jù)-信念不對(duì)稱性的消極方面(例如,Kunda 1990, Scheffer等人2022)。這種負(fù)面包括人類盡管有看似明確的相反證據(jù)卻仍然堅(jiān)持相信某事的所有方式(Pinker 2021)。這包括大量關(guān)于人類信息處理偏見的文獻(xiàn)——人類處理、感知和使用數(shù)據(jù)以及未能適當(dāng)?shù)馗缕湫拍畹拇蝺?yōu)和有偏見的方式。這在關(guān)注各種數(shù)據(jù)相關(guān)病理和偏見的廣泛文獻(xiàn)中是顯而易見的,包括動(dòng)機(jī)性推理、確認(rèn)偏誤、選擇性感知和抽樣以及可用性偏誤。對(duì)錯(cuò)誤信念和人類偏見的強(qiáng)調(diào)有力地影響了我們對(duì)人類本性和決策的看法,這些看法在各種社會(huì)和經(jīng)濟(jì)領(lǐng)域中都有所體現(xiàn)(例如,Kahneman 2011, Bénabou和Tirole 2016, Chater 2018, Genakoplos和Shleifer 2018, Kahneman等人2021, Bordalo等人2023)。

但是數(shù)據(jù)-信念不對(duì)稱性的積極一面呢?那些看似與既定證據(jù)和事實(shí)相悖,但卻最終被證明是正確的信念呢?在這里,我們特別指的是那些可能超越、忽視并超越現(xiàn)有證據(jù)的信念。前瞻性、反傳統(tǒng)的觀點(diǎn)對(duì)于新奇性和新知識(shí)的產(chǎn)生至關(guān)重要。由于基于人工智能的計(jì)算和認(rèn)知系統(tǒng)具有統(tǒng)計(jì)性和回溯性(專注于過去數(shù)據(jù)中的相關(guān)性、關(guān)聯(lián)性和平均值),它們無法以反傳統(tǒng)的方式進(jìn)行預(yù)測(cè)或推理,因?yàn)樗鼈冸[含地堅(jiān)持?jǐn)?shù)據(jù)和信念之間的對(duì)稱性。

盡管如此,需要注意的是,正如我們所討論的,我們對(duì)數(shù)據(jù)-信念不對(duì)稱性的關(guān)注并不是某種與數(shù)據(jù)無關(guān)或脫離現(xiàn)實(shí)的。相反,這種數(shù)據(jù)-信念不對(duì)稱性是前瞻性的,因?yàn)樾拍詈鸵蚬评砟軌蜃R(shí)別新的數(shù)據(jù)和實(shí)驗(yàn)干預(yù),并最終驗(yàn)證那些之前被視為扭曲或妄想基礎(chǔ)的信念。

為了提供一個(gè)實(shí)際且生動(dòng)的說明,說明數(shù)據(jù)-信念對(duì)稱性可能存在的問題,可以考慮19世紀(jì)末和20世紀(jì)初關(guān)于重于空氣的有人駕駛和可控飛行的可能性的信念(我們?cè)诒疚闹幸脒@個(gè)例子,并在其余部分中多次提及)。要形成關(guān)于人力飛行可能性的信念——甚至為其分配一個(gè)概率——我們首先會(huì)查看現(xiàn)有的數(shù)據(jù)和證據(jù)。那么,當(dāng)時(shí)關(guān)于人力飛行可能性的證據(jù)是什么?當(dāng)時(shí)最明顯的數(shù)據(jù)點(diǎn)是人力飛行尚未成為現(xiàn)實(shí)。當(dāng)然,這本身并不能否定這種可能性。因此,我們可能希望查看所有與人類飛行嘗試相關(guān)的數(shù)據(jù),以評(píng)估其可能性。在這里,我們會(huì)發(fā)現(xiàn)人類數(shù)百年來一直在嘗試制造飛行機(jī)器,而與飛行相關(guān)的試驗(yàn)實(shí)際上在19世紀(jì)大幅加速。所有這些飛行試驗(yàn)都可以被視為我們應(yīng)該用來更新我們對(duì)飛行不可能性信念的數(shù)據(jù)和證據(jù)。所有證據(jù)都清楚地表明,相信人力飛行是妄想的。妄想可以被定義為與證據(jù)和現(xiàn)實(shí)相悖的信念(Pinker 2021, Scheffer等人 2022):一種與公認(rèn)事實(shí)不一致的信念。事實(shí)上,《精神障礙診斷與統(tǒng)計(jì)手冊(cè)》第四版和第五版——精神障礙的權(quán)威手冊(cè)——將妄想定義為“由于對(duì)外部現(xiàn)實(shí)的錯(cuò)誤推斷而產(chǎn)生的錯(cuò)誤信念”或“在面對(duì)矛盾證據(jù)時(shí)無法改變的固定信念”。

請(qǐng)注意,當(dāng)時(shí)許多人——天真地認(rèn)為——以鳥類作為人類可能飛行的證據(jù)。這是一個(gè)常見的論點(diǎn)。但科學(xué)家們認(rèn)為,鳥類飛行以某種方式為人類飛行的可能性提供了希望和證據(jù),這種觀點(diǎn)是妄想的,并且被著名科學(xué)家約瑟夫·勒孔特(Joseph LeConte 1888,第69頁)駁斥,他斷言飛行“不可能,盡管有鳥類的證據(jù)”。像一個(gè)好科學(xué)家和貝葉斯主義者一樣,勒孔特引用數(shù)據(jù)來支持他的觀點(diǎn)。他研究了鳥類物種——那些會(huì)飛的和不會(huì)飛的——并得出結(jié)論“飛行動(dòng)物的大小和重量存在極限”。根據(jù)勒孔特的說法,重量是飛行的關(guān)鍵決定因素。憑借他的數(shù)據(jù),他明確指出,沒有超過50磅的鳥類能夠飛行,因此得出結(jié)論認(rèn)為人類不能飛行。畢竟,像鴕鳥和鴯鹋這樣的大型鳥類是無法飛行的。他甚至認(rèn)為,即使是最大的飛行鳥類——如火雞和鴇——“起飛困難”且“顯然接近極限”(勒孔特1888,第69-76頁)。飛行與重量是相關(guān)的。對(duì)此,當(dāng)時(shí)的頂尖天文學(xué)家和數(shù)學(xué)家之一西蒙·紐康姆(Simon Newcomb 1901,第435頁)補(bǔ)充說:“最多的飛行者是小昆蟲,而上升的系列以禿鷹結(jié)束,盡管禿鷹的重量遠(yuǎn)小于人類,但據(jù)說它在吃飽后飛行困難。”

勒孔特強(qiáng)調(diào)鳥類的重量以駁斥人力飛行的可能性,這突顯了基于證據(jù)的數(shù)據(jù)和信念更新的一個(gè)問題。很難知道哪些數(shù)據(jù)和證據(jù)可能與某個(gè)信念或假設(shè)相關(guān)。問題是——正如波蘭尼(Polanyi 1958,第31頁)簡(jiǎn)潔地指出的——“自然中沒有標(biāo)記為證據(jù)的事物。”小型鳥類能飛而大型鳥類不能飛的事實(shí)是否與人類能否飛行的問題相關(guān)?在這種情況下,什么是相關(guān)數(shù)據(jù)和證據(jù)?飛行是否與重量或大小有關(guān),還是與其他特征(如翅膀)有關(guān)?它是否與翅膀的拍打(如雅各布·德根所假設(shè)的)有關(guān)?還是與翅膀的形狀、大小或重量有關(guān)?也許羽毛對(duì)飛行至關(guān)重要。簡(jiǎn)而言之,很難知道哪些數(shù)據(jù)可能是相關(guān)且有用的。

當(dāng)然,并非我們所有的信念都能通過我們自己驗(yàn)證的直接實(shí)證數(shù)據(jù)得到充分證明。我們無法——也并不希望——直接驗(yàn)證支撐我們信念和知識(shí)的所有數(shù)據(jù)和觀察。在大多數(shù)情況下,我們正確地依賴他人的專業(yè)知識(shí)、信念或科學(xué)論證作為我們所持信念的證據(jù)(Coady 1992, Goldman 1999)。認(rèn)知科學(xué)也開始強(qiáng)調(diào)這一點(diǎn)。貝葉斯和其他概率認(rèn)知模型引入了在考慮使用哪些數(shù)據(jù)或證據(jù)來更新信念和知識(shí)時(shí),來源可靠性的概念(例如,Hahn等人2018,Merdes等人2021)。這種方法認(rèn)識(shí)到并非所有數(shù)據(jù)和證據(jù)都是平等的。誰說了什么確實(shí)很重要。證據(jù)的來源需要被考慮。例如,科學(xué)專業(yè)知識(shí)和共識(shí)是信念和知識(shí)的關(guān)鍵來源。

這可以通過重于空氣的飛行的例子來清楚地說明。那么,如果我們通過關(guān)注可靠、科學(xué)的來源和共識(shí)來權(quán)衡我們對(duì)人類飛行可能性的信念,會(huì)發(fā)生什么?在大多數(shù)情況下,這是一種理性的策略。然而,在這個(gè)時(shí)期,基于此更新我們對(duì)重于空氣飛行的信念將進(jìn)一步強(qiáng)化人力飛行是妄想且不可能的結(jié)論。同樣,像勒孔特和紐康姆這樣的科學(xué)家通過引用看似確鑿的數(shù)據(jù)和證據(jù)來論證飛行是不可能的。而且,我們不僅應(yīng)該基于這些證據(jù)更新我們的信念,還應(yīng)該根據(jù)這些證據(jù)來自在該領(lǐng)域具有看似相關(guān)知識(shí)的杰出科學(xué)家這一事實(shí),進(jìn)一步權(quán)衡這些證據(jù)。例如,勒孔特最終成為了美國頂尖科學(xué)協(xié)會(huì)(美國科學(xué)促進(jìn)會(huì))的主席。勒孔特并不孤單。他是更廣泛的科學(xué)共識(shí)的一部分,這一共識(shí)堅(jiān)持認(rèn)為人力飛行是不可能的。例如,開爾文勛爵在擔(dān)任英國皇家學(xué)會(huì)會(huì)長(zhǎng)時(shí)斷言“重于空氣的飛行機(jī)器是不可能的”。這具有諷刺意味,因?yàn)殚_爾文在熱力學(xué)和流體動(dòng)力學(xué)、氣體在不同條件下的行為(以及其他物理學(xué)領(lǐng)域)方面的科學(xué)專長(zhǎng),實(shí)際上對(duì)人力飛行具有極其相關(guān)的實(shí)際意義。上述著名的數(shù)學(xué)家-天文學(xué)家西蒙·紐康姆(1901)也在他的文章《飛艇來了嗎?》中論證說,飛行的不可能性是一個(gè)科學(xué)事實(shí),因?yàn)闆]有任何物理材料的組合能夠?qū)崿F(xiàn)人類飛行(關(guān)于歷史細(xì)節(jié),參見Crouch 2002, Anderson 2004)。

那么問題來了,一個(gè)人如何仍然——盡管有看似明確的證據(jù)和科學(xué)共識(shí)——堅(jiān)持一個(gè)看似妄想的信念?在人類飛行的案例中,數(shù)據(jù)、證據(jù)和科學(xué)共識(shí)都堅(jiān)決反對(duì)這種可能性。沒有理性的貝葉斯主義者應(yīng)該相信重于空氣的飛行。同樣,反對(duì)它的證據(jù)不僅僅是實(shí)證的(以勒孔特的鳥類和其他數(shù)據(jù)的形式)并且基于科學(xué)和科學(xué)共識(shí)(以開爾文和紐康姆的與物理學(xué)相關(guān)的論證形式),而且它在觀察上也是顯著的。許多航空先驅(qū)不僅失敗并受傷,有些人甚至死亡。例如,1896年,德國航空先驅(qū)奧托·利林塔爾在嘗試飛行時(shí)死亡,萊特兄弟對(duì)此非常熟悉(因?yàn)樗麄冸S后研究了利林塔爾的筆記本和數(shù)據(jù))。1903年——就在萊特兄弟成功前的九周——科學(xué)家塞繆爾·蘭利在飛行嘗試中慘敗,大量科學(xué)界和普通觀眾目睹了這些失敗。回顧最近的飛行嘗試(包括蘭利的突出失敗),《紐約時(shí)報(bào)》的編輯委員會(huì)(1903)估計(jì),要實(shí)現(xiàn)人力飛行,需要“數(shù)學(xué)家和機(jī)械師的聯(lián)合且持續(xù)努力,從一百萬年到一千萬年不等”。

當(dāng)然,我們選擇了一個(gè)歷史案例,其中一種看似妄想的信念——與現(xiàn)有數(shù)據(jù)、證據(jù)和科學(xué)共識(shí)相悖——最終被證明是正確的。認(rèn)知和社會(huì)心理學(xué)家經(jīng)常進(jìn)行“相反”的練習(xí),他們回顧性地指出,由于有偏見的信息處理、選擇性感知或有偏見的數(shù)據(jù)采樣,人類頑固地堅(jiān)持持有那些與證據(jù)相悖的妄想性信念(Festinger等人1956,Kunda 1990,Kahneman 2011,Pinker 2021;盡管參見Anglin 2019)。陰謀論提供了一個(gè)經(jīng)常被討論的例子,這些信念似乎對(duì)證據(jù)無動(dòng)于衷(Gagliardi 2024,Rao和Greve 2024)。經(jīng)濟(jì)學(xué)家更廣泛地指出,人類可能對(duì)許多形式的證據(jù)“具有抵抗力,個(gè)體表現(xiàn)出非貝葉斯行為,如不想知道、一廂情愿和現(xiàn)實(shí)否認(rèn)”(Bénabou和Tirole 2016,第142頁)。當(dāng)然,有些信念確實(shí)是妄想的。但其他信念——如飛行——可能只是看起來妄想。

我們認(rèn)為,信念的另一面——那些目前可能看起來妄想的信念(與證據(jù)相悖的信念)以及那些看似由動(dòng)機(jī)性推理驅(qū)動(dòng)但最終被證明是正確的信念——也需要被關(guān)注。我們以飛行為例,說明了一個(gè)更普遍的過程,其中數(shù)據(jù)-信念不對(duì)稱性對(duì)于新奇性和新知識(shí)的產(chǎn)生至關(guān)重要。異質(zhì)性信念和數(shù)據(jù)-信念不對(duì)稱性是新思想、新實(shí)驗(yàn)形式和新知識(shí)的生命線,正如我們?cè)诮酉聛淼挠懻撝兴赋龅摹4送猓@最終對(duì)以計(jì)算為導(dǎo)向的人工智能和認(rèn)知形式具有重要意義。

基于理論的因果邏輯與認(rèn)知

在上述數(shù)據(jù)-信念不對(duì)稱性的基礎(chǔ)上,接下來我們討論人類如何進(jìn)行前瞻性理論化和因果推理,這使他們能夠超越數(shù)據(jù)——更具體地說,超越現(xiàn)有數(shù)據(jù)進(jìn)行實(shí)驗(yàn)并產(chǎn)生新的數(shù)據(jù)和新奇性。我們特別強(qiáng)調(diào)這種認(rèn)知和實(shí)踐活動(dòng)的形式與以數(shù)據(jù)驅(qū)動(dòng)和信息處理為導(dǎo)向的認(rèn)知形式——人工智能和計(jì)算性認(rèn)知的標(biāo)志——之間的差異,并使人類能夠以前瞻性的方式干預(yù)世界。以數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法接受并分析世界本來的樣子,而沒有認(rèn)識(shí)到人類干預(yù)的能力(Pearl和Mackenzie 2018),以及實(shí)現(xiàn)那些因缺乏數(shù)據(jù)和證據(jù)而看似不可信的信念的能力。我們將重于空氣的飛行的例子擴(kuò)展,以提供一個(gè)實(shí)踐說明,努力為我們認(rèn)為是一個(gè)更普遍和普遍的過程提供獨(dú)特的視角。

我們的基礎(chǔ)出發(fā)點(diǎn)——基于Felin和Zenger(2017)——是認(rèn)知活動(dòng)是一種理論化或科學(xué)活動(dòng)。也就是說,人類生成前瞻性理論來指導(dǎo)他們的感知、搜索和行動(dòng)。正如Peirce(1957,第71頁)指出的,“人類的心智天生適應(yīng)于想象某些類型的正確理論……如果人類沒有適應(yīng)其需求的心智天賦,他就無法獲得任何知識(shí)。”正如我們?cè)谡Z言例子中提到的,兒童稀少的語言輸入幾乎無法解釋其豐富的輸出,這指向了人類的理論化能力。人類的理論化能力——參與新問題解決和實(shí)驗(yàn)的能力——具有進(jìn)化起源,并為技術(shù)的出現(xiàn)和進(jìn)化飛躍提供了非常合理的解釋(Felin和Kauffman 2023)。

重要的是,基于理論的認(rèn)知使人類能夠采取行動(dòng),進(jìn)行實(shí)驗(yàn)。這也就是兒童發(fā)展中的“核心知識(shí)論點(diǎn)”的基礎(chǔ)(例如,Spelke等人1992,Carey和Spelke 1996)。人類通過假設(shè)、因果推理和實(shí)驗(yàn)的過程像科學(xué)家一樣發(fā)展知識(shí)。與認(rèn)知的計(jì)算方法側(cè)重于數(shù)據(jù)和環(huán)境輸入的首要性不同,基于理論的認(rèn)知觀側(cè)重于人類不僅學(xué)習(xí)周圍環(huán)境,而且在積極生成新知識(shí)方面的積極作用(Felin和Zenger 2017)。如果沒有這種積極的、生成性的、前瞻性的理論化成分,很難想象知識(shí)如何增長(zhǎng),無論我們討論的是實(shí)踐知識(shí)還是科學(xué)知識(shí)。這在發(fā)展心理學(xué)的一篇文章標(biāo)題中得到了很好的體現(xiàn):“如果你想取得進(jìn)步,就去構(gòu)建一個(gè)理論”(Karmiloff-Smith和Inhelder 1974)。這也呼應(yīng)了Lewin(1943,第118頁)的名言:“沒有什么比一個(gè)好的理論更實(shí)用的了。”這里的核心觀點(diǎn)是,理論不僅僅是科學(xué)家的專屬。理論對(duì)于任何試圖理解和影響周圍環(huán)境的人來說都是實(shí)用的;理論幫助我們采取行動(dòng)。理論化是人類認(rèn)知和實(shí)踐活動(dòng)的核心方面。因此,正如杜威(Dewey 1916,第438—442頁)所論證的,“科學(xué)的實(shí)體不僅來自科學(xué)家”,并且“在人類事業(yè)的每一個(gè)分支中,個(gè)體都應(yīng)該是實(shí)驗(yàn)者。”我們?cè)诖嘶A(chǔ)上進(jìn)行擴(kuò)展,將其引入新的和獨(dú)特的領(lǐng)域,并將其與人工智能啟發(fā)的認(rèn)知模型進(jìn)行對(duì)比。

在決策和戰(zhàn)略的背景下,基于理論的觀點(diǎn)擴(kuò)展了上述邏輯,強(qiáng)調(diào)了理論化和理論在經(jīng)濟(jì)情境中的重要性,這對(duì)認(rèn)知有著廣泛的影響(Felin和Zenger 2017)。基于理論的觀點(diǎn)的核心思想是,經(jīng)濟(jì)主體能夠(并且需要)發(fā)展獨(dú)特的企業(yè)特定理論。理論并不是試圖映射現(xiàn)有的現(xiàn)實(shí),而是生成未被看見的未來可能性,重要的是,理論提出了因果干預(yù)措施(需要采取的實(shí)驗(yàn)和行動(dòng)),以實(shí)現(xiàn)這些可能性。理論也可以被視為一種機(jī)制,用于破解競(jìng)爭(zhēng)性要素市場(chǎng)(參見Barney 1986),使經(jīng)濟(jì)主體能夠以不同的方式看待和探索世界。對(duì)新可能性的意識(shí)是通過認(rèn)知自上而下發(fā)展的(Felin和Koenderink 2022)。理論還對(duì)如何高效組織或治理實(shí)現(xiàn)新事物的過程有著核心意義(Wuebker等人 2023)。這種方法已經(jīng)通過實(shí)證測(cè)試并得到驗(yàn)證(例如,Camuffo等人 2020,Novelli和Spina 2022,Agarwal等人 2023),包括重要的理論擴(kuò)展(例如,Ehrig和Schmidt 2022,Zellweger和Zenger 2023)。基于理論的觀點(diǎn)的實(shí)踐意義也促成了管理工具的開發(fā),以幫助初創(chuàng)企業(yè)、經(jīng)濟(jì)主體和組織創(chuàng)造經(jīng)濟(jì)價(jià)值(Felin等人 2021a)。

本文這一部分的目標(biāo)并不是全面回顧基于理論的觀點(diǎn)。相反,我們的目標(biāo)是進(jìn)一步構(gòu)建基于理論的觀點(diǎn)的認(rèn)知和實(shí)踐方面,特別強(qiáng)調(diào)因果推理以及它與以數(shù)據(jù)為中心、回溯性的AI和認(rèn)知方法的對(duì)比。我們強(qiáng)調(diào)人類的理論化和因果推理能力與AI對(duì)數(shù)據(jù)驅(qū)動(dòng)預(yù)測(cè)的強(qiáng)調(diào)之間的差異。基于理論的認(rèn)知觀使人類能夠在給定數(shù)據(jù)之外干預(yù)世界——不僅僅是處理、表征或從現(xiàn)有數(shù)據(jù)中推斷。理論通過實(shí)驗(yàn)識(shí)別或生成非顯而易見的數(shù)據(jù)和新知識(shí)。這與計(jì)算、貝葉斯和AI啟發(fā)的認(rèn)知方法所提出的論點(diǎn)和建議有著顯著的不同。重要的是要仔細(xì)建立這些差異,因?yàn)榛贏I和計(jì)算的方法——正如本文開頭廣泛討論的那樣——被認(rèn)為優(yōu)于人類的判斷和認(rèn)知(例如,Kahneman 2018)。

認(rèn)知:重訪數(shù)據(jù)與信念的不對(duì)稱性

異質(zhì)性信念為基于理論的因果推理和認(rèn)知提供了初始動(dòng)力。從我們的角度來看,為了使信念成為理解認(rèn)知和決策的相關(guān)概念,信念并不一定——至少在最初——需要基于數(shù)據(jù)。我們特別關(guān)注前瞻性信念,即目前缺乏證據(jù)甚至與現(xiàn)有數(shù)據(jù)相悖,但最終可能被證明是正確的信念。因此,前瞻性信念更像是在尋找數(shù)據(jù),而不是基于現(xiàn)有數(shù)據(jù)。在知識(shí)的前沿,數(shù)據(jù)是信念的產(chǎn)物——與因果推理和實(shí)驗(yàn)(我們?cè)谙乱还?jié)討論)相結(jié)合——而不是新知識(shí)是現(xiàn)有數(shù)據(jù)的直接產(chǎn)物。

問題是,很難事先區(qū)分哪些信念確實(shí)是妄想,哪些只是超前于時(shí)代。在數(shù)據(jù)滯后于信念(或數(shù)據(jù)可能目前不存在)的情況下,即在尚未識(shí)別、發(fā)現(xiàn)或?qū)嶒?yàn)生成支持性數(shù)據(jù)的情況下,數(shù)據(jù)與信念的不對(duì)稱性至關(guān)重要。在許多情況下,信念并不會(huì)自動(dòng)得到驗(yàn)證。相反,它們通常需要某種形式的針對(duì)性干預(yù)、行動(dòng)和實(shí)驗(yàn)。尋找支持一種不尋常、反向或不一致信念的數(shù)據(jù),必然看起來像是非理性的動(dòng)機(jī)性推理或確認(rèn)偏誤(Kunda, 1990;參見 Hahn 和 Harris, 2014)。為了簡(jiǎn)要說明,伽利略對(duì)日心說的信念與既定的科學(xué)數(shù)據(jù)和共識(shí)甚至常識(shí)相悖。地心宇宙觀在觀測(cè)上得到了很好的證實(shí),它們是成功的:它們能夠精確預(yù)測(cè)行星和恒星的運(yùn)動(dòng)。即使是日常觀察也證實(shí)了地球是靜止的,而太陽似乎圍繞地球轉(zhuǎn)動(dòng)。伽利略的反對(duì)者基本上認(rèn)為,伽利略試圖通過反對(duì)天主教會(huì)的偏見性動(dòng)機(jī)推理,將人類和不可移動(dòng)的地球從上帝創(chuàng)造的中心移開。

在討論因果推理對(duì)于實(shí)現(xiàn)反向或妄想性信念的重要性之前,值得強(qiáng)調(diào)信念作為行動(dòng)動(dòng)機(jī)的作用。也就是說,一個(gè)人信念的強(qiáng)度或程度可以通過他因該信念而采取行動(dòng)的可能性來衡量(Ramsey, 1931;另見 Felin 等人, 2021a)。相比之下,基于概率或貝葉斯認(rèn)知模型的信念強(qiáng)度(參見 Pinker, 2021)直接與現(xiàn)有數(shù)據(jù)和可用證據(jù)的權(quán)重相關(guān),而不是與采取行動(dòng)的可能性——這是一個(gè)顯著的差異。

注意在我們之前提到的例子中,人類飛行的情境下,信念的含義。盡管有壓倒性的數(shù)據(jù)和證據(jù)反對(duì)這一信念,信念在激勵(lì)航空先驅(qū)采取行動(dòng)方面發(fā)揮了核心作用。從某種意義上說,那些追求飛行的人并沒有適當(dāng)?shù)馗滤麄兊男拍睢4蠖鄶?shù)證據(jù)都對(duì)萊特兄弟不利,但他們?nèi)匀幌嘈棚w行的可能性。萊特兄弟之一的威爾伯在 1899 年寫信給科學(xué)家和航空先驅(qū)塞繆爾·蘭利,并承認(rèn):“多年來,我一直受飛行可能實(shí)現(xiàn)的信念困擾。我的病情愈發(fā)嚴(yán)重,我感覺它很快就會(huì)讓我花費(fèi)更多金錢,甚至可能危及我的生命”(萊特和萊特, 1881–1940,強(qiáng)調(diào)為原文所加)。威爾伯顯然認(rèn)識(shí)到,他對(duì)飛行的信念在他人看來似乎是妄想的,這從他的信件中可以看出。但這種信念激勵(lì)他進(jìn)行因果推理和實(shí)驗(yàn),使他和他的兄弟將看似妄想的信念變?yōu)楝F(xiàn)實(shí)(僅僅四年之后)。將萊特兄弟的信念與當(dāng)時(shí)最偉大的科學(xué)頭腦之一開爾文勛爵的信念對(duì)比一下。當(dāng)被邀請(qǐng)加入十年前新成立的航空學(xué)會(huì)時(shí),開爾文拒絕了,并說:“我對(duì)空中航行連一丁點(diǎn)信念都沒有。”開爾文可能是在表達(dá)他的一位科學(xué)同時(shí)代人的觀點(diǎn):數(shù)學(xué)家威廉·克利福德(2010, p. 79),他認(rèn)為“在任何地方、任何時(shí)候、對(duì)任何人都不應(yīng)該在沒有足夠證據(jù)的情況下相信任何事情。”由于沒有對(duì)人類飛行可能性的絲毫信念,開爾文自然不想支持任何暗示人類飛行可能實(shí)現(xiàn)的事情。但對(duì)于萊特兄弟來說,動(dòng)力飛行的可能性是一個(gè)“活生生的假設(shè)”(詹姆斯, 1967)。盡管有數(shù)據(jù),他們?nèi)匀幌嘈湃祟愶w行可能是可能的,并采取了具體步驟來實(shí)現(xiàn)他們的信念。

數(shù)據(jù)與信念之間的不對(duì)稱性對(duì)理性這一概念本身提出了問題(參見 Chater 等人, 2018;Felin 和 Koenderink, 2022)。畢竟,作為一個(gè)理性的人,我們的知識(shí)應(yīng)該基于證據(jù)。我們的信念和知識(shí)應(yīng)該與手頭的證據(jù)成比例。嚴(yán)格來說,信念這一概念甚至不需要存在,因?yàn)槿藗兛梢灾苯诱務(wù)撝R(shí),即由證據(jù)證明的信念。這種觀點(diǎn)簡(jiǎn)潔地體現(xiàn)在 Pinker(2021, p. 244)的話中,他認(rèn)為“我不相信任何你必須相信的東西。”這似乎是一個(gè)合理的立場(chǎng)。這也是貝葉斯方法的基礎(chǔ),即新數(shù)據(jù)(不知何故)出現(xiàn),我們可以據(jù)此更新我們的信念和知識(shí),為我們提供“根據(jù)新證據(jù)更新信念的最優(yōu)方式”(Pilgrim 等人, 2024)。這確實(shí)是關(guān)注計(jì)算和概率信念更新的認(rèn)知方法的隱含立場(chǎng)(例如,Dasgupta 等人, 2020)。

然而,數(shù)據(jù)與信念的不對(duì)稱性——現(xiàn)有數(shù)據(jù)目前不支持信念甚至與之相悖——可以非常有用,甚至是必不可少的。它們是技術(shù)和科學(xué)進(jìn)步的原材料。它們是不確定性決策的核心要素。數(shù)據(jù)與信念的不對(duì)稱性引導(dǎo)我們的注意力尋找新數(shù)據(jù)和可能的實(shí)驗(yàn),以生成支持信念的證據(jù)。當(dāng)然,尋求數(shù)據(jù)來驗(yàn)證特定信念的想法正是妄想和一系列相關(guān)偏見的定義,包括確認(rèn)偏誤、動(dòng)機(jī)性推理、選擇性證據(jù)收集、否認(rèn)主義、自我欺騙和信念堅(jiān)持。對(duì)于局外人來說,這看起來像是“尋找支持信念的證據(jù)并對(duì)他可能證偽它的證據(jù)漠不關(guān)心的壞習(xí)慣”的完美例子(Pinker, 2021, p. 13;另見 Hahn 和 Harris, 2014)。人類動(dòng)力飛行的信念很好地說明了這一點(diǎn),因?yàn)橛凶銐虻淖C據(jù)可以證偽萊特兄弟對(duì)重于空氣飛行可能性的信念。持有不對(duì)稱信念似乎等同于“一廂情愿”或“在面對(duì)新證據(jù)時(shí)保護(hù)自己的信念”(Kruglanski 等人, 2020, p. 413;盡管參見 Anglin, 2019)。萊特兄弟不斷面臨證偽其信念的證據(jù),包括塞繆爾·蘭利在飛行上的公開失敗,或者李林塔爾飛行嘗試失敗(以及因此喪生)的知識(shí)。但在這些情況下,忽視顯著的數(shù)據(jù)和證據(jù)——不根據(jù)看似有力的證據(jù)甚至科學(xué)共識(shí)更新信念——最終被證明是正確的行動(dòng)方向。

有時(shí)候,看似非理性——忽視證據(jù)、對(duì)其解釋存在分歧,或者有選擇性地尋找正確的數(shù)據(jù)——最終被證明是正確的行動(dòng)方向。人類動(dòng)力飛行當(dāng)然是一個(gè)特別生動(dòng)的例子,盡管更平凡的人類行為也從根本上被類似的過程所刻畫(Felin 和 Koenderink, 2022)。對(duì)于目前的目的來說,最重要的是,我們的論點(diǎn)是信念本身具有因果作用,并可以通過我們采取行動(dòng)的傾向來衡量(Ramsey, 1931;Felin 等人, 2021a)。當(dāng)然,擁有信念或愿意采取行動(dòng)并不保證它們是真實(shí)的。但它們是行動(dòng)的重要?jiǎng)訖C(jī)(Bratman, 1987;Ajzen, 1991)。

再次強(qiáng)調(diào),我們對(duì)信念的強(qiáng)調(diào)不應(yīng)被視為試圖貶低數(shù)據(jù)的重要性。相反,正如我們?cè)诮酉聛硪獜?qiáng)調(diào)的,信念可以激勵(lì)基于理論的因果推理,引導(dǎo)人類注意力朝著能夠產(chǎn)生新數(shù)據(jù)、證據(jù)和實(shí)現(xiàn)新知識(shí)的行動(dòng)和實(shí)驗(yàn)方向發(fā)展。

從信念到因果推理與實(shí)驗(yàn)

信念的實(shí)現(xiàn)并非自動(dòng)的。信念的一個(gè)核心特征是它們傾向于引發(fā)因果推理和某種形式的定向?qū)嶒?yàn)。信念使行動(dòng)者能夠闡述如何干預(yù)周圍環(huán)境并生成所需證據(jù)的路徑(Felin 等人,2021b)。我們對(duì)認(rèn)知和行動(dòng)的看法更廣泛地受到理論化可以引導(dǎo)人類開發(fā)出一種底層因果邏輯的觀點(diǎn)的啟發(fā),這種邏輯使我們能夠干預(yù)世界(Pearl 和 Mackenzie, 2018;另見 Ehrig 等人, 2024)。這種對(duì)干預(yù)的傾向意味著我們并不簡(jiǎn)單地接受世界本來的樣子;相反,我們反事實(shí)地思考可能性和未來狀態(tài),并著眼于采取具體行動(dòng)、進(jìn)行實(shí)驗(yàn)和生成正確的證據(jù)。這將焦點(diǎn)從以過去為導(dǎo)向的信息處理和預(yù)測(cè)(其中數(shù)據(jù)是既定的)轉(zhuǎn)移到行動(dòng)和實(shí)驗(yàn)(其中正確的數(shù)據(jù)和證據(jù)被識(shí)別或生成)。這涉及積極質(zhì)疑和操縱因果結(jié)構(gòu),從而能夠更深入地探索假設(shè)性情境。反事實(shí)思維賦予人類探索假設(shè)性替代方案和剖析因果機(jī)制的能力,為結(jié)果的必要和充分條件提供見解(Felin 等人,2024)。這種方法與以輸入-輸出和信息處理為導(dǎo)向的人工智能和計(jì)算認(rèn)知模型以及各種以數(shù)據(jù)驅(qū)動(dòng)或貝葉斯方法為基礎(chǔ)的決策制定方法有顯著不同。基于人工智能的認(rèn)知模型主要關(guān)注基于過去關(guān)聯(lián)和相關(guān)性的模式;預(yù)測(cè)基于過去的數(shù)據(jù)。但這些方法缺乏理解底層因果結(jié)構(gòu)、假設(shè)性可能性以及可能干預(yù)的能力(參見 Felin 等人, 2021a;Ehrig 等人, 2024)。這是基于理論的因果邏輯的作用。

關(guān)注合理的干預(yù)和實(shí)驗(yàn)可以通過擴(kuò)展我們關(guān)于人類動(dòng)力飛行的例子來說明。這個(gè)例子也很好地說明了數(shù)據(jù)導(dǎo)向和基于證據(jù)的科學(xué)家對(duì)人類動(dòng)力飛行可能性的看法與像萊特兄弟這樣更具干預(yù)導(dǎo)向和基于因果邏輯的實(shí)踐者之間的區(qū)別。為了理解飛行,萊特兄弟深入研究了為什么之前的飛行嘗試未能成功,更重要的是,他們發(fā)展了一種關(guān)于飛行的因果理論。盡管失敗的飛行嘗試以及李林達(dá)爾(和其他人)的死亡被許多人用作數(shù)據(jù)來聲稱飛行是不可能的,但萊特兄弟研究了這些嘗試失敗的具體原因。諷刺的是,盡管鳥類數(shù)據(jù)的不同方面為支持和反對(duì)飛行的人提供了看似證據(jù),但科學(xué)家們利用鳥類數(shù)據(jù)來論證人類飛行是不可能的(因?yàn)橹亓繂栴})(例如 LeConte, 1888;Newcomb, 1901),而萊特兄弟則關(guān)注鳥類飛行的不同方面。萊特兄弟進(jìn)行了關(guān)于鳥類飛行和解剖學(xué)的觀察研究(為什么鳥類能夠飛行),例如仔細(xì)研究鳥類在轉(zhuǎn)彎和傾斜時(shí)的翅膀位置。

關(guān)鍵區(qū)別在于,萊特兄弟憑借他們對(duì)飛行可能性的信念,正在構(gòu)建一種關(guān)于飛行的因果理論,而不是尋找確認(rèn)或反駁飛行是否可能的數(shù)據(jù)。萊特兄弟忽視了反對(duì)者的數(shù)據(jù)和科學(xué)論點(diǎn)。從史密森學(xué)會(huì)那里,萊特兄弟請(qǐng)求并獲得了關(guān)于眾多歷史飛行嘗試的詳細(xì)信息,包括奧托·李林達(dá)爾的記錄。萊特兄弟的筆記和信件揭示了他們仔細(xì)研究了早期先驅(qū)如喬治·凱利、阿爾豐斯·佩諾和奧克塔夫·尚多的飛行嘗試和飛機(jī)(萊特和萊特,1841–1940;安德森,2004;麥卡洛,2015)。他們研究了過去飛行嘗試的各個(gè)方面:使用的飛機(jī)類型、機(jī)翼形狀和大小的細(xì)節(jié)、天氣條件以及底層的空氣動(dòng)力學(xué)假設(shè)。

萊特兄弟再次試圖發(fā)展他們自己的關(guān)于飛行的因果理論。他們的理論不僅僅是由他們反傳統(tǒng)的飛行可能的信念所驅(qū)動(dòng)(這種信念似乎沒有任何證據(jù)支持)。隨著他們仔細(xì)研究飛行的底層機(jī)制并調(diào)查飛行的因果邏輯,他們對(duì)飛行可能性的信心逐漸增強(qiáng)。最重要的是,他們的因果推理使他們能夠闡述實(shí)現(xiàn)人類動(dòng)力飛行所需解決的具體問題。萊特兄弟認(rèn)為,要實(shí)現(xiàn)飛行,必須解決三個(gè)與飛行相關(guān)的問題,即(a)升力,(b)推進(jìn)力,和(c)操控。為了說明開發(fā)基于理論的因果邏輯和識(shí)別具體問題以解決的力量,結(jié)合定向?qū)嶒?yàn),我們簡(jiǎn)要討論他們是如何解決其中一個(gè)問題的:升力問題。

在升力方面,萊特兄弟明白,要實(shí)現(xiàn)飛行,他們需要一種能夠提供足夠升力以克服飛機(jī)重量的機(jī)翼設(shè)計(jì)。事實(shí)上,著名科學(xué)家認(rèn)為人類飛行的限制因素是重量(再次引用昆蟲飛行和那些能飛與不能飛的鳥類的重量)。萊特兄弟認(rèn)為,對(duì)重量的擔(dān)憂并非不可克服。在對(duì)鳥類飛行(以及其他人的飛行嘗試)的研究基礎(chǔ)上,他們通過一系列實(shí)驗(yàn)來解決這個(gè)問題,包括構(gòu)建和測(cè)試各種翼型。他們的實(shí)驗(yàn)高度針對(duì)性且以數(shù)據(jù)為導(dǎo)向,測(cè)試了各種機(jī)翼的形狀、大小和角度。他們還很快意識(shí)到,并非一切都需要按比例測(cè)試,他們的升力實(shí)驗(yàn)可以在實(shí)驗(yàn)室條件下更安全、更經(jīng)濟(jì)地進(jìn)行。因此,他們建造了自己的風(fēng)洞。在這些風(fēng)洞中的針對(duì)性測(cè)試使萊特兄弟能夠?qū)W習(xí)升力的核心原理。他們測(cè)量了一切,并仔細(xì)記錄了他們的數(shù)據(jù)——這些數(shù)據(jù)是通過持續(xù)的實(shí)驗(yàn)操作和變化生成的。這種動(dòng)手實(shí)驗(yàn)使他們能夠收集關(guān)于不同形狀和迎風(fēng)角對(duì)升力的影響的數(shù)據(jù)。通過系統(tǒng)地變化這些參數(shù)并觀察結(jié)果,他們有效地運(yùn)用因果推理來識(shí)別升力最大化的條件。他們發(fā)現(xiàn)并完善了用于滾轉(zhuǎn)控制的機(jī)翼扭曲技術(shù),這是直接源于對(duì)機(jī)翼形狀、空氣壓力和升力之間因果關(guān)系的理解的結(jié)果。

同樣的因果推理和定向?qū)嶒?yàn)的過程對(duì)于解決另外兩個(gè)問題——推進(jìn)力和操控或控制——也是至關(guān)重要的。更廣泛地說,萊特兄弟在實(shí)現(xiàn)人類動(dòng)力飛行信念的各個(gè)方面都表現(xiàn)出了嚴(yán)謹(jǐn)?shù)目茖W(xué)態(tài)度。例如,為了確定一個(gè)適合進(jìn)行飛行嘗試的地點(diǎn),他們聯(lián)系了美國氣象局。他們已經(jīng)明確了測(cè)試飛行所需的最優(yōu)條件:他們需要四樣?xùn)|西——穩(wěn)定的風(fēng)(方向和強(qiáng)度)、開闊的空間、柔軟或沙質(zhì)的著陸面以及隱私。他們從美國氣象局收到了多個(gè)建議,并選擇了北卡羅來納州的基蒂霍克作為實(shí)地試驗(yàn)的地點(diǎn)。

萊特兄弟對(duì)飛行的探索提供了一個(gè)有用的案例研究,展示了基于理論的因果邏輯如何在信念似乎沒有得到現(xiàn)有數(shù)據(jù)、證據(jù)或科學(xué)支持的情況下實(shí)現(xiàn)信念。基于他們的理論化、研究和因果推理,萊特兄弟通過定向?qū)嶒?yàn)解決了升力、推進(jìn)力和操控等核心問題。他們的方法展示了如何在缺乏數(shù)據(jù)(甚至數(shù)據(jù)與信念相悖)的情況下,運(yùn)用因果邏輯理解和干預(yù)世界。他們?cè)陲w行方面的成功證明了如何通過系統(tǒng)化、干預(yù)導(dǎo)向的方法揭示復(fù)雜現(xiàn)象背后的因果機(jī)制,并克服現(xiàn)有數(shù)據(jù)的不足。

正如我們的論點(diǎn)所暗示的,我們認(rèn)為科學(xué)、經(jīng)濟(jì)和技術(shù)領(lǐng)域充滿了機(jī)會(huì),那些擁有不對(duì)稱信念的人可以利用基于理論的因果推理,進(jìn)行定向?qū)嶒?yàn)和問題解決(Felin 和 Zenger, 2017)。正如我們所論證的,現(xiàn)有的認(rèn)知理論過于關(guān)注數(shù)據(jù)與信念的對(duì)稱性,而不是數(shù)據(jù)與信念的不對(duì)稱性,以及后者如何能夠促進(jìn)因果推理,從而推動(dòng)異質(zhì)性的出現(xiàn)以及新奇和價(jià)值的創(chuàng)造。盡管目前對(duì)利用人工智能(AI)自動(dòng)化生成新知識(shí)和新奇性充滿熱情(例如 Csaszar 等人, 2024;Lu 等人, 2024;Manning 等人, 2024),甚至有人呼吁用 AI 替代有偏見的人類決策(例如 Kahneman, 2018),但我們認(rèn)為,至少在目前,人類的因果推理無法被 AI 系統(tǒng)或計(jì)算方法所模仿。接下來,我們將進(jìn)一步探討這一論點(diǎn)對(duì)不確定條件下的決策和戰(zhàn)略的啟示。

討論:預(yù)測(cè)在不確定性決策中的局限性

正如我們?cè)诒疚闹袕V泛討論的,人工智能(AI)和認(rèn)知科學(xué)使用了許多相同的隱喻、工具、方法以及對(duì)智力、理性和心智的推理方式。在認(rèn)知科學(xué)中,一個(gè)普遍的假設(shè)是人類心智是一種計(jì)算輸入-輸出系統(tǒng)(Christian 和 Griffiths, 2016)。計(jì)算和算法系統(tǒng)強(qiáng)調(diào)基于過去數(shù)據(jù)的預(yù)測(cè)能力。預(yù)測(cè)的核心地位得到了 AI 先驅(qū) LeCun(2017)的呼應(yīng),他認(rèn)為“預(yù)測(cè)是智能的本質(zhì)”。

顯然,AI 的預(yù)測(cè)能力是強(qiáng)大的。但在不確定性決策中(即在不可預(yù)測(cè)的情境中),預(yù)測(cè)是否也處于核心地位呢?許多人認(rèn)為情況就是這樣(例如 Davenport 和 Kirby, 2016;Kahneman, 2018)。例如,在他們的著作《預(yù)測(cè)機(jī)器:人工智能的簡(jiǎn)單經(jīng)濟(jì)學(xué)》中,Agrawal 等人(2022, 第 22–32 頁)強(qiáng)調(diào),簡(jiǎn)化到本質(zhì),“AI 是一種預(yù)測(cè)技術(shù)”。他們書中一個(gè)核心觀點(diǎn)是,“預(yù)測(cè)是不確定性決策的核心”(Agrawal 等人, 2022, 第 7 頁,強(qiáng)調(diào)為原文所加)。總結(jié)我們?cè)诒疚闹械恼擖c(diǎn),我們不同意對(duì)預(yù)測(cè)的重視程度——尤其是 AI 中所體現(xiàn)的預(yù)測(cè)形式(即基于過去數(shù)據(jù)的預(yù)測(cè))——特別是在不確定性情境中。由于對(duì)預(yù)測(cè)的重視是普遍存在的,因此值得仔細(xì)探討我們?yōu)楹尾煌鈱?duì)預(yù)測(cè)的重視。

Agrawal 等人(2022)的論點(diǎn)為我們提供了一個(gè)有用的方式,讓我們能夠清晰地表達(dá)我們對(duì)預(yù)測(cè)所受重視的更一般性擔(dān)憂。他們的論點(diǎn)可以總結(jié)為一種相對(duì)常見的因果鏈(某種意義上的),從數(shù)據(jù)到信息,再到預(yù)測(cè)和決策,簡(jiǎn)而言之,即數(shù)據(jù) → 信息 → 預(yù)測(cè) → 決策。他們特別指出,“數(shù)據(jù)提供了能夠?qū)崿F(xiàn)預(yù)測(cè)的信息”,而預(yù)測(cè)反過來則是“我們決策的一個(gè)關(guān)鍵輸入”。這種從數(shù)據(jù)到信息、再到預(yù)測(cè)和決策的因果鏈當(dāng)然具有直觀的吸引力,并且反映了 AI 系統(tǒng)所擅長(zhǎng)的:接收大量輸入和數(shù)據(jù),處理這些信息,然后做出可以用于決策的預(yù)測(cè)。簡(jiǎn)而言之,正如 Agrawal 等人(2022)和許多其他人所強(qiáng)調(diào)的,數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)不僅是語言模型的核心,也是更廣泛的 AI 的核心,并且在認(rèn)知中占據(jù)中心舞臺(tái)。

但正如我們?cè)诒疚闹卸啻螐?qiáng)調(diào)的,問題是現(xiàn)有的數(shù)據(jù)——目前可用或既定的數(shù)據(jù)——在做出前瞻性決策時(shí)不太可能是最佳的信息和預(yù)測(cè)來源。數(shù)據(jù)是對(duì)過去的快照或鏡像。即使是大量的數(shù)據(jù)也不太可能讓人能夠預(yù)見到未來(Felin 等人, 2014)。我們需要的是一種機(jī)制,用于投射未來,并識(shí)別相關(guān)的數(shù)據(jù)和證據(jù),或者更有可能的是,通過實(shí)驗(yàn)生成新的數(shù)據(jù)。這就是理論和某種形式的因果推理的作用,而這些是基于數(shù)據(jù)優(yōu)先和預(yù)測(cè)導(dǎo)向的 AI 和認(rèn)知方法中所缺失的關(guān)鍵要素。我們承認(rèn),在各種常規(guī)和重復(fù)性決策中,預(yù)測(cè)無疑是一個(gè)有用的工具。基于數(shù)據(jù)的預(yù)測(cè)在可預(yù)測(cè)的情境中可以非常強(qiáng)大:這些情境與過去匹配或從過去外推而來。這正是 AI 和基于預(yù)測(cè)的認(rèn)知所擅長(zhǎng)的,即最小化意外和減少誤差。更廣泛地說,這也與許多判斷和決策學(xué)者對(duì)一致性的強(qiáng)烈強(qiáng)調(diào)以及避免噪聲的急切愿望相符合(參見 Kahneman 等人, 2021)。

但許多重要決策并不是關(guān)于通過使用現(xiàn)有數(shù)據(jù)最小化誤差來減少不確定性。決策的很大一部分目的更多是關(guān)于(在某種意義上)最大化意外和誤差,或者對(duì)其他人來說可能看起來像是誤差。在戰(zhàn)略情境中,最具影響力的機(jī)會(huì)和價(jià)值來源并不是基于立即可用的數(shù)據(jù)。相反,像這樣的重要決策需要開發(fā)一種理論,基于某種異質(zhì)性信念,描繪出一條因果路徑或邏輯,用于測(cè)試?yán)碚摗⑦M(jìn)行實(shí)驗(yàn)并收集新證據(jù)以實(shí)現(xiàn)信念。在一個(gè)重要的意義上,戰(zhàn)略決策更多地與不可預(yù)測(cè)性和最大化意外有關(guān),而不是與預(yù)測(cè)和最小化意外有關(guān)。有些決策具有高度影響力、低頻率、罕見性,并充滿不確定性(Camuffo 等人, 2022),因此,它們根本無法通過使用現(xiàn)有數(shù)據(jù)的算法處理。這就是為什么基于理論的因果推理不是關(guān)于適當(dāng)?shù)乇硎经h(huán)境結(jié)構(gòu),也不是關(guān)于有限理性或傾聽客戶;而是關(guān)于開發(fā)一種前瞻性理論和因果邏輯,用于實(shí)驗(yàn)和創(chuàng)造價(jià)值(Felin 等人, 2024)。

請(qǐng)注意,我們對(duì)不可預(yù)測(cè)性和意外的強(qiáng)調(diào)并不意味著我們超出了科學(xué)或數(shù)據(jù)的范疇。恰恰相反。做出前瞻性決策的過程是關(guān)于開發(fā)一種基于理論的底層因果邏輯,用于干預(yù)世界:本質(zhì)上,描繪出一條因果路徑,說明如何從 A 點(diǎn)(當(dāng)前世界的狀態(tài))到達(dá) B 點(diǎn)(假設(shè)的未來世界狀態(tài))。理論為正確的干預(yù)、實(shí)驗(yàn)和新數(shù)據(jù)創(chuàng)造了顯著性,從而實(shí)現(xiàn)了最初看似不可信的信念。理論在生成對(duì)可觀察事物的顯著性方面發(fā)揮著核心作用;數(shù)據(jù)(或觀察)的概念本身是依賴于理論的。正如愛因斯坦所說:“你是否能夠觀察到某件事物取決于你所使用的理論。正是理論決定了什么是可以被觀察的”(Polanyi, 1974, 第 604 頁)。對(duì)正確的(或新的)數(shù)據(jù)或?qū)嶒?yàn)形式的顯著性是由理論賦予的,而不是由過去的數(shù)據(jù)賦予的。在這個(gè)意義上,理論可以說具有預(yù)測(cè)功能,盡管這里的預(yù)測(cè)并不是 AI(Agrawal 等人, 2022)和認(rèn)知科學(xué)(參見 Clark, 2018)中定義和操作化的那種數(shù)據(jù)驅(qū)動(dòng)或最小化誤差的過程。現(xiàn)在,如果手頭的任務(wù)是常規(guī)和平凡的——例如,“預(yù)測(cè)這句話中的下一個(gè)詞”或“告訴我你接下來期望看到什么”——那么基于現(xiàn)有數(shù)據(jù)的預(yù)測(cè)可能是有用的。但基于理論的觀點(diǎn)更多地關(guān)注認(rèn)知的前瞻性方面,以及人類主體如何通過開發(fā)一個(gè)多步驟的因果路徑來實(shí)現(xiàn)信念,通過實(shí)驗(yàn)和問題解決實(shí)現(xiàn)信念。這正是我們關(guān)于萊特兄弟的飛行理論——以及因果推理和實(shí)驗(yàn)——所展示的。它是一個(gè)微觀縮影,展示了人類如何更廣泛地干預(yù)他們的環(huán)境并實(shí)現(xiàn)新的信念。經(jīng)濟(jì)領(lǐng)域充滿了經(jīng)濟(jì)主體如何參與這一過程的例子(Felin 和 Zenger, 2017)。

我們對(duì)意外和不可預(yù)測(cè)性的強(qiáng)調(diào)——而不是可預(yù)測(cè)性和最小化誤差——在競(jìng)爭(zhēng)環(huán)境中尤其重要。如果每個(gè)人都能接觸到相同的預(yù)測(cè)機(jī)器和與 AI 相關(guān)的信息處理工具,那么結(jié)果很可能是同質(zhì)化的。戰(zhàn)略如果要真正創(chuàng)造新價(jià)值,就需要是獨(dú)特且企業(yè)特定的。而這種企業(yè)特定性與獨(dú)特信念和開發(fā)基于理論的價(jià)值創(chuàng)造邏輯有關(guān),這種邏輯對(duì)其他人來說是不可預(yù)見的(不可預(yù)測(cè)的)。理論使經(jīng)濟(jì)主體能夠破解競(jìng)爭(zhēng)性要素市場(chǎng)(Barney, 1986),以開發(fā)關(guān)于資產(chǎn)和活動(dòng)價(jià)值的獨(dú)特預(yù)期。理論還使企業(yè)能夠以更有針對(duì)性的方式進(jìn)行搜索(Felin 等人, 2023),而不是從事成本高昂且耗盡精力的全球搜索形式。盡管有嘗試對(duì)預(yù)測(cè)引擎進(jìn)行微調(diào),但它們本質(zhì)上是基于過去的頻率、相關(guān)性和平均值,而不是極端情況。而在許多情況下,正是極端情況最終更有趣,因?yàn)樗鼈兲峁┝撕髞砦覀円暈槔硭?dāng)然的(最終)信念和數(shù)據(jù)的種子。

總的來說,我們不同意在決策和認(rèn)知中對(duì)預(yù)測(cè)、算法處理和計(jì)算的重視(例如 Christian 和 Griffiths, 2016;Agrawal 等人, 2022)。人類決策不應(yīng)被交給人工智能(參見 Kahneman, 2018)。人工智能及其啟發(fā)的認(rèn)知模型基于回顧性數(shù)據(jù)和預(yù)測(cè),而不是任何前瞻性、基于理論的因果邏輯。強(qiáng)調(diào)或依賴數(shù)據(jù)和預(yù)測(cè),不僅是決策和認(rèn)知的嚴(yán)重局限,也是理解知識(shí)生成甚至科學(xué)進(jìn)步的嚴(yán)重局限。因此,我們強(qiáng)調(diào)異質(zhì)性信念在人類認(rèn)知中的重要性,以及開發(fā)基于理論的因果邏輯的重要性,這種邏輯能夠推動(dòng)實(shí)驗(yàn)和新數(shù)據(jù)以及新奇性的產(chǎn)生。

未來研究機(jī)會(huì)

上述論點(diǎn)揭示了許多研究機(jī)會(huì),尤其是在理解人工智能(AI)、新奇性產(chǎn)生以及不確定性決策方面。首先,研究人類(例如經(jīng)濟(jì)主體)何時(shí)以及如何利用與 AI 相關(guān)的工具來創(chuàng)造新價(jià)值或輔助決策是一個(gè)機(jī)會(huì)。如果 AI 作為一種認(rèn)知工具要成為競(jìng)爭(zhēng)優(yōu)勢(shì)的來源,它必須以獨(dú)特或企業(yè)特定的方式被利用。使用普遍可用的訓(xùn)練數(shù)據(jù)的 AI 必然會(huì)產(chǎn)生通用且非特定的輸出。存在一種風(fēng)險(xiǎn),即現(xiàn)成的 AI 解決方案容易受到信息技術(shù)“生產(chǎn)力悖論”的影響(Brynjolfsson 和 Hitt, 1998),在這種情況下,對(duì) AI 的投資實(shí)際上并沒有為購買這些工具的人帶來任何收益(而只是為出售這些技術(shù)的人帶來收益)。因此,研究特定決策者(例如企業(yè))自身的價(jià)值理論如何推動(dòng) AI 開發(fā)和采用的過程是一個(gè)機(jī)會(huì)。為了讓 AI 真正成為戰(zhàn)略和決策的有用工具,AI 需要被定制化、針對(duì)性訓(xùn)練和微調(diào)——它需要變得具體化——以適應(yīng)決策者的理論、獨(dú)特的因果推理、數(shù)據(jù)集和專有文件。例如,檢索增強(qiáng)生成的進(jìn)步似乎為在戰(zhàn)略決策中使用 AI 提供了一種增強(qiáng)特定性的有前景的途徑。在尋求獨(dú)特的 AI 驅(qū)動(dòng)輸出時(shí),任何 AI 的采用都應(yīng)該謹(jǐn)慎選擇哪些語料庫和訓(xùn)練數(shù)據(jù)被利用(以及哪些不被利用)。畢竟,AI 的輸出——被定制化為使用特定數(shù)據(jù)——也是人類主體的產(chǎn)物,他們決定哪些數(shù)據(jù)與手頭的決策相關(guān)(哪些不相關(guān))。正是在這里,我們看到了一個(gè)機(jī)會(huì),去理解人類如何獨(dú)特地與 AI 互動(dòng),以生成這些工具以及相關(guān)的人類-AI 接口。早期的研究已經(jīng)開始探討企業(yè)如何利用 AI 來增加創(chuàng)新,或者各種人類-AI 混合解決方案如何實(shí)現(xiàn)更好的決策(例如 Gregory 等人, 2021;Clough 和 Wu, 2022;Choudhary 等人, 2023;Girotra 等人, 2023;Kemp, 2023;Babina 等人, 2024;Bell 等人, 2024;Jia 等人, 2024;Kim 等人, 2024;Raisch 和 Fomina, 2024;Tranchero 等人, 2024)。然而,研究特定經(jīng)濟(jì)主體或企業(yè)自身的理論和因果邏輯——以及他們獨(dú)特或企業(yè)特定的數(shù)據(jù)和信息來源——如何塑造 AI 相關(guān)工具的開發(fā)或采用以執(zhí)行戰(zhàn)略和做出決策,仍有很大的機(jī)會(huì)。

其次,研究和開發(fā)人類與 AI 在不同類型任務(wù)、問題和決策中的各自能力的分類法,存在持續(xù)的機(jī)會(huì)。關(guān)于 AI 取代人類的前景,存在許多興奮、炒作和恐懼(參見 Grace 等人, 2024)。然而,在現(xiàn)實(shí)中,人類和 AI 之間可能會(huì)有一種分工,雙方各自專注于最適合它們的任務(wù)、問題和決策類型。研究經(jīng)濟(jì)主體和組織如何根據(jù)情境將人類(及其認(rèn)知能力、工作和角色)與算法(或 AI 相關(guān)工具)匹配到正確的任務(wù)和決策中,是一個(gè)機(jī)會(huì)。目前,顯然 AI 非常適合重復(fù)性、計(jì)算密集型的任務(wù)和決策,這些任務(wù)和決策直接從過去的數(shù)據(jù)中推導(dǎo)而來。人類做出的許多決策相對(duì)常規(guī),適合算法處理。因此,AI 毫無疑問將在管理的許多領(lǐng)域發(fā)揮關(guān)鍵作用,特別是在重復(fù)性流程的領(lǐng)域,例如運(yùn)營(Holmstr?m 等人, 2019;Amaya 和 Holweg, 2024;關(guān)于金融的研究,參見 Eisfeldt 和 Schubert, 2024)。然而,有些決策是低頻率且罕見的(Camuffo 等人, 2022),因此不適合 AI。在這里,我們預(yù)計(jì)人類將繼續(xù)發(fā)揮核心作用,因?yàn)槿祟惸軌蜻M(jìn)行前瞻性理論化和超越現(xiàn)有數(shù)據(jù)的因果邏輯開發(fā)。當(dāng)然,常規(guī)與非常規(guī)決策之間存在一個(gè)滑動(dòng)尺度(以及接口)。即使在罕見且影響重大的決策制定中,AI 也可能發(fā)揮作用,或許可以作為一種額外的聲音或在生成或考慮各種策略時(shí)的陪練伙伴。正如我們?cè)诒疚闹杏懻摰模珹I 和人類各自有其優(yōu)勢(shì)和局限性。現(xiàn)有研究?jī)A向于在相同的基準(zhǔn)上比較 AI 和人類,而不是認(rèn)識(shí)到各自的長(zhǎng)處。研究 AI 和人類的比較能力——它們各自的長(zhǎng)處、局限性和持續(xù)演變——為未來的研究提供了重要的機(jī)會(huì)。

第三,我們的論點(diǎn)指向了關(guān)于人類本質(zhì)——尤其是人類認(rèn)知的所謂計(jì)算性質(zhì)——的更基礎(chǔ)性問題。盡管關(guān)于認(rèn)知本質(zhì)的問題可能聽起來過于抽象和哲學(xué)化,但它們至關(guān)重要,因?yàn)樗鼈儗?duì)我們所做的假設(shè)和所采用的方法有下游影響。在這里,我們呼應(yīng)西蒙(Simon, 1985b, 第 303 頁,強(qiáng)調(diào)為原文所加)的觀點(diǎn),他認(rèn)為“沒有什么比我們對(duì)人類本質(zhì)的看法更重要,它決定了我們的研究議程和指導(dǎo)我們的研究方法,因?yàn)槲覀冄芯康氖侨祟惖男袨椤!蹦敲矗珹I 和認(rèn)知科學(xué)(進(jìn)而擴(kuò)展到經(jīng)濟(jì)學(xué)和戰(zhàn)略領(lǐng)域)中關(guān)于人類認(rèn)知的主導(dǎo)觀點(diǎn)是什么?人類的主導(dǎo)觀點(diǎn)是,他們是一種從事信息處理的輸入-輸出設(shè)備,類似于計(jì)算機(jī)。在本文中,我們指出了關(guān)于人類心智、大腦和認(rèn)知的計(jì)算機(jī)隱喻的長(zhǎng)期存在的問題。計(jì)算機(jī)已經(jīng)成為人類認(rèn)知的核心、組織性隱喻,從艾倫·圖靈和赫伯特·西蒙的工作到現(xiàn)代人工神經(jīng)網(wǎng)絡(luò)、預(yù)測(cè)處理和貝葉斯大腦的實(shí)例,這種隱喻已經(jīng)存在了超過七十年(例如 Knill 和 Pouget, 2004;Cosmides 和 Tooby, 2013;Kotseruba 和 Tsotsos, 2020;Russell 和 Norvig, 2022;Sun, 2023;Gigerenzer 和 Goldstein, 2024)。然而,對(duì)認(rèn)知的通用計(jì)算方法并沒有考慮到被研究生物體的比較性質(zhì),因?yàn)槿祟悺⑸矬w和機(jī)器都被視為相同的——不變的(參見 Simon, 1990;參見 Simon, 1980;Gershman 等人, 2015)。但認(rèn)知存在顯著差異,這些差異值得仔細(xì)關(guān)注。例如,計(jì)算機(jī)并不能有意義地決定哪些輸入可能是相關(guān)的,哪些可能不是,也不能有意義地識(shí)別一個(gè)新的輸入,而人類可以控制他們首先選擇或生成哪些輸入(Yin, 2020;Brembs, 2021;Felin 和 Koenderink, 2022)。正如我們所討論的,人類認(rèn)知是一種前瞻性理論化和因果推理的形式。請(qǐng)注意,我們并不是在這里試圖為某種人類例外主義辯護(hù),因?yàn)檫@些能力以不同的方式廣泛存在于更廣泛的生物有機(jī)體中(Riedl, 1984;參見 Popper, 1991)。研究使生物有機(jī)體和經(jīng)濟(jì)主體能夠進(jìn)行理論化、推理和實(shí)驗(yàn)的內(nèi)生和比較因素,并比較各種形式的生物智能與人工和非生物形式的智能,存在重要的研究機(jī)會(huì)(參見 Levin, 2024)。將所有認(rèn)知和智能視為通用計(jì)算,不必要地縮小了理論和實(shí)證工作的范圍,并從根本上錯(cuò)過了智能在不同系統(tǒng)中表現(xiàn)出來的豐富和異質(zhì)性方式。此外,生物和非生物智能形式之間的接口——正如人類在進(jìn)化中使用技術(shù)和工具所表現(xiàn)出來的(Felin 和 Kauffman, 2023)——為未來的研究提供了令人興奮的機(jī)會(huì)。

結(jié)論

在本文中,我們關(guān)注人工智能(AI)與人類之間的認(rèn)知差異。盡管受 AI 啟發(fā)的認(rèn)知模型繼續(xù)強(qiáng)調(diào)機(jī)器與人類之間的相似性,我們認(rèn)為 AI 對(duì)預(yù)測(cè)(基于過去數(shù)據(jù))的強(qiáng)調(diào)無法捕捉人類認(rèn)知的本質(zhì);也就是說,它既無法解釋新奇性或新知識(shí)的產(chǎn)生,也無法在不確定性決策中提供幫助。總體而言,我們承認(rèn) AI 與人類認(rèn)知之間存在一定的相似性。但我們特別強(qiáng)調(diào)人類認(rèn)知的前瞻性本質(zhì),以及基于理論的因果推理如何使人類能夠干預(yù)世界、進(jìn)行定向?qū)嶒?yàn)并發(fā)展新知識(shí)。異質(zhì)性信念和理論——數(shù)據(jù)與信念的不對(duì)稱性——使得人類能夠識(shí)別或生成新數(shù)據(jù)(例如通過實(shí)驗(yàn)),而不僅僅是依賴于基于過去數(shù)據(jù)的預(yù)測(cè)。基于 AI 的計(jì)算模型必然建立在數(shù)據(jù)與信念的對(duì)稱性之上。因此,AI 無法像大型語言模型(LLMs)所展示的那樣因果性地映射、投射或預(yù)見未來。當(dāng)然,我們的論點(diǎn)絕非否定或質(zhì)疑 AI 領(lǐng)域內(nèi)許多令人興奮的發(fā)展。我們預(yù)計(jì) AI 將幫助人類在許多領(lǐng)域做出更好的決策,尤其是在以常規(guī)和重復(fù)為特征的環(huán)境中。然而,不確定性決策——鑒于其對(duì)不可預(yù)測(cè)性、意外和新奇性的強(qiáng)調(diào)——提供了一個(gè)領(lǐng)域,這一領(lǐng)域并不容易適應(yīng)基于數(shù)據(jù)或頻率的預(yù)測(cè)以及相關(guān)的計(jì)算。因此,我們從根本上質(zhì)疑 AI 將(或應(yīng)該)取代人類決策的觀點(diǎn)(例如,Kahneman, 2018)。我們認(rèn)為,與計(jì)算機(jī)和 AI 相比,人類具有獨(dú)特的認(rèn)知能力,這些能力集中在前瞻性信念和理論化上:即從事新奇因果推理和實(shí)驗(yàn)的能力。

原文鏈接: https://pubsonline.informs.org/doi/full/10.1287/stsc.2024.0189

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
震撼!女生竟都排隊(duì)預(yù)約打G潮針?一針解決松弛干澀,打完能上天

震撼!女生竟都排隊(duì)預(yù)約打G潮針?一針解決松弛干澀,打完能上天

烏娛子醬
2025-04-26 11:48:03
外媒:“一把椅子”引發(fā)爭(zhēng)議,法國一政黨領(lǐng)袖要求“馬克龍辭職”

外媒:“一把椅子”引發(fā)爭(zhēng)議,法國一政黨領(lǐng)袖要求“馬克龍辭職”

環(huán)球網(wǎng)資訊
2025-04-27 21:58:31
多名湖人隊(duì)記談G3:東契奇生病不該上場(chǎng)!狀態(tài)不佳造成極大傷害

多名湖人隊(duì)記談G3:東契奇生病不該上場(chǎng)!狀態(tài)不佳造成極大傷害

Emily說個(gè)球
2025-04-27 04:57:21
基本盤!布倫森半場(chǎng)10中4&三分5中2貢獻(xiàn)12分5板7助 沖下3前場(chǎng)板

基本盤!布倫森半場(chǎng)10中4&三分5中2貢獻(xiàn)12分5板7助 沖下3前場(chǎng)板

直播吧
2025-04-28 02:24:05
一夜之間,又變卦了!黃金要新高?

一夜之間,又變卦了!黃金要新高?

萌生財(cái)經(jīng)
2025-04-27 09:43:48
復(fù)牌!301323,重大資產(chǎn)重組

復(fù)牌!301323,重大資產(chǎn)重組

證券時(shí)報(bào)e公司
2025-04-27 20:27:12
現(xiàn)在的國央企,到底有沒有編制(史上最全科普文)

現(xiàn)在的國央企,到底有沒有編制(史上最全科普文)

身在國企心在江湖
2025-04-27 13:34:40
泰王新寵歐拉弄代班主持,戴碩大珍珠項(xiàng)鏈卻駝背,氣質(zhì)難比蘇提達(dá)

泰王新寵歐拉弄代班主持,戴碩大珍珠項(xiàng)鏈卻駝背,氣質(zhì)難比蘇提達(dá)

譯言
2025-04-28 00:27:52
李現(xiàn)有X癮癥!?

李現(xiàn)有X癮癥!?

八卦瘋叔
2025-04-27 10:54:05
虧損就不賣了!4月家電市場(chǎng)有廠商直接躺平

虧損就不賣了!4月家電市場(chǎng)有廠商直接躺平

家電圈
2025-04-25 20:06:26
梅拉尼婭戴黑紗現(xiàn)身教皇葬禮,面部僵硬下垂,特朗普家族被厭煩

梅拉尼婭戴黑紗現(xiàn)身教皇葬禮,面部僵硬下垂,特朗普家族被厭煩

譯言
2025-04-27 00:05:03
克林頓揭美國老底:當(dāng)年為了對(duì)抗志愿軍,美國派出了283萬兵力!

克林頓揭美國老底:當(dāng)年為了對(duì)抗志愿軍,美國派出了283萬兵力!

今日養(yǎng)生之道
2025-04-28 00:39:31
劉詩詩吳奇隆現(xiàn)身機(jī)場(chǎng),婚變傳聞該破了!他們給所有人提了個(gè)醒

劉詩詩吳奇隆現(xiàn)身機(jī)場(chǎng),婚變傳聞該破了!他們給所有人提了個(gè)醒

界史
2025-04-26 15:39:38
丑哭了!華表獎(jiǎng)上的關(guān)曉彤,造型太不忍直視,又老又壯土出新高度

丑哭了!華表獎(jiǎng)上的關(guān)曉彤,造型太不忍直視,又老又壯土出新高度

涵豆說娛
2025-04-27 21:25:52
美專家意見罕見一致,中國若一統(tǒng)兩岸,美國或只剩下一條路可走

美專家意見罕見一致,中國若一統(tǒng)兩岸,美國或只剩下一條路可走

荷蘭豆愛健康
2025-04-27 10:01:19
項(xiàng)立剛:不少教授出來說董明珠的人才觀已經(jīng)落后了,看的我直發(fā)笑

項(xiàng)立剛:不少教授出來說董明珠的人才觀已經(jīng)落后了,看的我直發(fā)笑

漣漪讀史
2025-04-27 16:54:22
19歲的朝鮮女孩嫁到廣州,7年后第一次回家,丈夫給了她1萬塊錢

19歲的朝鮮女孩嫁到廣州,7年后第一次回家,丈夫給了她1萬塊錢

紅豆講堂
2025-04-24 10:37:36
中國已做好最充足的準(zhǔn)備,如果俄羅斯打贏了,我們或要做三件事

中國已做好最充足的準(zhǔn)備,如果俄羅斯打贏了,我們或要做三件事

陣匠
2025-04-24 09:46:16
湖人消息:老詹鎖定二陣,小里慘遭壓制,G4出場(chǎng)更新

湖人消息:老詹鎖定二陣,小里慘遭壓制,G4出場(chǎng)更新

冷月小風(fēng)風(fēng)
2025-04-27 10:37:02
61歲大媽午飯后離世!勸告:別在飯后做這5件事,很多老人不聽勸還在做

61歲大媽午飯后離世!勸告:別在飯后做這5件事,很多老人不聽勸還在做

王曉愛體彩
2025-04-18 12:00:31
2025-04-28 03:52:49
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
526文章數(shù) 9關(guān)注度
往期回顧 全部

科技要聞

充1秒跑2.5公里,寧德時(shí)代比亞迪華為激戰(zhàn)

頭條要聞

用馬斯克理念改造生產(chǎn)線 95后女生創(chuàng)業(yè)1年銷售額上億

頭條要聞

用馬斯克理念改造生產(chǎn)線 95后女生創(chuàng)業(yè)1年銷售額上億

體育要聞

我們來自北極圈,我們有全球最恐怖的主場(chǎng)!

娛樂要聞

華表獎(jiǎng)獲獎(jiǎng)名單!張譯二影帝惠英紅勇影后

財(cái)經(jīng)要聞

2千億!核電開閘 國常會(huì)核準(zhǔn)10臺(tái)新機(jī)組

汽車要聞

蔚來李斌的"十年磨一劍" 從看得見 到看不見

態(tài)度原創(chuàng)

房產(chǎn)
旅游
時(shí)尚
本地
游戲

房產(chǎn)要聞

首開2小時(shí)熱銷超 200 套!天河芯紅盤憑什么交出樓市滿分答卷?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

5條適合春天的裙子、褲子!溫柔顯瘦美到爆炸!

本地新聞

云游湖北 | 漢川文旅新體驗(yàn):千年陶藝邂逅湖光

讓一追二,TES戰(zhàn)勝JDG!網(wǎng)友:TES殺瘋了!

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 濮阳县| 丘北县| 浦江县| 汾阳市| 永昌县| 天台县| 遵化市| 鄂州市| 武定县| 自贡市| 宁强县| 凌云县| 息烽县| 泽普县| 资讯 | 嘉禾县| 禄丰县| 双流县| 临湘市| 荆州市| 驻马店市| 三台县| 鹤山市| 柯坪县| 叶城县| 宁明县| 洪雅县| 北流市| 仁化县| 崇义县| 上栗县| 苏尼特左旗| 黑水县| 北海市| 龙游县| 白河县| 五河县| 鄂尔多斯市| 视频| 古蔺县| 北宁市|