A Computational Model of Minimal Phenomenal Experience (MPE)
《最小現象體驗(MPE)的計算模型》
https://www.preprints.org/frontend/manuscript/2c5592c69907b50f46348753274b894b/download_pub
摘要:
最小現象體驗(MPE),或稱“純粹意識”,是一種基礎的意識體驗形式,其特征是具有反身性元意識,且缺乏常規現象學中的許多特征。它被描述為例如非概念化的、非時間性的、無自我的、無視角的。本文旨在利用自由能量原理(FEP)推導出的變分自由能量最小化的數學方法,開發一個MPE的計算模型。我采用計算神經現象學方法,在主動推斷框架內形式化MPE的關鍵現象學特征。該模型包含參數深度,允許對生成模型參數進行高階推斷。我將特定的模型參數化與報告的MPE品質(如元意識、平靜、無努力感和非概念化)聯系起來。所提出的模型表明,當一個主體通過自我導向的意識和對其生成模型的調節實現極低的自由能量時,尤其是通過強調對意識本身的意識,MPE就會產生。該模型預測了MPE現象學的元素,包括一種無努力感、無時間感以及“零人稱視角”的可能性。文中概述了對所提模型進行模擬的實施細節,以及實證驗證的方向。
關鍵詞:自由能量原理;現象學;純粹意識;最小現象體驗;計算建模
1. 引言
本文的背景是托馬斯·梅青格(Thomas Metzinger)發起的關于人類意識的最小模型解釋的研究計劃(Ramstead, Albarracin, Kiefer, Williford, et al., 2023; Wiese, 2020)。他認為,任何對意識的解釋都應首先努力解釋我們能夠識別出的該現象的最簡單版本。這引發了問題:人類所具有的最簡單的意識體驗形式是什么?為了回答這一問題,梅青格開展了一項雄心勃勃的現象學調查,記錄了數百名報告經歷過(或正在經歷)一種絕對簡化后的“最小現象體驗”(MPE)的個體的經歷(Metzinger, 2020),這種體驗也被稱為“純粹意識”。
“MPE項目”的研究成果被記錄在梅青格最近出版的《盲人摸象》(Metzinger, 2024)一書中,書中記錄了MPE中常見的、被廣泛報告的特征或品質的集群。他的研究發現,存在一個現象學集群,這些看似相關的體驗主要由經驗豐富的冥想修行者報告。這些體驗的標志在于其簡單性,MPE似乎缺乏我們通常會期望的許多特征,例如概念性內容、時間感,甚至主觀視角。對這種簡單但不常見的體驗的解釋,或許可以為意識研究搭建一個穩固的基礎框架,或者至少作為一個任何意識理論都必須解釋的經驗數據點。
然而,本文的主要目的并非為某種意識理論提供證據。相反,我的目標是概述一種從事計算現象學的方法,并通過開發對MPE的初步解釋來展示其潛力,我和其他人可以在這一基礎上繼續構建。這種方法的價值在于它為我們提供了一種用于解釋和理解我們體驗的計算語言,尤其是與MPE和冥想實踐相關的引人入勝且常常具有變革性的現象學。這些感知模式對于體驗者本身具有深遠的內在價值,因此,對MPE的機制性解釋的價值超越了它對候選意識理論所提供的證據。此處所呈現的計算現象學最好被理解為一種嚴謹的概念框架,用于促進我們對自己親身體驗的第一人稱研究(“指向月亮的激光”)。我認為,這項工作的真正“成果”在于對意識的直接體驗性認知。因此,此處的主張是實用主義的,而非形而上學的。這項工作為底層建模框架作為意識理論的有效性所提供的任何證據,是一種次要效應,供讀者自行解讀,并非核心動機。
本文提出的模型是對梅青格在《盲人摸象》(Metzinger, 2024, pp. 475–477)中最初提出的模型的迭代更新,以涵蓋MPE更廣泛的現象學特征。建模方法基于一種被稱為計算神經現象學(Ramstead et al., 2022; Sandved-Smith et al., 2024)的方法論,該方法利用了從自由能量原理(FEP)(Friston, 2019)推導出的變分自由能量最小化的數學方法。FEP認為,持續存在于時間中的生命系統可以被理解為對其環境進行一種變分貝葉斯推斷(Da Costa et al., 2020; Da Costa, Friston, et al., 2021; Friston et al., 2022)。使基于FEP的計算神經現象學成為可能的核心假設是,這種變分推斷所產生的(貝葉斯)信念,即變分密度,可以用來建模第一人稱現象學(Hohwy, 2013)。這可以被視為弗朗西斯科·瓦雷拉(Francisco Varela)最初提出的第一代神經現象學(NPh)研究計劃的現代版本(Varela, 1996, 1997)。
鑒于MPE的證據庫主要是現象學報告,在本文中,我通過形式化MPE現象學的幾個選定特征來構建解釋模型。對于每個特征,我都探討它如何可以用計算語言來描述,從而構建起一組計算約束條件,這些條件將為所提出的MPE模型提供信息。基于FEP的神經現象學的一個獨特之處在于,這個基于現象學構建的模型,原則上可以生成神經生物學預測,以測試并進一步完善所提出的模型以及我們對MPE的理解。
接下來,我首先簡要概述自由能量原理及其與本文所采用的計算神經現象學方法的關系。然后,我將對MPE的幾個關鍵現象學特征進行計算解釋。在這些要素的基礎上,我構建了一個關于MPE的提議模型。請參閱附錄以了解模擬實現細節和由此提議得出的神經生物學預測。
在此過程中,一個假設逐漸浮現:MPE代表個體處于極低自由能量狀態的現象學,這種狀態是通過遞歸自我建模和優化自身生成模型參數實現的。
2. 從自由能量原理到深度主動推斷
為了構建一個能夠解釋最小現象體驗(MPE)核心特征的計算模型,我們需要一個穩健的建模框架。這里采用的框架被稱為主動推斷框架(AIF)(Smith et al., 2022),它是自由能量原理應用于主體系統的一個特定應用。除了對其環境進行變分推斷之外,主體系統還會執行自主行動以最小化自由能量,這使它們具備了規劃和決策的能力。這意味著不僅要最小化基于當前和過去感覺數據的變分自由能量,還要最小化預期自由能量(EFE),后者基于對選擇特定行動方案(策略)后將接收到的感覺輸入的預測。值得注意的是,通過行動來最小化自由能量,等同于最大化對自身和環境生成模型的證據,這一過程被稱為自我證實(Hohwy, 2016)。
如上所述,我們假設現象學與后驗分布的動態有關,即狀態推斷。實際上,這意味著我們在尋找可能與參與者報告的MPE特定特征相關聯的狀態推斷,以及這些推斷形成的依據。
本文提出的計算模型采用部分可觀測馬爾可夫決策過程(POMDP)的形式,這是一種常見的方法,用于建模主動推斷主體感知和行動背后信念更新的過程。
特別是,這種模型表現出一種反身性或深度。在之前的研究中,我們曾提出,對認知狀態的意識以及心理行動可以通過一個具有參數深度的分層主動推斷模型來建模(Sandved-Smith et al., 2021)。這種深度使主體能夠對其他推斷過程的參數進行高階推斷,即形成關于信念的信念。這正式捕捉了元認知或“深度推斷”的概念(Da Costa & Sandved-Smith, 2024; Sandved-Smith & Da Costa, 2024),并為心理或隱蔽行動提供了機制。
在本文中,我將采用同樣的方法。這很重要,因為它為基于觀察自身模型參數的狀態推斷提供了一種機制。如果沒有這種深度,現象體驗(即狀態推斷)就只涉及外部狀態,主體無法感知其感知是如何形成的(即推斷中涉及的生成模型的參數)。感知形成的過程對主體來說將是“透明的”,因為主體是通過其生成模型的參數化來看待世界的。當主體能夠通過觀察其內部參數進行二階推斷時,我們說它們使生成模型中一個原本透明的方面變得“不透明”(Metzinger, 2003; Limanowski & Friston, 2018)。這使得主體能夠形成后驗信念,用于建模人類現象學更深層次的方面,例如對認知狀態的意識,以及如我們即將看到的——對意識本身的意識。
3. 方法論
本文所提出的模型的新穎之處之一在于將參數深度機制擴展到更廣泛的模型參數范圍。在之前提出的模型中,只有似然精度受到二階推斷的影響。在這里,我賦予模型形成關于其他參數(例如偏好精度和策略精度,見圖2)的深度推斷的能力。這種擴展增強了模型的解釋能力,因為由此產生的狀態推斷可以與各種現象學特征相關聯。
將現象學與模型參數之間的關系進行建模的方法,首先從理解每個參數在后驗形成中所扮演的數學角色開始。通過實踐,這使我們能夠直覺地理解調節某個特定參數“會是什么感覺”(從被建模主體的角度來看),就其感知或行為體驗可能如何變化而言。基于這種數學基礎的直覺,我們可以形成關于如何建模不同現象學特征的假設。這還得到了對所討論現象學的深入第一人稱熟悉程度的促進,例如定期進行冥想實踐。
這種方法論乍聽起來可能像是數學上的編故事——我們如何(不)驗證現象學與參數之間所假設的關系呢?首先需要注意的是,建模架構強制執行了一定程度的內部一致性。這是因為模型參數是相互依賴的。因此,我們對一個參數所做的假設會對其他參數及其相關現象學產生影響。因此,模型的內部一致性以及其與現象學特征之間關系的對齊,提供了構念效度的初步來源。
此外,生成的模型具有預測能力,我們可以利用它來檢驗提議的預測效度。作為一種計算模型,我們可以運行關于未來模型動態的模擬。這產生了三種形式的預測:現象學預測、行為預測和神經生物學預測。
現象學預測來自于對給定參數化下感知推斷預期動態的研究。我們將在第4.4至4.7節中看到現象學預測的例子。
行為預測來自于在特定任務設置中模擬行動選擇的能力。這一部分在此沒有涉及,但在原則上是可以處理的。例如,進入MPE狀態是否會改變在用于測試沖動性的“行動/不行動”任務中的行為表現?
神經生物學預測則得益于對主體內部狀態動態的雙重解釋,這些動態既可以被理解為信念動態,也可以被理解為狀態本身的熱力學特性。這種所謂的“雙重信息幾何學”是深度計算神經現象學的基礎(Sandved-Smith et al., 2024),它使得現象學和神經生物學之間的預測流動成為可能。這一內容在附錄B中進一步解釋。
4. MPE現象學特征的形式化
在以下各節中,我們將考察與MPE相關的一些核心現象學特征。每一節都將提出對這些特征的計算解釋,逐步構建出一個詳細的模型。最終的模型將作為對MPE體驗的計算解釋,我們可以利用它來推導關于MPE機制的見解,并生成實證預測,以檢驗現象學是否能夠轉化為數學模型。請參見第5節中的表1,其中總結了這些形式化內容。
4.1 元意識
元意識是我們將在構建所提議的MPE模型中形式化的第一個現象學特征。在MPE中,參與者經常報告具有高度的元意識,即對意識內容的清醒意識。
“687 我處于一種清醒的狀態。我對當下的時刻有很強的意識。就好像我是一只看門狗:我的所有感知似乎都變得敏銳了。我處于意識之中,但我并沒有做任何事情,除了感知聲音、氣味、身體的感覺。”(梅青格,2024,第33-34頁)
在之前的研究中,我們曾提出元意識可以被建模為對模型參數的二階觀測的似然精度(Sandved-Smith et al., 2021)。請參見圖1中的(2)參數。為了證明這一定義的表面效度,我們在一項注意力任務中模擬了高元意識和低元意識的影響,結果表明,當元意識更高時,走神的時期(在未意識到分心的情況下分心)減少了。這重現了實證結果,并與現有的元意識定義一致(Dunne et al., 2019)。
這種元意識參數使主體能夠意識到自身的內部狀態,因為它決定了由生成模型參數產生的觀測的精度或權重。鑒于這些參數定義了主體的行動 - 感知模型,高度的元意識意味著對其推斷過程的驅動因素的持續“不透明化”。這與元意識的常見定義一致,即明確注意到意識內容的能力。
因此,在參數化MPE的計算模型時,我們可以利用這些現象學數據來確定這一高階似然精度參數的值,將其設置為“高”。從數值上看,這意味著其值大于1。從計算角度看,其效果是主體能夠對各種生成模型參數的狀態形成明確無誤的推斷。
4.1.1 元意識與反身意識
有趣的是,在MPE期間,元意識的體驗通常被報告為具有反身性。換句話說,元意識被體驗為對意識本身的意識。
“1350 [……] 當相關狀態出現時,就像看到了“看”,或者意識到正在意識到。”
“1617 體驗到對意識本身的意識,或者對認知本身的認知。”(梅青格,2024,第396-398頁)
乍一看,這種反身性似乎與迄今為止所提出的元意識機制相矛盾。“元”一詞可能會讓人聯想到一種“更高視角”或一個單獨的觀察點。此外,這種緊張關系可能會因對圖1中呈現的分層模型的簡單解讀而得到加強。似乎主體被分裂了,產生了意識到內部狀態的部分與內部狀態本身之間的某種分離。
然而,經過更深入的調查,我們可以看到這種反身性的現象學實際上與這種計算解釋是一致的。
需要澄清的誤解是,分層推斷會創造出一個單獨的“更高視角”或內部的“小矮人”。通過利用貝葉斯力學的數學原理,我們可以證明,盡管主體具有分層或嵌套的結構,但存在一個最內層的“認知核心”或“內在屏幕”,它包含了來自其他層級的所有信息。有興趣的讀者可以在(Ramstead, Albarracin, Kiefer, Klein, et al., 2023; Sandved-Smith & Da Costa, 2024, §8.1)中進一步探索這一主題。對我們目前的目的而言,關鍵點在于存在一個單一的變分密度,它捕捉了推斷層級中所有層級的信念。其中一些信念是關于支撐其他信念形成的底層過程的,然而所有這些信念都是同時被體驗到的。
讓我們進一步剖析賦予元意識體驗反身性特征的計算機制。或者用梅青格的話說,就是“自我認知的現象學特征”。當模型中引入參數深度和元意識時,在計算邏輯的流程中出現了三種反射性的來源。這些為其他人所描述的反身意識的現象學提供了一個數學基礎,他們將其稱為一個“美麗的循環”(Laukkonen & Chandaria, 2024)。
第一個機制與元意識參數在使主體自身模型參數的動態可供推斷方面所起的作用有關。主體的模型參數共同支撐了導致后驗信念形成的推斷過程,我們將后驗信念與感知體驗聯系起來。換句話說,元意識使得對感知內容(即后驗信念的形成)的意識過程得以建模。因此,高度的元意識使得主體能夠意識到其體驗產生的過程——他們正在意識到對感知內容產生意識的過程。這一觀點將在第4.2節中進一步展開。
第二種反身性機制出現在我們將主體建模為能夠基于元意識參數進行狀態推斷時(見圖2)。這種更高階(第三層)的元意識狀態推斷,使主體體驗到對自己意識程度(即元意識參數值)的意識(即元意識狀態推斷),這種意識程度是關于意識過程(即生成模型參數的動態)的。在觀察到這個特定參數之前,主體已經意識到自己的體驗。這種元意識的額外反身性提供了一種對已經存在的意識的認識。
最后,第三種反身性機制來自于分層方案中信念信息傳遞的“循環”邏輯。頂層推斷影響并被底層推斷影響。因此,分層推斷的層級誘導了信念信息傳遞的層級循環。然而,正如上文提到的,這種循環產生的信念被捕捉在最內層變分密度的動態中——因此被體驗為一種單一的整體體驗。因此,我們期望關于元意識的現象學報告會試圖表達一種反身性的印象,即體驗領域指向自身。或者用梅青格的話說:
“……就好像認知的現象學特征動態地向自身折疊,悄無聲息但持續不斷地將意識重新嵌入自身。”(梅青格,2024,第394頁)
在繼續之前,需要注意的是,梅青格區分了雙重元意識和非雙重元意識,這種區分基于是否存在一個體驗元意識的“我”的感覺。我不認為這種區分是元意識機制本身的一部分,而是個體模型包含“自我作為原因”狀態因素的程度的結果。這一內容將在第4.6節“零人稱視角”中討論。
4.2 建模認識空間
梅青格提出的一個關鍵直覺是“認識空間”這一概念。這是主體能夠知曉的可能現象內容的空間。梅青格進一步提出,純粹意識,即對意識本身的意識,可能與主體知曉或建模認識空間的能力有關。
“在我看來,認識空間這一隱喻是純粹意識或最小現象體驗(MPE)的最好現象學隱喻。……而體驗純粹意識僅僅意味著擁有這個空間的模型,……。”(梅青格,2024,第46-47頁)
這一基于現象學的直覺在我們考慮具有參數深度的模型的后果時,找到了一個可信的計算對應物。生成模型的輸出,稱為狀態的后驗分布,是一種信念形式化為概率分布,它代表了主體對其感官數據原因的最佳解釋。在計算現象學的背景下,這一分布被理解為主體感知體驗的計算對應物(Ramstead, et al., 2022)。產生這一解釋的推斷過程是接收的觀測和那一刻生成模型的特定參數化(即感官信息和先驗信念)的結果。如果我們假設一個部分可觀測馬爾可夫決策過程(POMDP)模型結構,這些參數包括例如似然映射,它編碼了關于狀態觀測映射的信念,以及轉移映射,它編碼了關于狀態從一個時刻到下一個時刻可能轉移的信念。不同的參數化(例如不同的學習歷史)會導致不同的后驗分布。
我們可以將每個可能的后驗分布作為一個點繪制在統計流形上,即一個高維平面上,每個點定義一個概率分布,每個維度是生成模型的一個參數。這個流形有效地代表了主體可能持有的所有可能的信念,即所有可能的感知體驗。這與梅青格的認識空間概念非常相似:
“根據定義,認識空間是一個可能性的空間:它包含每一個可能的認識場景以及每一個可能發生的自身動態劃分——每一個可能被給定系統知曉和體驗的潛在事物。認識空間包含了一個給定系統所擁有的知識狀態的全部。因此,它涵蓋了在特定的時間和空間位置上,主體獲取世界和自我、使現實向自身呈現的多種方式。”
(梅青格,2024,第50頁)
后驗分布本質上是認識論的,因為它捕捉了主體當前的信念狀態。因此,定義所有可能后驗分布的統計流形似乎是認識空間的一個合適候選的計算模型。
如果我們接受這一點,那么主體形成對這一認識空間的模型意味著什么呢?這正是參數深度所支持的二階推斷所實現的。它賦予了主體將自身的模型參數作為進一步推斷的觀測對象的能力。結果是對模型參數本身的生成模型。鑒于這些參數定義了可能的后驗分布(體驗)的統計流形(認識空間)的維度,因此具有高度元意識的主體可以形成對這一空間的模型——通過對參數本身的動態和相互作用進行建模。
因此,我們找到了梅青格關于純粹意識作為認識空間模型的自然計算對應物。需要注意的是,這在模型中創造了另一個有趣的遞歸或反身性,主體本質上是在對其感知背后的建模過程進行建模。
4.2.1. 深化對覺知、空性與止息的理解
通過將覺知描述為可能后驗認知空間的模型,我們面臨這樣一個事實:地圖并非領土本身,即認知空間的模型并非認知空間本身。這只是一種對包含所有可能信念的統計流形的主體模型。我們可以從這一事實中得出兩個洞見。首先,這為“變得更覺知”或“深化到純粹覺知”的體驗提供了一種機制。
“1354 [...] 在冥想中,純粹覺知的體驗隨著時間的推移和冥想實踐的發展而變得越來越明顯。”
(Metzinger,2024,第450頁)
這也與將覺知視為一種不斷進化、無邊無際的過程的冥想傳統相呼應,其中認識到覺知既是一種初始的洞見,也是一段沒有固定終點的不斷擴展的旅程。這種擴展的計算隱喻是持續映射可能后驗信念的流形。
一些評論者指出,由于自我表征的內在限制,這一過程本質上是開放的(Friston等人,2012;Fields等人,2024;Sandved-Smith和Da Costa,2024)。從啟發式角度我們可以理解為什么;隨著越來越多的空間被映射,主體自身也在發生變化,從而改變了要被映射的對象。換句話說,通過了解自己,我們正在改變要被了解的事物,這種方式使得完全的自我表征始終難以完全實現。乍一看,將最小自由能與MPE(最小預測誤差)聯系起來似乎與持續的模型擴展過程相矛盾,因為“最小”可能會讓人聯想到一個穩定的終點。然而,需要注意的是,最小化自由能等同于最大化生成模型的證據,即“自我證實”。
從對認知空間的計算理解中,我們可以得出的第二個洞見是“覺知本身是空的”。空性指的是體驗的一個特征不具有固有的品質或存在。純粹覺知本身通常被報告為體驗的基礎,某種非常“真實”的東西。然而,如果我們把覺知建模為主體對認知空間的模型——我們可以看到,純粹覺知的體驗本身也是一個正在進行的構建(即,沒有與主體無關的固有本質)。
這指向了超越覺知的更深層次的非體驗的可能性,通過解構這一基礎的認知空間模型本身來實現。
“3323 [. . .] 然而,后來在冥想中出現了更多的“體驗”,其中純粹意識的最后一點痕跡被熄滅了。這就像一種內在的死亡,但同時也比純粹意識本身帶來了更大的自由。——在那里,很明顯地體驗到,純粹意識遠非最深(或最高)的——事物,而是“在它背后”——存在著一個更廣闊、無法用言語描述的“非任何事物”。但它無法用言語描述,因為它不再是體驗;最多只能被描述為所有體驗的缺失,或者作為絕對的自由。”
(Metzinger,2024,第189頁)
這段優美的引文講述了在高級冥想修行者中并不罕見的“止息”體驗(Laukkonen等人,2023;Agrawal和Laukkonen,2024;van Lutterveld等人,2024)。止息是一種體驗的中斷,是一段短暫或延長的什么都沒有的時刻。這與MPE(最小預測誤差)不同,后者仍然是一個體驗,盡管它可能非常微小。然而,我們可能會問,MPE與止息之間(如果有的話)有什么關系?
一個初步的假設是,MPE是一個在止息附近的體驗簇,即MPE是一個在狀態空間中產生最小自由能的區域的體驗,而止息是零自由能的極限情況。
4.2.2. MPE作為生成模型掌握的結果
從計算角度來看,認知空間的模型是通過經驗和內省學習而來的,關注構成主體推理過程的參數的動態。這喚起了一個與冥想中對感知本質的洞察相似的概念,即完善對覺知空間本身的模型。
如果假設生成模型的某些參數對主體對它們的信念是敏感的,即存在一種心理行為可以調節生成模型的參數(Limanowski & Friston,2018),那么做好這一點將帶來獨特的優勢。例如,我們在圖1中看到了如何在注意力調節心理行為的情況下形式化這一點。將這種能力推廣到其他模型參數,為主體在自由能最小化過程中開辟了一個全新的自由度。除了更新模型并積極尋求能夠確認模型的數據(即主動推理)之外,通過參數深度,主體可以動態且智能地調整其精度權重。改變模型參數相當于采用一種“看待事物的方式”(Burbea,2014),因為由此產生的后驗(感知體驗)發生了變化。
這導致了關于MPE在抽象計算層面可能是什么、如何達到以及為什么這種體驗對經過廣泛冥想訓練的個體最為可靠的一個高級假設:憑借對生成模型參數的足夠覺知和控制,主體能夠進入一個最小自由能的區域,主要是通過自我調節生成模型本身(即內在而非外在的掌握)。當主體強調對認知空間的覺知時,這會匯聚成一種MPE的沉浸狀態。由于主體正在建模其模型中始終存在的一個特征,即任何體驗發生的空間,因此這使得自由能的產生可以非常低。在適當的條件下,這會導致一個近乎完美的預測反饋循環(“覺知嗎?覺知。覺知嗎?覺知。等等。”),這是由于無法想象無意識是什么樣的“反事實不變性”所導致的(Metzinger,2024,第51頁)。這一假設將MPE中的“最小”與“最小自由能”聯系了起來。
4.2.3. 無界認知開放性作為一種平坦的狀態先驗
Metzinger還引入了“認知開放性”的概念,他將其定義為“無障礙的認知空間”,并認為這是純粹覺知的一個重要現象學特征(Metzinger,2024,第47頁),與在MPE(最小預測誤差)中常見的“無界性”特質密切相關。從計算角度來看,這一特征意味著對由轉移映射B編碼的先驗期望的減弱。精確的先驗會限制可能的后驗信念空間,而一個完全平坦的先驗則為每一刻的任何后驗時刻打開了可能性。通過調節轉移精度?來實現對先驗期望影響的弱化(見圖2)。由此得出的假設是,在MPE期間,轉移精度的值較低,使得可能信念的認知空間保持無界。因此,主體完全開放于任何認知狀態的可能性,不對下一刻的解釋加以限制。
4.3. 平靜
MPE現象學的另一個核心特征是平靜的特質,被描述為寧靜、平靜、靜止甚至是“存在的安逸”。這一特質意味著對傳入刺激的非反應性或不易受擾動的狀態,可以用先驗偏好的平坦分布來建模。
“2985 [. . .] 在我看來,最重要的是放手。我能夠感知身體感覺和思想,但與日常生活不同的是,我對它們什么也沒做。這讓我一步步走向一個更深層次,一個我從未體驗過的意識狀態。這是一種無限的平靜狀態。[. . .]”
(Metzinger,2024,第10頁)
在主動推理的術語中,行為是基于預期自由能G來選擇的。這是行為(或行為序列)在未來可能產生的自由能,鑒于對行為如何影響狀態轉移以及這些未來狀態可能產生的觀察結果的信念。預期自由能可以分解為認知項和實用項,其中實用項取決于主體對結果的先驗偏好,記為C。
這些偏好促使主體選擇能夠從內部(內感受)或外部環境中獲取預期觀察結果的行為。
如果預期觀察結果與偏好出現偏差,精確的先驗偏好分布將導致較高的預期自由能,驅使主體分別回避或尋求不偏好的或偏好的觀察結果。較高的偏好精度轉化為較高的敏感性和反應性,成為回避行為的強大驅動力。
在MPE(最小預測誤差)中,我們觀察到相反的現象學特征,參與者報告出一種穩定的平靜感和輕松感。這意味著這種精度被下調了,使得行為的實用驅動力被弱化,對傳入觀察結果的反應性也降低了。從計算角度而言,這是通過將參數深度機制擴展到先驗偏好C來實現的。與其他模型參數一樣,用于二級推理的信息并非參數本身,而是通過精度推理捕捉到的關于參數的二級信念。例如,在圖1中,反饋到模型中的是似然精度?,而不是似然A本身。這些精度參數(記為)是主體通過自由能最小化推斷出來的,它們代表了主體對相關參數編碼的信念的信心(Parr等人,2022,方程(B.20))。
因此,通過引入一個二級精度參數?來調節C對策略選擇的影響,可以在計算上實現對偏好的調節。預期自由能變為:
通過將這個參數引入深度生成模型,主體可以根據對參數值的觀察來進行狀態推斷(見圖2)。一旦能夠做到這一點,主體就將模型中原本透明的一個方面變得不透明化(即進行了建模)。這使得主體能夠基于預期自由能最小化來選擇心理行為,而這些行為通過下行信息傳遞來影響參數的值。
因此,在MPE(最小預測誤差)發作期間,假設是個體有意識地培養一種深度的平靜狀態。我們可以將其建模為通過一種降低偏好精度的心理行為來弱化先驗偏好的分布。鑒于偏好定義了與主體生物生存和持續存在(“拉回吸引子”)相關的吸引態集合(Sajid等人,2022),“存在的安逸”這一描述尤其貼切。
4.4. 無為性
到目前為止,使大部分現象學建模得以實現的機制是參數深度所支持的心理行為。這為認知主體如何對其自身感知系統的參數產生影響提供了一個計算上的解釋,這種影響可能會合理地引發所報告的MPE(最小預測誤差)現象學的某些方面。
這種主動機制似乎與MPE的一個重要現象學特征相矛盾:無為性。個體將MPE報告為一種幾乎沒有或完全沒有認知努力感的狀態。這是一個有趣的報告,它使我們能夠進一步檢驗這種計算模型解釋。我們會發現,鑒于我們已經在上面列出的參數化,無為性實際上是由模型預測的。
“79 [...] 這種體驗是無為的,并且沒有任何明顯的欲望感。——不再有任何需要到達某個地方或獲得某樣東西的感覺。”
(Metzinger,2024,第331頁)
我將采用(Parr等人,2023)中概述的論點,其中作者提出認知努力可以形式化為情境敏感的心理行為選擇與習慣性心理行為選擇之間的差異。這種差異代表了一個復雜性項,可以理解為在給定情境性感覺信息的情況下,心理行為信念更新的信息長度。這一論點部分基于熱力學要求,即根據情境信息更新習慣性先驗信念,以及從情境不敏感到情境敏感的行為選擇的轉變,這種轉變在信息處理需求上會產生一種“成本”,被體驗為認知努力。因此,認知努力項被定義為:
其中,表示Kullback-Leibler散度,是對隱秘策略(一系列心理行為)的信念,G是預期自由能,E是對策略(或習慣)的先驗信念。
因此,無為性的現象學在其計算對應物中表現為這種努力項趨于零。從數學角度來看,這可以在幾種特定條件下發生:1)當G對所有策略都是均勻的或相似的;2)當E的幅度相對于G較大;或3)當G和E對齊。
在MPE(最小預測誤差)的情況下,條件1和條件2同時起作用。如上所述,在MPE期間,元覺知水平很高,偏好精度很低。這轉化為心理策略的預期自由能的值很低且均勻。要理解這一點,請參考方程(1)中G的表達式,并注意到高元覺知會增加似然映射A(2)的精度,從而降低其熵,進而減少感知模糊項的幅度。通過上一節中描述的平靜機制,成本項也得以降低。因此,預期自由能G將在策略上具有低幅度且均勻的分布。此外,正如我們將在下一節中看到的,MPE期間的時間規劃深度被弱化,這也導致了策略上的均勻分布。最后,鑒于MPE通常與冥想背景相關,我們可以通過反復訓練和習慣化來預期E的幅度較大。
因此,到目前為止概述的MPE的計算模型預測了MPE中報告的無為感,這為模型提供了一定程度的預測有效性。
4.5. 非概念性
MPE(最小預測誤差)的體驗通常被報告為沒有任何概念性加工。這有時被描述為缺乏思辨性思維或心靈的寧靜,有時則被描述為完全沒有概念性的存在,包括任何關于敘事性自我概念的觀念。
“1196 [...] 在我看來,這種體驗最好被描述為‘非概念性’的。”
(Metzinger,2024,第23-24頁)
先前的研究認為,非概念性的認知加工模式可能出現在導致時間規劃視野被弱化(即時間深度為零)的情況中。這些情況包括使用致幻劑(Deane,2021)、心流狀態(Parvizi-Wayne等人,2024)以及深度冥想沉浸(Laukkonen & Slagter,2021;Czajko等人,2024)。這些情況的共同點是強調對當下時刻的觀察進行加工。無論是通過藥物誘導、情境強制還是有意識地培養,這些體驗都促使認知資源專注于當下時刻。將這種現象與非概念性聯系起來的論點假設了一個物理主體在每一刻能夠進行的推理的熱力學極限(Fields等人,2024),因此,對當下時刻的強烈推理權重意味著相應地減弱了規劃中所需的面向未來的推理。
對反事實未來進行模擬需要將主體的一個隱含概念投射到未來的時間中,以及對未來的行動序列可能產生的反事實后果進行概念性粗粒化。我們可以將策略推理的這一計算過程與Metzinger所說的“認知主體模型”聯系起來。
因此,通過完全弱化時間深度,主體不再為了行動選擇而推理這些概念的展開過程。因此,這些概念在現象學上不再出現,導致一種沒有與自我相關的思考或與規劃相關的更高階認知加工和概念化的狀態。
因此,非概念性意味著當前觀察數據的精度足夠高,需要將認知資源專門用于其處理,從而導致時間深度很小或為零。在我們的模型中,這轉化為高似然精度(已經從元覺知的形式化中預期到)以及控制規劃深度的參數值接近零。
概念化和反事實規劃的缺失也與第4.2.3節中討論的轉移信念的弱化相一致。隨著轉移精度的降低,任何推斷出的后驗信念都不會延續到下一刻。這導致一種完全開放于當下且沒有任何概念性約束的感知。這也使得反事實規劃變得不可行,因為狀態的展開變得極為模糊。
4.5.1. MPE模式與MPE狀態
MPE(最小預測誤差)的體驗可以分為兩大類:MPE沉浸狀態和持續的MPE模式。MPE模式的特征是純粹覺知與其他感知內容同時存在,而沉浸發作則是純粹覺知而無感知內容的狀態。
如果MPE模式和狀態都強調對當下時刻的處理,那么區分它們的機制是什么?在(Metzinger,2024,第475-477頁)中,我們提出MPE狀態涉及對感官數據的弱化,同時保持對覺知本身的推理的高精度(見圖2中的s(3))。而MPE模式可以被建模為既有這種元覺知推理,又有其他正在進行的感知推理。
在具有感知內容的MPE模式中,所有感官映射的似然精度保持較高。而MPE沉浸狀態則可以通過將所有可用的精度完全分配給更高階的觀察模態來建模。這意味著沉浸發作可以被建模為一個系統,其傳入數據主要是內部生成的對其生成模型參數的觀察。
4.6. 零人稱視角
MPE最引人入勝的特質之一是Metzinger所說的“零人稱視角”(Metzinger,2024,第xix頁)。對于報告類似MPE現象學的一部分人來說,這種體驗被描述為沒有主體感或任何形式的自我意識。
“1612 [...] 我所體驗的世界不再獨立存在,因為我已經成為那個體驗的展開。之前的‘我’作為體驗者、選擇者、思考者已經不存在了。相反——只有體驗本身。——體驗有一個視覺中心,但只是因為光在那里與眼睛相遇。中心不再有任何意義。”
(Metzinger,2024,第397頁)
如果沒有親身經歷,很難想象或概念化這種體驗,因為主客體區分似乎如此不言自明。然而,高級冥想者通常會描述一種“無中心的感知模式”(Ingram,2018)或一種沒有體驗者的體驗模式。假設這種現象學特質存在于MPE狀態和模式中(即持續的無中心性),我們該如何從計算角度來解釋呢?
在上文中,我們討論了時間深度的弱化如何削弱敘事性自我構建和概念化。然而,我提出零人稱視角代表了感知處理中更根本的轉變。我們可以通過指出零人稱視角是一種持續的存在模式(而不是一種暫時狀態)來支持這一點。即使在需要深度時間規劃的活動(例如預約牙醫)中,這種無自我意識的形式仍然存在。
由于我們把體驗與后驗信念聯系起來,我們可以通過問:與習慣性的第一人稱視角相關的后驗分布是什么?與體驗中的“我”或“我”第一人稱指代相關的后驗是什么?后驗是主體對某些觀察子集原因的最佳猜測。因此,我們可以將這個問題重新表述為,主體存在哪些觀察,這些觀察可能被解釋為由主體自身引起的?
由于參數深度的存在,主體正在觀察其自身的模型參數(見圖1)。產生這些觀察的因果過程既依賴于外部動態,也依賴于主體的內部動態(即主體模型參數的相互依存動態)。因此,如果主體沒有對自己內部狀態的準確模型,就會有影響其自我觀察的因素無法被預測(即其自身的參數動態),從而導致意外的觀察,即自由能。
因此,這里提出的關于第一人稱視角來源的計算假設是,主體通過將其原因歸因于主體自身(即主體的內部狀態)來解釋這種不確定性。從某種意義上說,這種后驗解釋是正確的——主體的內部狀態(這些狀態參數化了它的信念)確實是預測誤差的原因。然而,對一個抽象原因的訴求(我將其稱為“內部原因概念”)并沒有提供避免預測誤差的預測能力。這是因為這種解釋是事后應用的,是對尚未建模的因果過程的一種合理的粗粒化。主體推斷出產生這一觀察子集的生成過程位于馬爾可夫毯的主體一側。這種對原因的抽象歸因可以在沒有對過程本身進行詳細預測模型的情況下進行。因此,預測誤差仍然存在,但很快被歸入內部原因概念的“地毯下”。關鍵點是,這種策略創造了對主體模型內部狀態的引用,作為對其感知過程觀察的解釋,我假設這可能是對第一人稱視角現象學的一個很好的解釋。
為什么這種概念在MPE中會缺失?如果我們假設,如上一節所討論的,MPE產生于個體對其認知空間(即其自身的模型參數)有一個足夠不透明化的模型,那么可以推斷,MPE將缺乏以這種方式定義的自我概念。有了這樣一個精確的模型,主體不再需要這種抽象的解釋來解釋由于其對自身參數動態缺乏理解而產生的預測誤差,因為這些預測誤差根本就不會出現——正是因為發展出了一個準確的預測模型。換句話說,當主體對這些原因有一個良好的模型時,就不需要通過“內部狀態作為原因”來解釋未被感知的內部動態。
因此,在一個瞬間(或一系列瞬間)的洞察或貝葉斯模型簡化(Friston,Lin等人,2017)中,內部原因概念狀態因子被剪枝,以支持對支撐感知內容推理構建的機制的更準確理解,即通過參數深度建模的參數動態。換句話說,通過清晰地看到心靈的運作,主體從對自身的抽象引用和由于缺乏理解而產生的預測不一致中解脫出來。
4.7. 無時間性
MPE(最小預測誤差)的另一個迷人特征是報告中的無時間感。
“3330 我會用‘時間的停止’、‘沒有時間的空間感知’等術語來最好地描述我的體驗[……]
2771 這是一種既不向前移動,也不向后移動,甚至也不是靜止不動的體驗。”
(Metzinger,2024,第248頁)
兩種計算機制可能分別解釋這種體驗的不同方面。在某些情況下,無時間感被描述為“無時間的變化”或“變化的當下”,而在其他情況下,體驗則是一種更抽象或純粹的無時間性(例如“永恒體驗”)。我們將會看到,這兩種情況都由到目前為止所呈現的模型所預測。
“變化的當下”的體驗很好地被第4.5節中描述的時間規劃視野的弱化所捕捉。在這些條件下,不存在心理上的時間旅行或對未來或過去狀態的投射。相反,對當下時刻感官數據的感知推理占主導地位,而沒有對接下來會發生什么的感覺。變化仍然存在,因為后驗分布正在逐刻更新,然而只有關于當前觀察的當前信念被考慮。
另一方面,純粹的無時間性可以從計算角度解釋為MPE沉浸期間信念更新的信息長度很小的結果。最近,時間持續的體驗已被與信念軌跡的信息長度聯系起來(Da Costa等人,2024)。因此,缺乏時間持續意味著信念更新的信息長度非常小。從數學上講,這將時間持續感與先驗和后驗信念關于狀態之間的KL散度聯系起來:
這一假設尚未得到實證驗證。然而,從現象學角度來看,它具有表面上的合理性,因為信息長度代表了主體的體驗在每一刻的變化程度。
如果我們接受這種觀點,那么MPE中的純粹無時間感就遵循了到目前為止所概述的計算模型。回想一下,參數深度使主體能夠感知其自身的模型參數。每一層的觀察結果是由下一層的參數精度生成的。精度可以被理解為參數的一個總結性統計量;它在較慢的時間尺度上波動,并且包含的信息比參數本身更少。因此,隨著我們沿著參數層級向上攀升,信念更新的幅度會減小。正如我們所看到的,在MPE沉浸期間,只有更高層次的推理存在,而低層次的感官數據被弱化了。假設個體已經穩定了他們的覺知,那么對這種狀態推理的更新的信息長度將趨于零。這在主觀上被體驗為時間持續的停止。在MPE模式中,與更高層次推理相關聯的無時間感的體驗與低層次感知推理相關的正常時間感知同時存在。
4.8.Bliss
最后,這種計算模型如何解釋MPE期間關于積極情感的報告呢?
“3305 [...] 我感到極大的幸福在流淌。[……]
2687 [……] 一種深深的喜悅、無時間感和幸福涌現出來。”
(Metzinger,2024,第147頁)
在MPE(最小預測誤差)的報告中,體驗到喜悅、敬畏、欣悅或感恩是很常見的,但這并不是一個必要的特征。許多冥想者報告了沒有這些特質的純粹覺知體驗。此外,這些特質也常常出現在其他正常的日常體驗中。那么,我們的計算模型如何解釋這種差異呢?
在主動推理框架內,情感體驗已經被建模為基于對“模型精度”參數的觀察的狀態推理。模型精度(記為或?)是一個依賴于生成模型所有其他參數的全局總結性統計量。它編碼了主體對其整個行動模型的信心。推斷這個參數就是回答“我減少自由能的效果與我預期的效果相比如何?”這個問題。因此,這種關于“情感推理”的計算解釋(Hesp等人,2021)將情感價值與自由能的變化率聯系起來(Joffily & Coricelli,2013)。因此,我們可以將高情感價值建模為自由能的負變化率,即當主體在減少自由能方面“越來越好”的時候。
在上文中,我們討論了主體對其模型參數的準確建模如何能夠改善自由能的最小化,因為由內部原因產生的預測誤差通過改進的自我建模得以解決。自由能的減少也是高元覺知(低感知模糊)和高平靜(低偏好精度)的結果。如果我們假設定義MPE的這些條件的轉變持續了一段時間,這就創造了一個場景,即主體產生的自由能可能比其模型預測的減少得更快。
因此,在這種情況下,從計算角度來看,他們會對伴隨著越來越不透明且無偏好的自我模型的自由能減少感到“愉悅的驚喜”,這反過來會表現為模型精度的增加和積極情感價值的上升。然而,一旦達到自由能的穩定最優值,變化率就會下降,相關的情感價值也會逐漸減弱。這或許可以解釋在MPE報告中看到的差異,并構成了一個預測的基礎,即積極情感價值最有可能出現在MPE的起始階段。
5. 結論
本文提出了一個基于自由能原理和主動推理數學的最小現象體驗(MPE)的更新計算模型。通過在深度主動推理框架內形式化MPE的關鍵現象學特征,我們開發了一個機械論解釋,能夠用計算描述來解釋第一人稱體驗報告。該模型表明,MPE是進入一個非常低自由能(或等價地,非常高自我證實)狀態的結果,其特征包括:
- 高元覺知,建模為對模型參數更高階觀察的精度增加。
- 先驗偏好的弱化,導致一種平靜的狀態。
- 對主體自身建模過程(即生成模型參數)的精確模型,使得“零人稱視角”成為可能。
這些條件進一步導致了與MPE報告的現象學特質相關的更多計算預測,包括無為性、無時間感以及一種沒有概念內容的純粹覺知感。
這項工作的意義不僅在于解釋MPE。它展示了計算神經現象學在形式化和幫助我們理解意識體驗微妙方面的潛力,為研究意識的改變狀態和冥想實踐提供了一個嚴謹的框架。此外,它還為自我意識的本質以及不同感知模式的計算基礎提供了新的視角。
然而,必須承認存在一些局限性。該模型仍然是理論性的,需要實證驗證。未來的工作將專注于推導和測試關于MPE狀態期間的神經生物學動態的預測,并設計實驗來評估模型的準確性。
最后,正如在引言中提到的,我希望通過這項工作為描述現象學貢獻一種計算語言。這種語言可以作為一張地圖,用于指導和啟發我們對自身生活體驗的第一人稱研究。在我看來,對意識的體驗性理解遠比另一種意識理論更有價值。
附錄A. 模擬MPE
本文中探討的MPE現象學的形式化足夠詳細,可以定義一個適合模擬MPE的體驗和動態的生成模型參數化。模擬的實現和結果超出了本文的范圍;然而,下面的圖2以貝葉斯圖的形式描繪了模型結構,下表則總結了要實施的參數化,這些參數化是從MPE的現象學特征中推導出來的。
附錄B. 實證預測
在構建神經現象學模型時采用自由能原理的優勢在于,其形式化為所提出模型的實證檢驗提供了一條合理路徑。請參閱(Ramstead等人,2022;Sandved-Smith等人,2024)以獲取關于這一主題的詳細討論。簡而言之,這是通過自由能原理(FEP)對內部狀態動態的雙重解釋實現的。一方面,內部狀態可以被理解為參數化主體對外部狀態的信念(所謂的“外在動態”)。另一方面,它們的動態可以用內部狀態本身來描述(“內在動態”)(Friston等人,2020)。
其結果是,我們對信念動態所做的假設必然包含關于內部狀態動態的預測,這些預測可以通過實證方法進行檢驗。描述內在熱力學動態和實證神經生物學之間關系的是伴隨自由能原理的神經過程理論(Friston,FitzGerald等人,2017;Parr & Friston,2018;Da Costa,Parr等人,2021)。對這里所提出的模型所暗示的神經生物學含義的詳細探討是未來工作的主題。然而,為了展示其邏輯,下面突出了一些示例方向。
6.1. 無時間感與代謝成本
我們提到的與時間持續體驗相關聯的信念更新的信息長度,也與信念更新所產生的代謝成本相關聯(Da Costa等人,2024),即信念更新的幅度與能量消耗的幅度相關。因此,將現象學上的無時間感計算化為信念軌跡中的小信息長度,意味著對代謝負荷的預測。因此,我們可以預測,在MPE期間,通過BOLD fMRI信號幅度測量的大腦整體能耗將更低。
6.2. 無為性與大腦
在(Parr等人,2023)中,作者提出他們的理論預測可以將認知努力與基底神經節和前額葉皮層聯系起來。這導致了一個可操作的實證預測——在MPE期間,我們應該觀察到與認知控制相關的前額葉皮層和前扣帶回區域的激活減少。
6.3. 精度參數與神經遞質
其他人認為,似然精度、轉移精度和模型精度參數的功能角色分別由膽堿能、去甲腎上腺素能和多巴胺能神經遞質系統介導。這些系統共同具有的基本作用是對突觸傳遞的影響(即神經調節增益控制)(Parr & Friston,2017a;Schwartenbeck等人,2015)。
這里提出的MPE計算模型涉及這些參數的具體動態,即高似然精度(第4.5節)、低轉移精度(第4.2.3節)以及最初較高、隨后逐漸減弱的模型精度(第4.8節)。這轉化為關于與相應神經遞質系統相關的大腦區域活動的實證預測,即Meynert基底核(膽堿能)、藍斑核(去甲腎上腺素能)和腹側被蓋區(多巴胺能)。從正常清醒意識向MPE過渡時,我們應該觀察到這些區域激活模式的變化。
倫理聲明:本提交內容僅包含理論分析。未進行涉及人工智能、人類或動物受試者的實驗。我謹慎設計了我們的方法,專注于形式化描述,而不是可能引發意識的實現,盡管這種可能性極小。這項研究旨在進一步推進科學理解,同時嚴格遵守不創造或冒險創造人工有感知能力的生物的倫理邊界。
原文鏈接:https://www.preprints.org/frontend/manuscript/2c5592c69907b50f46348753274b894b/download_pub
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.