Abstract Visual Reasoning: An Algebraic Approach for Solving Raven’s Progressive Matrices
抽象視覺推理:解決Raven漸進矩陣的代數方法
原文鏈接:https://arxiv.org/pdf/2303.11730
https://github.com/Xu-Jingyi/AlgebraicMR
摘要
我們引入了代數機器推理,這是一種適合抽象推理的新型推理框架。代數機器推理有效地將新穎問題求解的復雜過程轉化為常規的代數計算。我們關注的基本代數對象是某個適當初始化的多項式環的理想。我們將解釋如何將解決烏鴉漸進矩陣(RPMs)的問題實現為代數中的計算問題,這些問題結合了各種眾所周知的代數子程序,包括:計算理想的格羅布納基(Gr?bner basis)、檢查理想包含等。至關重要的是,理想所滿足的額外代數結構允許對理想進行超出集合論操作的更多操作。
我們的代數機器推理框架不僅能夠從給定的答案集中選擇正確答案,還能夠在僅提供問題矩陣的情況下生成正確答案。在I-RAVEN數據集上的實驗結果達到了93.2%的準確率,顯著優于當前最先進的77.0%的準確率,并超過了人類84.4%的準確率表現。
1. 引言
當我們想到機器推理時,沒有什么比機器最終在智力測試和一般推理任務中超越人類的可能性更能激發我們的想象力。即使對于人類來說,在智商測試(如著名的Raven漸進矩陣,RPMs)[8]中表現出色已經是一項非凡的成就。一個典型的RPM實例由問題矩陣和答案集組成;參見圖1。問題矩陣是一個 3 × 3 的面板網格,滿足某些隱藏規則,前8個面板填充有幾何實體,第9個面板是“缺失”的。目標是從給定的答案集中的8個面板中推斷出最后一個面板的正確答案。
解決RPMs的能力被認知科學家稱為流體智力的典型展示。“流體”一詞暗示發現新關系和抽象的心理敏捷性[56],特別是對于解決以前未遇到的新問題。因此,抽象推理在解決新問題方面被廣泛譽為人類智能的標志[9]。
盡管機器推理最近取得了許多進展[29, 32, 59, 60, 62, 63, 73, 75, 83, 84],但一個常見的批評[13, 49, 50]是,現有的推理框架專注于涉及廣泛訓練的方法,即使是在解決像RPMs這樣已建立的推理測試時。或許最相關的是,如[13]所述,諸如RPMs的推理任務不應需要針對任務特定的性能優化。畢竟,如果機器通過在任務特定數據上訓練來優化性能,那么該任務對機器來說不可能是新穎的。
為了更好地模擬人類推理,我們提出了所謂的“代數機器推理”,一個非常適合抽象推理的新推理框架。我們的框架無需針對任務特定數據優化性能即可解決RPMs,類似于一個天才兒童無需練習RPMs即可解決RPMs。我們的關鍵起點是將概念定義為一些適當初始化的多項式環的理想。這些理想被視為代數機器推理中的“實際研究對象”,無需為其分配任何數值。我們將闡述RPM任務如何被實現為涉及理想的代數計算問題。
我們的推理框架大致可分為兩個階段:(1) 代數表征,和 (2) 代數機器推理;參見圖2。在第一階段,我們基于從對象檢測模型提取的感知屬性值,將RPM面板表示為理想。在第二階段,我們提出了4個不變性模塊,從RPM問題矩陣中提取模式。
總結來說,我們的主要貢獻如下:
? 我們將“解決RPM任務”簡化為“解決代數中的計算問題”。具體來說,我們展示了抽象模式的發現如何可以非常具體地被實現為代數計算,即理想的主分解。
? 在我們的代數機器推理框架中,我們引入了4個不變性模塊,用于提取對人類有意義的內容。
? 我們的框架不僅能夠從給定的答案集中選擇正確答案,還能無需任何給定答案集生成答案。
? 在RAVEN和I-RAVEN數據集上進行的實驗表明,我們的推理框架顯著優于最先進的方法。
2. 相關工作
RPM求解器 最近對使用基于深度學習的方法解決RPMs(Raven漸進矩陣)表現出濃厚興趣[29, 43, 62, 84, 85, 88–91]。大多數方法使用神經網絡從原始RPM圖像中提取特征,并通過測量面板相似性選擇答案。一些研究則專注于在無需答案集的情況下生成正確答案[55, 64]。為了評估這些方法的推理能力,提出了類似RPM的數據集,如PGM[62]和RAVEN[83]。隨后,I-RAVEN[26]和RAVEN-FAIR[5]被引入,以克服RAVEN答案集生成中的捷徑缺陷。
AI中的代數方法 在AI中使用代數方法并不新鮮。多項式方程系統常見于計算機視覺[57]和機器人學[12]中,通過Grobner基計算進行代數求解。在統計學習理論中,代數幾何[78]和代數統計[15]的方法被用來研究統計模型中的奇點[40, 79, 80, 82],分析分層模型中的泛化誤差[76, 77],學習概率分布的不變子空間[34, 38],以及建模貝葉斯網絡[16, 70]。這些工作的共同主題是研究適當定義的代數簇。在深度學習中,代數方法被用來研究神經網絡的表達能力[11, 31, 45, 87]。在自動定理證明中,Grobner基計算被用于證明檢查[68]。最近,一種一階邏輯的矩陣表示被應用于RPM任務[86],其中關系由矩陣近似,推理被框架化為找最佳擬合矩陣算子的雙層優化任務。據我們所知,交換代數的方法尚未用于機器推理。
4. 討論
代數機器推理為超越數值計算的機器推理提供了一個全新的范式。推理任務中的抽象概念被非常具體地編碼為理想,這些是可計算的代數對象。我們將理想視為“實際研究對象”,并不需要為它們分配數值。這意味著我們的框架能夠推理更多定性或抽象的概念,這些概念自然上不具有相關的數值。新穎的問題解決,例如從觀察中發現新的抽象模式,被具體實現為對理想的計算(例如,計算理想的主分解)。特別是,我們并不是在求解多項式方程組,這與AI中代數的現有應用(參見第2節)形成對比。變量(或原始實例)未被賦值。我們不以輸入值評估多項式。
從理論的角度看,我們提出的方法開辟了新天地。我們建立了機器推理和交換代數之間的新的聯系,這兩個領域此前完全無關。交換代數已有超過一個世紀的非常深厚的研究成果尚未被利用。代數方法可能是解決機器推理中長期存在的基本問題的關鍵嗎?直到2014年,Leon Bottou[6]才建議人類應該“從頭開始構建推理能力”,他推測缺失的成分可能是一種代數方法。
為什么使用理想來表示概念?為什么不使用集合?為什么不使用符號表達式,例如多項式?直觀上,我們認為一個概念是一個“總括術語”,包含多個(可能無限多個)概念實例。將概念僅僅視為實例的集合不足以捕捉人類推理的表達力。一個僅具有有限“原始集合”的集合論表征系統總共只能有有限個可能的集合。相比之下,我們證明僅從有限個原始概念中可以構造出無限多個概念(定理3.1)。這與我們的直覺一致,即人類能夠僅從有限個原始概念中表達無限多個概念。主要原因是理想的“更豐富”的代數結構允許對理想執行遠超集合論運算的更多操作。有關進一步討論,參見附錄A.4。
為什么我們的代數方法從根本上不同于基于邏輯的方法,例如基于邏輯編程的方法?基于邏輯的推理的核心思想是將推理具體實現為邏輯表達式的解析(或逆解析)。這一思想中固有的概念是可滿足性;參見[28]。直觀上,我們有一個邏輯表達式,通常以規范形式表示,我們希望為邏輯表達式中的字面量分配真值(真或假),以使整個表達式得到滿足(即真值為“真”);有關更多討論,參見附錄C.1。事實上,自動定理證明[2, 27, 36, 39, 81, 92]的許多激動人心的進展都基于邏輯推理。
相比之下,代數機器推理建立在計算代數和計算機代數系統之上。我們代數方法的核心思想是將推理具體實現為解決代學中的計算問題。關鍵是,沒有可滿足性的概念。我們不對 R = k[x1, ..., xn] 中的概念分配真值(或數值)。特別是,盡管 R 中的原始概念 h x1i, ..., h xni 對應于變量 x1, ..., xn,我們不對原始概念賦值。相反,理想被視為“實際研究對象”,我們將“解決推理任務”簡化為“解決涉及理想的非數值計算問題”。此外,我們的框架可以發現超出RPM任務實際規則的新模式;參見第5.2節。
在RPM任務中,我們有表示“位置”、“數量”、“類型”、“大小”和“顏色”的屬性概念;這些概念根據它們的語義將原始實例分類為人類稱為屬性的類別。直觀上,一個屬性概念以對任務“有意義”的方式將某些原始概念組合在一起。例如,作為一個“更簡單”或“更廣義”的概念比 更有意義,因為我們會將視為單一更廣泛的“顏色”概念的實例。
請注意,原始概念精確對應于我們對象檢測模型的預測類別。這些預測類別已經由現有數據隱式識別。因此,我們的方法受到我們的感知模塊所能感知的限制。對于其他任務,例如可以獲取文本數據的情況,可以使用實體提取方法來識別原始概念。另請注意,我們的方法需要先驗知識,因為推理模塊沒有訓練步驟。如果我們用通過深度學習優化的可訓練函數替換用戶定義的概念函數,可以緩解這一限制。一般來說,屬性概念的識別是任務特定的,推理性能將很大程度上依賴于這些識別出的屬性概念。實際上,我們選擇屬性概念將決定我們推理框架的歸納偏見:當我們將概念 J 分解為“更簡單”的概念(即 pd(J) 中的初級成分)時,僅那些包含在屬性概念中的“更簡單”概念被視為“有意義的”。具體來說,設 J, J' ? R 是概念,使得 pd(J) = {J1, ..., Jk} 和 pd(J') = {J1', ..., J'`'},即 J, J' 分別具有最小主分解 J = J1 ∩ · · · ∩ Jk 和 J' = J1' ∩ · · · ∩ J`'`。我們可以檢查它們的初級成分,并提取出(在兩個主分解之間)包含在某些共同屬性概念中的初級成分。例如,如果 A 是 R 的一個屬性概念,使得 J1 ? A 且 J1' ? A,那么 J 和 J' 共享一個“共同模式”,由屬性概念 A 表示。
3. 提議的代數框架
在抽象推理中,一個關鍵的認知步驟是從觀察中“發現模式”,這可以具體表述為“在觀察中尋找不變性”。在本節中,我們描述了如何使用被稱為理想的代數對象來表示RPM實例,如何從這些代數表征中提取模式,以及如何將RPMs作為代數中的計算問題解決,既適用于答案選擇,也適用于答案生成。
3.1. 預備知識
大多數涉及理想的代數計算,特別是“高級”操作(例如主分解),都需要計算它們的Grobner基作為關鍵的初始步驟。更廣泛地說,Grobner基計算構成了代數中大多數算法的支柱;參見附錄A.2。
主分解 在交換代數中,理想的主分解是整數質因分解概念的遠大概括。其對代數學家的重要性不言而喻。非正式地,每個理想 J 都可以分解為有限多個初級理想的交集 J = J1 ∩ · · · ∩ Js。這種交集被稱為 J 的主分解,每個 Jj 被稱為分解的初級成分。在 J 是一個單項式理想的特殊情況下,存在一個具有最大單項式初級成分的唯一最小主分解[4];我們用 pd(J) 表示這組唯一的初級成分。有關詳情,參見附錄A.3。
3.1.2 概念作為單項式理想
我們將一個概念定義為 R 的單項式理想。特別是,零理想 h0i ? R 是“空”概念,可以解釋為“不可能”或“無”,而理想 h1i = R 是“可想”概念,可以解釋為“可能”或“一切”。給定一個概念 J ? R,J 中的單項式被稱為該概念的實例。例如,xblackxsquare 是 h xsquarei(“正方形”概念)的實例。對于每個 xi,我們說 h xii ? R 是一個原始概念,而 xi 是一個原始實例。
定理 3.1. R 中有無限多個概念,盡管 R 中只有有限多個原始概念。此外,如果 J ? R 是一個概念,則以下情況成立:
(i) J 有無限多個實例,除非 J = h0i。
(ii) J 有一個由有限多個實例組成的唯一最小生成集,我們用 mingen(J) 表示。
(iii) 如果 J = h1i,則 J 有一個關聯概念的唯一集合 {P1, ..., Pk},以及一個唯一的最小主分解 J = J1 ∩ · · · ∩ Jk,使得每個 Ji 是一個包含在 Pi 中的概念,即在所有可能包含在 Pi 中的初級成分中是最大的概念。
有關定理 3.1 的證明以及為什么將概念定義為單項式理想能夠捕捉人類推理中概念的表達力,參見附錄 A.4 及更多詳情。
3.2. 第一階段:代數表征
我們將使用圖1中描繪的RPM實例作為貫穿始終的示例,以展示整個代數推理過程:(1) 代數表征;和 (2) 代數機器推理。在本小節中,我們關注第一階段。回想一下,每個RPM實例由填充有幾何實體的16個面板組成。對于我們的運行示例,每個實體可以使用4個屬性描述:“顏色”、“大小”、“類型”和“位置”。我們還需要一個額外的屬性來表示面板中實體的“數量”。
3.2.1 屬性概念
在人類認知中,某些語義上相似的概念自然會被分組形成一個更加通用的概念。例如,“紅”、“綠”、“藍”、“黃”等概念可以被分組形成一個代表“顏色”的新概念。直觀上,我們可以將“顏色”視為一個屬性,而“紅”、“綠”、“藍”、“黃”視為屬性值。
對于我們的運行示例,5個屬性由5個概念(單項式理想)表示。通常,每個屬性的所有可能值都被編碼為代表該屬性的概念的生成元。然而,為了便于解釋,我們僅考慮圖1中涉及的屬性值來解釋我們的示例:
3.2.2 RPM面板的表征
為了代數地編碼RPM圖像,我們首先需要訓練感知模塊直接從原始圖像中提取屬性信息。在我們的實驗中,一種可能的感知方法是分別訓練4個RetinaNet模型(每個模型具有ResNet-50骨干網絡),用于除“數量”外的所有4個屬性,“數量”可以通過直接計數邊界框的數量來推斷。
在提取實體的屬性值后,我們可以將每個面板表示為一個概念。例如,圖1中RPM的左上角面板可以編碼為多項式環 R 中的概念 。這里,J1,1 表示一個包含兩個實體的面板,左邊是一個平均大小的黑色正方形,右邊是一個平均大小的灰色三角形。J1,1 中的索引告訴我們該面板位于第1行,第1列。類似地,我們可以將問題矩陣的其余7個面板編碼為概念 ,并將8個答案選項編碼為概念 Jans1、...、Jans8。通常,每個概念的單項式生成元描述相關面板中的一個實體。
由8個概念 J = [J1,1, ..., J3,2] 組成的列表將被稱為概念矩陣;這表示帶有缺失第9個面板的RPM問題矩陣。令 Ji := [Ji,1, Ji,2, Ji,3](對于 i = 1, 2)表示問題矩陣中的第 i 行。
3.3. 第二階段:代數機器推理
在第3.2節中,我們已經將RPM實例中的問題矩陣編碼為概念矩陣 J = [J1,1, ..., J3,2]。在本小節中,我們將介紹我們代數框架的推理過程。
我們提取 J 某一行模式的目標可以數學上表述為“在代表該行面板的概念之間尋找不變性”。(相同的過程可以應用于列。)這個看似不精確的“尋找不變性”概念可以通過主分解的計算非常具體地實現。理想情況下,我們希望提取對人類有意義的內容。因此,我們設計了4個不變性模塊,以模仿人類在模式識別中的認知。
3.3.1 先驗知識
為了使用代數機器推理,我們采納:
? 屬性概念的歸納偏見(參見第3.2.1節);
J∩ 是以兩種不同方式捕獲整個序列 J1, ..., Jk 信息的概念。接下來,我們計算 J+ 和 J∩ 的公共初級成分,這些成分包含在屬性概念中。最后,我們返回與這些公共初級成分相關的屬性:
2. 互不變性模塊提取 pd(J∩) 和 pd(J+) 之間集合差引起的模式。之后,我們檢查這些提取的模式在多個序列中的不變性。提取的模式集為:
其中 I 是一組概念,“?”指集合差。我們省略 pd(J+),以避免重復計算前一模塊已提取的模式。非正式地,對于每對 (attr, I),I 中的概念可以解釋為那些至少對應于 中的一個、但不對應于 的所有概念,并且包含在 中的“主要”概念。
3.4. 解決RPMs
3.4.1 答案選擇
在第3.3.4節中,我們描述了如何使用4個不變性模塊提取逐行的模式。因此,答案選擇的一個自然方法是確定哪一個答案選項,當替換缺失面板時,能最大化所有三行共有的模式數量。因此,答案選擇簡化為一個簡單的優化問題;參見算法1。
3.4.2 答案生成
由于我們的代數機器推理框架能夠提取隱藏在原始RPM圖像中的對人類有意義共有的模式,它提供了一種無需給定答案集就能生成答案的新方法。這類似于一個天才人類能夠通過首先識別前兩行的模式,然后推斷缺失面板應該是什么來解決RPM任務。直觀上,我們應用4個不變性模塊的“逆”操作來生成代表缺失面板的概念;有關概述,參見算法2。
簡而言之,對于給定的RPM概念矩陣 J,我們首先通過 計算前兩行之間的共同模式;參見(1)。P1,2(J) 中的每個元素是一個對 (K, Jˇ),其中 K 是一個特定于單一屬性的共同模式(針對第1行和第2行),Jˇ 是相應的概念矩陣。(這代表天才人類進行模式發現的困難步驟。)然后,我們遍歷所有共同模式,計算缺失第9個面板的屬性值。(這代表對發現的模式進行常規一致性檢查;有關完整的算法細節,參見附錄B.2,以及附錄B.3的示例。)
通常,在整合 P1,2(J) 中模式的屬性值以得出 J3,3 時,可能會出現以下情況:(i) 實體對于單一屬性有多個可能的值;或 (ii) 實體缺少屬性值。情況 (i) 發生在為單一屬性提取多個模式時,而情況 (ii) 發生在該屬性沒有非沖突模式時。對于這兩種情況,我們從可能的值中隨機選擇一個屬性值。
5. 實驗結果
為了展示我們框架的有效性,我們在RAVEN[83]和I-RAVEN數據集上進行了實驗。在兩個數據集中,RPMs根據7種配置生成。我們在I-RAVEN[26]的4200張圖像上訓練了我們的感知模塊(每種配置600張),并使用它們預測實體的屬性值。我們的感知模塊的平均準確率為96.24%。對于兩個數據集,我們對每種配置的2000個實例進行了測試。總體而言,我們的推理框架速度很快(在16核Gen11 Intel i7 CPU處理器上處理14000個實例僅需7小時)。有關完整的實驗細節,參見附錄B。
5.1. 與其他基線的比較
表1比較了我們方法與10個其他基線方法的表現。我們使用[26, 89]中報告的I-RAVEN上的準確率作為方法1-7的結果,使用[83, 89]中報告的RAVEN上的準確率作為方法1-5的結果。其余的準確率均來自原始論文。作為參考,我們還包括[83]中報告的RAVEN數據集(即非I-RAVEN)上的人類表現。
5.2. 模糊實例和新模式
盡管我們的方法優于所有基線,但有些實例在我們的框架中被分配了相等最高分數的多個答案選項。這些情況大多因發現(i) “偶然”的非預期規則(例如圖3);或(ii) 數據集中實際規則之外的新模式(例如圖4)而發生。情況(i) 發生的原因是,在I-RAVEN的設計中,每個屬性最多分配一個規則。有趣的是,情況(ii) 揭示了我們的框架能夠發現完全不在I-RAVEN原始設計規則中的新模式。在圖4中,發現的新模式對于人類來說顯然非常自然。
5.3. 答案生成的評估
假設每個RPM實例在給定的答案集中有一個正確答案。然而,還有多個其他可能的圖像也可以被接受為正確答案。例如,通過隨機擾動不涉及任何規則的屬性(例如I-RAVEN數據集中實體的角度)修改的給定正確答案圖像也是正確的。所有這些不同的正確答案(圖像)可以根據RPM任務相關原始感知屬性的先驗知識,代數地編碼為相同的概念。因此,為了評估第3.4.2節中提出的答案生成過程,我們將直接評估生成的概念。
設 分別表示真實答案和我們生成的答案的概念。這里,每個 是形式為 的單項式,表示由4個屬性描述的實體。受眾所周知的交并比(IoU)思想的啟發,我們提出了一種新的 J 和 J' 之間的相似性度量。為了定義類似“交集”和“并集”的概念,我們首先將 ei 與 e'j 配對,如果 x^(i_pos) = x'^(j_pos)(即相同的“位置”值)。這種配對是定義良好的,因為任何面板中實體的“位置”值是唯一確定的。因此,我們可以將 J 和 J' 中的所有實體分組為3個集合:
在公式 (3) 中, a 表示 4 個屬性集合 { pos, type, color, size } 中的一個。這里, φ ( e i , e j ′ ) 表示元素 e i 和 e j ′ 之間的相似度分數,以公共變量的比例來衡量。
生成答案的整體平均相似度得分為 67.7%。需要注意的是,在某些面板中,比如 2x2 網格、3x3 網格、內外網格(例如圖 3 所示),某些屬性值(如“大小”“顏色”“位置”)可能是完全隨機的。因此,在這些情況下獲得較高的相似度分數本質上需要特定任務的優化和對數據生成方式的了解,但我們并未假設這些知識。這可能解釋了為什么整體相似度得分低于答案選擇的準確率。
有關生成圖像的示例,請參見附錄 B.5。
6. 結論
代數機器推理是一種非常適用于抽象推理的推理框架。在目前的形式中,我們利用主分解作為關鍵代數操作,通過專門設計的“不變模塊”來模擬人類推理,從而在 RPM 任務中發現抽象模式。將“發現共同模式”的思想具體實現為“計算主分解”是一個非常廣泛的思路,可能也適用于其他推理任務。
更廣泛地說,我們的代數方法為利用龐大的交換代數和計算代數文獻開辟了新可能。關于理想的眾多代數操作(如理想商、根、飽和等)和代數不變量(如深度、高度等),在機器推理甚至整個 AI 領域中都尚未被充分探索。我們能否利用這些工具來解決其他推理任務?
附C:
C. 進一步討論 C.1. 為什么代數機器推理與基于邏輯的推理不同?
邏輯是推理的基礎。邏輯編程[3, 28, 41]是一種基于邏輯的編程范式,作為基于邏輯的推理方法的基礎計算框架。在基于邏輯的推理方法中,核心思想是推理可以非常具體地實現為邏輯表達式的消解(或逆向消解)。這一思想內在地包含了可滿足性的概念;參見[28]。直觀上,我們有一個邏輯表達式,通常以某種標準范式表達,我們希望為邏輯表達式中的文字(true或false)分配真值,使得整個邏輯表達式得到滿足(即真值為“true”)。事實上,當今自動定理證明領域[2, 27, 36, 39, 54, 74, 81, 92]中許多令人興奮的進展都基于基于邏輯的推理。
相比之下,代數機器推理本質上不是基于搜索的。在解決RPM(關系推理矩陣)任務時,發現的新模式是通過代數計算得出的。對于RPM答案生成任務,我們不是在所有候選答案的(龐大)空間中搜索有效答案,而是直接計算出我們的答案。模式發現變成了計算:我們在計算各種初級分解,并計算哪些初級分量包含在屬性概念中。對于RPM答案選擇任務,我們將其作為“計算并選擇”問題來解決。對于RPM答案生成任務,我們在可能的情況下從提取的模式中計算屬性值,并為未參與提取模式的實體的屬性隨機選擇屬性值。
C.2. 代數機器推理的潛在社會影響
代數機器推理有可能幫助自動化目前人類執行的“較容易”的推理任務。在教育領域,代數機器推理可以幫助設計更好的智力測試。在金融領域,我們的框架可以幫助處理個人銀行貸款申請或檢測欺詐行為,基于這些案例的不變特征。然而,也可能存在負面的影響。我們的推理過程是基于從少量示例中提取模式(如在RPM任務中)并進行泛化。如果銀行貸款申請或欺詐案例已經被不公平地與某些社會經濟群體相關聯,那么這種不平等也會在我們的推理框架中被傳播。
我們框架的另一個潛在下游應用是在醫學診斷中。基于患者報告的癥狀和過去的病史進行的診斷決策可以被建模為推理任務。具體癥狀和醫療狀況可以被編碼為概念,最終的醫學診斷有可能被計算出來。如果得到適當實施,用于醫學診斷的代數機器推理框架將顯著加快診斷決策過程,并降低醫學診斷的成本。不幸的是,盡管這種應用帶來了明顯的益處,但也伴隨著倫理問題。如果醫生使用代數機器推理來輔助診斷決策時做出了錯誤的醫學診斷,誰應該承擔責任?推理框架的創造者是否需要承擔法律責任?
偏見也可能存在于機器推理框架的人類編碼過程中。如果編碼的概念反映了現有的人類偏見,那么推理輸出可能是有缺陷的,但看起來似乎“合理”。對于任何將代數機器推理應用于法律或刑事案件的未來應用,必須在評估和處理與每一方相關的信息(概念)時格外小心。盡管公平性超出了我們框架的范圍,但我們的方法可能會揭示潛在的誤用。
最后,由于代數機器推理能夠在RPM任務(最初設計用于評估一般人類智力和抽象推理的智力測試)上超越人類表現,我們的工作實際上正在打破人類認知的一個最大堡壘。
原文鏈接:https://arxiv.org/pdf/2303.11730
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.