Concepts as Semantic Pointers: A Framework and Computational Model
作為語(yǔ)義指針的概念:一個(gè)框架與計(jì)算模型
https://onlinelibrary.wiley.com/doi/pdfdirect/10.1111/cogs.12265
摘要
基于原型、范例和類理論結(jié)構(gòu)的概念理論的調(diào)和是認(rèn)知科學(xué)中的一個(gè)長(zhǎng)期問(wèn)題。針對(duì)這一問(wèn)題,研究者們最近傾向于采用混合理論,將各種類型的表征結(jié)構(gòu)結(jié)合起來(lái),或者采用消除理論,用更精細(xì)的心理表征分類來(lái)取代概念。在本文中,我們描述了一種替代性方法,涉及一種名為“語(yǔ)義指針”的單一類別的心理表征。語(yǔ)義指針是由感知、詞匯和運(yùn)動(dòng)表征的壓縮與遞歸綁定所產(chǎn)生的類似符號(hào)的表征,有效地整合了傳統(tǒng)聯(lián)結(jié)主義和符號(hào)主義方法。我們提出了一個(gè)使用語(yǔ)義指針的計(jì)算模型,該模型復(fù)制了涉及每種先前范式分類研究的實(shí)驗(yàn)數(shù)據(jù)。我們認(rèn)為,涉及語(yǔ)義指針的框架可以為概念現(xiàn)象提供統(tǒng)一的解釋,并將我們的框架與現(xiàn)有替代方案在概念的范圍、內(nèi)容、遞歸組合和神經(jīng)實(shí)現(xiàn)方面進(jìn)行了比較。
關(guān)鍵詞:概念;分類;神經(jīng)計(jì)算;語(yǔ)義學(xué);計(jì)算建模;心理表征
1. 引言
概念的研究在近期認(rèn)知功能理論的發(fā)展中發(fā)揮了核心作用。從分類到語(yǔ)言使用,各種現(xiàn)象都可以通過(guò)概念加工來(lái)有效地描述(參見(jiàn)Murphy, 2002的綜述),并且許多有影響力的認(rèn)知發(fā)展描述都是基于假設(shè)概念是我們對(duì)世界知識(shí)的基本表征單元而產(chǎn)生的(例如,Carey, 1985, 2009;Tenenbaum, Kemp, Griffiths, & Goodman, 2011)。然而,盡管概念對(duì)認(rèn)知科學(xué)的持續(xù)研究顯然具有重要意義,但研究者們對(duì)概念在大腦中的結(jié)構(gòu)和表征方式有著截然不同的觀點(diǎn)。
這種分歧的主要原因是,不同學(xué)科的理論家有著眾多且有時(shí)相互沖突的解釋目標(biāo)。例如,心理學(xué)家通常希望解釋涉及分類和概念學(xué)習(xí)等任務(wù)的實(shí)驗(yàn)數(shù)據(jù)(例如,Lin & Murphy, 1997;Regehr & Brooks, 1993;Rips, 1989;Smith & Medin, 1981)。而哲學(xué)家則通常希望理解概念的語(yǔ)義和擁有條件(例如,F(xiàn)odor, 1998;Laurence & Margolis, 1999;Peacocke, 1992;Prinz, 2002)。即使在達(dá)成一致的解釋目標(biāo)時(shí),需要解釋的數(shù)據(jù)范圍往往過(guò)于龐大且分散,難以發(fā)展出統(tǒng)一的理論(Murphy, 2002)。例如,僅憑原型理論、范例理論或概念理論理論的個(gè)體資源,無(wú)法全面解釋分類現(xiàn)象(Rogers & McClelland, 2004)。
為了應(yīng)對(duì)這一僵局,研究者們最近傾向于采用兩種一般策略之一。第一種策略涉及提出“混合”或“多元”模型,其中單個(gè)概念對(duì)應(yīng)于多個(gè)相關(guān)或共指的表征結(jié)構(gòu),這些結(jié)構(gòu)用于解釋不同現(xiàn)象(Laurence & Margolis, 1999;Murphy, 2002;Weiskopf, 2009)。第二種策略則相反,主張?jiān)谡J(rèn)知科學(xué)的詞匯中用更精細(xì)的心理表征分類取代“概念”一詞,這些表征各自具有不同的功能(Machery, 2009)。這兩種方法的相對(duì)優(yōu)劣是當(dāng)前爭(zhēng)論的主題(Machery, 2010),但可以說(shuō),這兩種觀點(diǎn)都沒(méi)有獲得廣泛的支持。
在本文中,我們提出了一個(gè)替代性的、統(tǒng)一的解決方案,以應(yīng)對(duì)當(dāng)前概念研究中的挑戰(zhàn)。利用用于表征神經(jīng)系統(tǒng)中表征狀態(tài)的方法(Eliasmith, 2003, 2013;Eliasmith & Anderson, 2003),我們用涉及一種最近被假設(shè)的心理表征類別——“語(yǔ)義指針”(Eliasmith, 2013)的過(guò)程來(lái)描述概念。粗略地說(shuō),語(yǔ)義指針是神經(jīng)實(shí)現(xiàn)的、類似符號(hào)的表征,可以通過(guò)多種方式轉(zhuǎn)換以產(chǎn)生進(jìn)一步的表征,這些表征支持分類、推理和語(yǔ)言使用等認(rèn)知過(guò)程。值得注意的是,語(yǔ)義指針已成功用于解釋目前世界上最大的功能性人腦模型中的一系列感知、認(rèn)知和運(yùn)動(dòng)行為(Eliasmith et al., 2012)。然而,過(guò)去的工作并未詳細(xì)探討語(yǔ)義指針與概念現(xiàn)象的相關(guān)性。因此,我們的目標(biāo)是展示基于語(yǔ)義指針的建??蚣芸梢詾楦拍罾碚摷覀鹘y(tǒng)上感興趣的那類現(xiàn)象提供統(tǒng)一的解釋。為了支持我們的觀點(diǎn),我們描述了一個(gè)生物學(xué)上合理的脈沖神經(jīng)元模型,該模型處理語(yǔ)義指針以解釋用于支持三種競(jìng)爭(zhēng)性概念理論(原型理論、范例理論和理論理論)的分類實(shí)驗(yàn)數(shù)據(jù)。
2. 概念理論的標(biāo)準(zhǔn)
盡管用于評(píng)估概念理論的標(biāo)準(zhǔn)常常存在爭(zhēng)議,但人們普遍承認(rèn)某些認(rèn)知功能是典型的概念性功能。例如,語(yǔ)言使用、推理以及命題態(tài)度的形成只是眾多被明確界定為涉及概念操作的認(rèn)知任務(wù)中的一部分。因此,我們將從認(rèn)為概念理論應(yīng)當(dāng)解釋這些概念功能是如何實(shí)現(xiàn)的觀點(diǎn)出發(fā)。然而,除了這些功能解釋之外,還應(yīng)當(dāng)提供某些理論解釋。例如,應(yīng)當(dāng)解釋概念如何能夠在從抽象到普通的種類之間變化,以及它們?nèi)绾文軌蛑复F(xiàn)實(shí)世界中的對(duì)象群體。鑒于這些考慮,我們提出以下標(biāo)準(zhǔn)作為對(duì)概念加工的令人滿意的解釋的最低要求(參見(jiàn)Barsalou, 1999;Fodor, 1998;Laurence & Margolis, 1999;Prinz, 2002):
1. 分類
2. 遞歸綁定
3. 神經(jīng)實(shí)現(xiàn)
4. 范圍
5. 內(nèi)容
當(dāng)然,還可以選擇其他標(biāo)準(zhǔn),但我們選擇了這五個(gè)標(biāo)準(zhǔn),原因很簡(jiǎn)單,它們似乎捕捉到了大量概念現(xiàn)象的共同屬性。例如,分類任務(wù)在有關(guān)概念的文獻(xiàn)中被廣泛研究(Murphy, 2002),并且在某些情況下會(huì)調(diào)用背景知識(shí),以推理的形式將對(duì)象屬性與類別成員身份聯(lián)系起來(lái)。因此,合理地認(rèn)為涉及推理和語(yǔ)言的其他概念過(guò)程的描述可以部分地被理解為更復(fù)雜的分類形式。由于這些以及相關(guān)的原因,我們?cè)谀M中只關(guān)注分類效應(yīng)。
對(duì)于任何概念加工的解釋來(lái)說(shuō),對(duì)綁定的解釋也是一個(gè)重要的目標(biāo):它既涉及包含多個(gè)概念的組合結(jié)構(gòu)的形成(例如,LARGE RED DOG),也涉及類別實(shí)例的多模態(tài)表征的整合。綁定已經(jīng)吸引了許多對(duì)心理表征結(jié)構(gòu)感興趣的研究人員的廣泛關(guān)注(例如,Jackendoff, 2002),因此我們認(rèn)為這是一個(gè)相對(duì)沒(méi)有爭(zhēng)議的約束條件。
關(guān)于神經(jīng)實(shí)現(xiàn),當(dāng)然,說(shuō)概念過(guò)程是神經(jīng)過(guò)程多少有點(diǎn)老生常談。但由于神經(jīng)過(guò)程的性質(zhì)可能限制了認(rèn)知系統(tǒng)能夠輕松計(jì)算的函數(shù)類型(Eliasmith & Anderson, 2003),因此,任何特定認(rèn)知模型所描述的函數(shù)是否確實(shí)可以被神經(jīng)實(shí)現(xiàn)仍然是一個(gè)懸而未決的問(wèn)題。因此,采用神經(jīng)實(shí)現(xiàn)標(biāo)準(zhǔn)表明,其他條件相同的情況下,對(duì)特定模型的實(shí)現(xiàn)展示將極大地有利于該模型。
至于更具理論性的標(biāo)準(zhǔn),范圍指的是不同種類概念的廣泛多樣性。概念包括可感知對(duì)象(例如,TABLE)的概念、抽象概念(例如,VIRTUE)、理論假設(shè)(例如,GENE)、數(shù)學(xué)術(shù)語(yǔ)(例如,SUM)以及不存在的實(shí)體(例如,CENTAUR)等(Prinz, 2002)。一個(gè)好的理論應(yīng)該能夠解釋這些不同類別的概念,并且應(yīng)該與將特定神經(jīng)系統(tǒng)和解剖區(qū)域與這些類別加工相關(guān)聯(lián)的現(xiàn)有證據(jù)保持一致。例如,對(duì)患有語(yǔ)義缺陷的神經(jīng)病學(xué)患者的研究表明,具體實(shí)體和抽象實(shí)體的概念是在不同的神經(jīng)系統(tǒng)中加工的(Shallice & Cooper, 2013)。
最后,概念是關(guān)于事物的,這意味著它們具有內(nèi)容或意義。這種內(nèi)容反過(guò)來(lái)可以大致定義為一個(gè)給定概念如何描述它所代表的事物。一個(gè)充分的理論必須解釋為什么一個(gè)給定的概念指稱某些事物而不是其他事物(即,提供其外延的解釋),并且還必須解釋為什么這個(gè)概念以某種方式而不是其他方式描述這些指稱對(duì)象(即,提供其內(nèi)涵的解釋)。關(guān)于心理表征的語(yǔ)義和個(gè)體化問(wèn)題的哲學(xué)文獻(xiàn)為采用這一標(biāo)準(zhǔn)提供了動(dòng)機(jī)(例如,F(xiàn)odor, 1987, 1998;Peacocke, 1992;Prinz, 2002)。
總結(jié)來(lái)說(shuō),前三個(gè)標(biāo)準(zhǔn)涉及概念功能的性質(zhì)和實(shí)現(xiàn),而后兩個(gè)標(biāo)準(zhǔn)涉及使這些功能得以實(shí)現(xiàn)的表征的理論屬性。我們的框架旨在滿足這些標(biāo)準(zhǔn),盡管我們對(duì)前三個(gè)標(biāo)準(zhǔn)的討論旨在更加全面,而對(duì)后兩個(gè)標(biāo)準(zhǔn)的討論則旨在更具啟發(fā)性。為了開(kāi)始詳細(xì)發(fā)展框架,我們首先描述神經(jīng)表征和計(jì)算的原則,這些原則推動(dòng)了我們?cè)S多論點(diǎn)的形成。
3. 神經(jīng)表征與計(jì)算
盡管人們普遍接受心理表征是神經(jīng)系統(tǒng)的特征,但當(dāng)前的認(rèn)知建模方法通常不會(huì)用高度詳細(xì)的神經(jīng)術(shù)語(yǔ)來(lái)描述表征。例如,符號(hào)主義方法通常用基于類似語(yǔ)言的語(yǔ)法結(jié)構(gòu)的原子表征來(lái)定義計(jì)算(例如,F(xiàn)odor, 1975),很少甚至從不考慮神經(jīng)細(xì)節(jié)。聯(lián)結(jié)主義方法則使用大量個(gè)體處理節(jié)點(diǎn)之間的加權(quán)連接來(lái)描述表征(例如,Rogers & McClelland, 2004; Rumelhart & McClelland, 1986),但這些模型僅粗略對(duì)應(yīng)于大腦的結(jié)構(gòu),且忽略了真實(shí)神經(jīng)元的生理屬性、動(dòng)態(tài)屬性和連接方式等許多重要細(xì)節(jié)。
我們傾向于采用一種用大量單個(gè)脈沖神經(jīng)元的活動(dòng)來(lái)描述表征和計(jì)算的方法。更具體地說(shuō),我們采用了Eliasmith和Anderson(2003)開(kāi)發(fā)的神經(jīng)工程框架(NEF)。根據(jù)該框架,脈沖神經(jīng)元的活動(dòng)模式可以用數(shù)學(xué)對(duì)象(如向量,即一組數(shù)值)來(lái)描述,這些向量反過(guò)來(lái)可以捕捉有關(guān)世界的信息(通過(guò)神經(jīng)元對(duì)環(huán)境刺激的調(diào)諧)。通過(guò)指定兩個(gè)或多個(gè)神經(jīng)元群體之間的突觸權(quán)重集合,可以計(jì)算這些向量的轉(zhuǎn)換,包括將多個(gè)向量綁定在一起以在向量空間中嵌入復(fù)雜層次結(jié)構(gòu)的轉(zhuǎn)換。因此,NEF有時(shí)被描述為一種將基于向量的算法翻譯成神經(jīng)脈沖語(yǔ)言的編譯器(見(jiàn)Eliasmith, 2013)。對(duì)于我們來(lái)說(shuō),以這種定量方式描述神經(jīng)系統(tǒng)的活動(dòng)有兩個(gè)顯著優(yōu)勢(shì)。首先,已有成熟的技術(shù)可以將各種詞匯、感官和運(yùn)動(dòng)表征轉(zhuǎn)換為向量(Georgopoulos, Schwartz, & Kettner, 1986; Jones & Mewhort, 2007; Plate, 2003),因此向量具有足夠的表征能力來(lái)解釋概念表征的多模態(tài)性質(zhì)(參見(jiàn)Barsalou, 1999)。其次,涉及向量的計(jì)算可以實(shí)現(xiàn)強(qiáng)大的遞歸綁定形式(Gayler, 1998; Kanerva, 1994; Plate, 2003; Smolensky, 1990),鑒于即使是簡(jiǎn)單概念也與大量?jī)?nèi)容相關(guān)聯(lián),綁定的解釋可能是開(kāi)發(fā)合理概念加工模型的關(guān)鍵。
在NEF中,可以通過(guò)一種稱為循環(huán)卷積的過(guò)程來(lái)實(shí)現(xiàn)綁定(Eliasmith, 2004, 2013)。撇開(kāi)數(shù)學(xué)細(xì)節(jié)不談,循環(huán)卷積可以被視為一種將兩個(gè)輸入向量混合成一個(gè)相同維度的輸出向量的函數(shù)。實(shí)現(xiàn)這一功能相對(duì)直接:如果兩個(gè)“輸入”神經(jīng)元群體分別代表一個(gè)向量,并且連接到一個(gè)中間群體,該中間群體投射到一個(gè)“輸出”群體,那么可以使用NEF求解這些群體之間的突觸權(quán)重集合,從而使輸出群體編碼一個(gè)向量,該向量是兩個(gè)輸入向量的卷積。這個(gè)過(guò)程可以無(wú)限重復(fù),并且也可以逆轉(zhuǎn),以恢復(fù)遞歸生成結(jié)構(gòu)中綁定的任何一個(gè)向量的近似值??傮w而言,NEF具備描述涉及多種神經(jīng)表征的復(fù)雜句法操作(包括組合和分解)的所有工具。NEF的神經(jīng)表征和計(jì)算原則相結(jié)合,描述了一種非常強(qiáng)大的表征類型,Eliasmith(2013)將其稱為“語(yǔ)義指針”。我們以語(yǔ)義指針的概念為起點(diǎn),開(kāi)發(fā)一種能夠滿足第2節(jié)中提出的全部五個(gè)標(biāo)準(zhǔn)的概念解釋。
4. 語(yǔ)義指針
在其最基本的形式中,語(yǔ)義指針可以被看作是一種壓縮表征,捕捉關(guān)于特定領(lǐng)域的摘要信息。通常,這類表征源自感知輸入。例如,視野中一個(gè)物體的圖像最初會(huì)被編碼為大量神經(jīng)元群體的一種活動(dòng)模式。然而,通過(guò)上述類型的轉(zhuǎn)換,進(jìn)一步的神經(jīng)元群體層會(huì)產(chǎn)生關(guān)于原始視覺(jué)輸入的越來(lái)越抽象的統(tǒng)計(jì)摘要(見(jiàn)圖1)。最終,可以產(chǎn)生一個(gè)高度壓縮的輸入表征。這種描述既與視覺(jué)皮層中較晚層次神經(jīng)元數(shù)量的減少一致,也與受神經(jīng)啟發(fā)的用于降維的層次化統(tǒng)計(jì)模型的發(fā)展一致(Hinton & Salakhutdinov, 2006; Serre, Oliva, & Poggio, 2007)。類似的表征也可以在其他模態(tài)(如聽(tīng)覺(jué)和觸覺(jué))中生成。
之所以將這種壓縮表征稱為語(yǔ)義指針,是因?yàn)樗鼈兺ㄟ^(guò)壓縮過(guò)程與所表征的狀態(tài)非任意相關(guān),從而保留了關(guān)于這些狀態(tài)的語(yǔ)義信息。之所以稱這些表征為指針,是因?yàn)樗鼈兛梢杂脕?lái)“指向”或再生壓縮網(wǎng)絡(luò)中較低層次的表征(Hinton & Salakhutdinov, 2006)。此外,任何一個(gè)給定的語(yǔ)義指針都可以獨(dú)立于生成它的網(wǎng)絡(luò)進(jìn)行操作。例如,一個(gè)關(guān)于桌子的感知的語(yǔ)義指針可以在與桌子相關(guān)的認(rèn)知任務(wù)中使用,而不一定引發(fā)相關(guān)壓縮網(wǎng)絡(luò)底部更豐富的感知表征的重新激活。
語(yǔ)義指針的計(jì)算能力在于它們能夠通過(guò)壓縮操作(如循環(huán)卷積)被綁定在一起,形成包含來(lái)自多種來(lái)源的詞匯、感知和運(yùn)動(dòng)信息的高度結(jié)構(gòu)化表征。重要的是,這些結(jié)構(gòu)化表征本身也是語(yǔ)義指針,因?yàn)樗鼈兛梢灾赶虿⒃偕鼈兯鶚?gòu)建的下屬表征。再次考慮桌子這個(gè)玩具示例。通過(guò)已經(jīng)描述過(guò)的遞歸綁定(這是一種壓縮操作),關(guān)于桌子的視覺(jué)和觸覺(jué)圖像的語(yǔ)義指針可以被結(jié)合起來(lái),同時(shí)還可以結(jié)合關(guān)于“桌子”聲音的聽(tīng)覺(jué)圖像的指針和關(guān)于字母“t-a-b-l-e”的視覺(jué)圖像的指針。此外,各種對(duì)應(yīng)于諸如“有一個(gè)平面”或“用于吃飯”等語(yǔ)言信息的結(jié)構(gòu)也可能被綁定在一起。這些結(jié)構(gòu)本身也將由其他語(yǔ)義指針構(gòu)建而成,包括壓縮后的關(guān)于平面、用餐場(chǎng)景等的視覺(jué)圖像??傮w而言,這些眾多綁定操作的結(jié)果是一個(gè)單一的表征,它捕捉了與桌子相關(guān)的廣泛內(nèi)容之間的關(guān)系。這個(gè)單一表征可以通過(guò)多種方式轉(zhuǎn)換,以重新訪問(wèn)桌子的圖像、關(guān)于桌子的語(yǔ)言信息,或者通常用于與桌子互動(dòng)的運(yùn)動(dòng)指令。
此時(shí),語(yǔ)義指針在解釋概念現(xiàn)象方面的高度適用性應(yīng)該已經(jīng)顯而易見(jiàn)。它們可以解釋以單一對(duì)象類別為中心的符號(hào)過(guò)程、感知模擬以及許多其他功能。換句話說(shuō),它們可以作為一個(gè)類別事物的摘要表征,而這正是概念通常被認(rèn)為所具有的功能。使用語(yǔ)義指針已經(jīng)成功地進(jìn)行了諸如簡(jiǎn)單語(yǔ)言推理(Eliasmith, 2013)、歸納推理(Rasmussen & Eliasmith, 2011)和基于規(guī)則的問(wèn)題解決(Stewart & Eliasmith, 2011)等概念任務(wù)的神經(jīng)模擬,以及能夠執(zhí)行多種認(rèn)知功能的大規(guī)模腦模型(Eliasmith et al., 2012)。基于這些成功的應(yīng)用,我們認(rèn)為語(yǔ)義指針的概念為解釋廣泛的概念現(xiàn)象提供了理想的基礎(chǔ)。
5. 概念作為語(yǔ)義指針
人們可能會(huì)傾向于聲稱概念就是語(yǔ)義指針。然而,我們避免這種理論表述,原因很簡(jiǎn)單:語(yǔ)義指針在孤立狀態(tài)下無(wú)法滿足所有期望的標(biāo)準(zhǔn)?;叵胍幌?,語(yǔ)義指針只是一個(gè)由神經(jīng)元群體的脈沖活動(dòng)編碼的向量。這個(gè)向量捕捉了其他各種表征之間的關(guān)系,并且可以通過(guò)多種方式轉(zhuǎn)換以訪問(wèn)這些表征,但向量本身并不具備普通概念所具有的完整語(yǔ)義內(nèi)容。因此,與其將語(yǔ)義指針視為等同于概念的實(shí)體,不如將其視為使概念得以發(fā)生的基礎(chǔ)實(shí)體。
在我們的觀點(diǎn)中,概念最好被視為一種傾向性(dispositional)的存在。擁有一個(gè)概念意味著能夠激活各種神經(jīng)狀態(tài)序列,這些序列對(duì)應(yīng)于圍繞單一類別的視覺(jué)和聽(tīng)覺(jué)模擬、自然語(yǔ)言表達(dá)以及運(yùn)動(dòng)指令等。這些過(guò)程中的相關(guān)神經(jīng)狀態(tài)是由語(yǔ)義指針的轉(zhuǎn)換產(chǎn)生的,并且在任何給定的概念發(fā)生場(chǎng)合中,只會(huì)有有限范圍的可能轉(zhuǎn)換得以執(zhí)行。換句話說(shuō),構(gòu)成給定概念發(fā)生的神經(jīng)過(guò)程是依賴于情境和任務(wù)的(Barsalou, 1999)。例如,涉及語(yǔ)言推理的概念任務(wù)將激活與涉及觸覺(jué)刺激分類的概念任務(wù)不同的神經(jīng)狀態(tài)(見(jiàn)圖2)。同樣,涉及“狗”這一概念的認(rèn)知任務(wù)可能在一個(gè)個(gè)體中喚起對(duì)大型動(dòng)物的視覺(jué)模擬,而在另一個(gè)個(gè)體中喚起對(duì)小型動(dòng)物的模擬。闡述這一理論的部分任務(wù)是解釋影響這種情境多樣性的因素。盡管如此,我們的觀點(diǎn)是,這些構(gòu)成概念加工的各種神經(jīng)狀態(tài)都源自一個(gè)共同的起點(diǎn),即語(yǔ)義指針的轉(zhuǎn)換。
鑒于這種描述,重要的是要考慮我們的觀點(diǎn)與最近發(fā)展起來(lái)的“新經(jīng)驗(yàn)主義”理論之間的明顯相似性,這些理論將概念加工等同于部分重新激活之前捕捉到的感知狀態(tài)(例如,Barsalou, 1999; Barsalou, Simmons, Barbey, & Wilson, 2003; Barsalou, Santos, Simmons, & Wilson, 2008; Prinz, 2002)。例如,Barsalou(1999)將概念等同于“模擬器”或有組織的類別特定感知符號(hào)系統(tǒng),這些符號(hào)可以被選擇性地轉(zhuǎn)移到工作記憶中。正如人們可能預(yù)期的那樣,這種將符號(hào)轉(zhuǎn)移到工作記憶的過(guò)程與通過(guò)轉(zhuǎn)換語(yǔ)義指針來(lái)訪問(wèn)詳細(xì)感知表征的過(guò)程高度相似。同樣,Prinz(2002)聲稱概念是“代理型”(即“可以通過(guò)工作記憶招募來(lái)表征類別的感知派生表征”)(第149頁(yè)),這與我們關(guān)于概念作為部分對(duì)應(yīng)于感知模擬的過(guò)程的觀點(diǎn)有許多共同之處。
語(yǔ)義指針框架與這些新經(jīng)驗(yàn)主義理論之間存在兩個(gè)顯著差異。首先,語(yǔ)義指針理論與非模態(tài)表征的存在是一致的。例如,對(duì)應(yīng)于詞匯項(xiàng)的語(yǔ)義指針可以包含關(guān)于相關(guān)項(xiàng)在某些語(yǔ)境中共現(xiàn)的非模態(tài)統(tǒng)計(jì)信息(Eliasmith, 2013)。在缺乏感知表征的情況下訪問(wèn)此類信息可以解釋在某些需要驗(yàn)證詞語(yǔ)與屬性之間匹配的任務(wù)中的反應(yīng)時(shí)間(例如,Solomon & Barsalou, 2004)。此外,鑒于通常被用來(lái)支持嚴(yán)格經(jīng)驗(yàn)主義理論的論據(jù)和證據(jù)的爭(zhēng)議性(Machery, 2007),以及存在證據(jù)表明具體和抽象概念是在至少部分分離的系統(tǒng)中加工的(Shallice & Cooper, 2013),我們認(rèn)為語(yǔ)義指針框架在這一問(wèn)題上的中立性是一種優(yōu)點(diǎn)。
其次,我們提出的觀點(diǎn)對(duì)概念的實(shí)際表征方式提供了不同的解釋。新經(jīng)驗(yàn)主義理論通常將概念等同于(1)模擬器(即有組織的感知符號(hào)系統(tǒng))或(2)模擬(即工作記憶中的臨時(shí)表征)。第一種選擇的問(wèn)題在于,它在如何執(zhí)行功能方面沒(méi)有明確說(shuō)明(Dennett & Viger, 1999)。語(yǔ)義指針框架通過(guò)將概念發(fā)生與神經(jīng)過(guò)程等同起來(lái),并以獨(dú)立動(dòng)機(jī)的神經(jīng)計(jì)算原則和下面描述的基于模型的實(shí)現(xiàn)來(lái)機(jī)械地描述這些過(guò)程,從而解決了這一不足。第二種選擇的問(wèn)題在于,它意味著每個(gè)特定模擬的實(shí)例都對(duì)應(yīng)于一個(gè)獨(dú)特的概念。如果是這樣,那么一個(gè)人可以擁有多個(gè)指代單一類別的概念,并且由于在不同時(shí)間產(chǎn)生完全相同的模擬的可能性很小,因此很少會(huì)兩次喚起同一個(gè)概念。如果沒(méi)有解釋為什么這些模擬形成了不同的概念(或者如果它們不是不同的概念,為什么它們是相關(guān)的),那么這個(gè)理論就會(huì)顯得模糊和不精確。我們的觀點(diǎn)通過(guò)假設(shè)一個(gè)共同的底層神經(jīng)機(jī)制來(lái)統(tǒng)一單一概念的多樣化發(fā)生,從而避免了這個(gè)問(wèn)題。
語(yǔ)義指針框架與通過(guò)梯度下降訓(xùn)練以關(guān)聯(lián)各種模態(tài)特定表征(例如,感知、語(yǔ)言描述等)的聯(lián)結(jié)主義模型之間的相似性也很明顯,這些模型通過(guò)中介的非模態(tài)語(yǔ)義表征來(lái)關(guān)聯(lián)這些表征(Rogers et al., 2004; Roy & Pentland, 2002; Rumelhart & McClelland, 1986)。兩個(gè)關(guān)鍵特征區(qū)分了我們的方法。第一個(gè)是我們提供的表征綁定的解釋。學(xué)會(huì)關(guān)聯(lián)表征的聯(lián)結(jié)主義模型沒(méi)有遞歸綁定表征的手段,因此也沒(méi)有解釋復(fù)合概念或具有句法結(jié)構(gòu)的表征的手段。第二個(gè)是,通常使用一種局部編碼形式,其中個(gè)體處理節(jié)點(diǎn)被認(rèn)為代表獨(dú)特的語(yǔ)言謂詞和感知特征。這種編碼違反了實(shí)現(xiàn)標(biāo)準(zhǔn),因?yàn)檫@些節(jié)點(diǎn)與神經(jīng)基質(zhì)之間的對(duì)應(yīng)關(guān)系沒(méi)有被明確說(shuō)明。
由于上述所有原因,我們提出我們的觀點(diǎn)為滿足第2節(jié)中介紹的標(biāo)準(zhǔn)提供了一種有前景的新方法。然而,在重新回到根據(jù)這些標(biāo)準(zhǔn)對(duì)理論進(jìn)行評(píng)估之前,我們首先描述了一個(gè)基于語(yǔ)義指針的模型,該模型能夠解釋原型理論、范例理論和理論理論對(duì)概念的重要特征。盡管這個(gè)計(jì)算模型并不全面,但它很好地初步展示了基于語(yǔ)義指針的框架對(duì)概念現(xiàn)象提供統(tǒng)一解釋的潛力。
6. 模型描述
我們的建模工作集中在三項(xiàng)典范的分類研究上。第一項(xiàng)研究由Posner和Keele(1968)進(jìn)行,表明當(dāng)受試者學(xué)習(xí)對(duì)通過(guò)干擾各種原型模式生成的點(diǎn)陣圖案進(jìn)行分類時(shí),他們會(huì)抽象并利用有關(guān)相關(guān)原型的信息。第二項(xiàng)研究由Regehr和Brooks(1993)進(jìn)行,證明在某些情況下,基于相似性的分類策略可以取代更具分析性的策略。第三項(xiàng)研究由Lin和Murphy(1997)進(jìn)行,研究了背景知識(shí)對(duì)涉及相同視覺(jué)刺激的分類決策的影響,這些刺激在不同的功能描述下被分類。這三項(xiàng)研究共同記錄了分類效應(yīng)的廣泛多樣性。
我們提出了一種單一的模型架構(gòu),該架構(gòu)在解釋這些不同效應(yīng)時(shí)不會(huì)發(fā)生變化。從功能上講,該模型以對(duì)應(yīng)于壓縮自然圖像的向量作為輸入,并輸出對(duì)應(yīng)于運(yùn)動(dòng)反應(yīng)的向量。所有中間處理過(guò)程都使用大約30萬(wàn)個(gè)模擬的漏電積分-發(fā)放(LIF)神經(jīng)元來(lái)實(shí)現(xiàn),并且在每次模擬中都使用128維向量。關(guān)于LIF神經(jīng)元如何用于編碼、解碼和轉(zhuǎn)換向量的詳細(xì)信息可以在補(bǔ)充材料的A部分找到。
在更具體的層面,模型架構(gòu)包括一個(gè)工作記憶系統(tǒng)、一個(gè)動(dòng)作選擇系統(tǒng),以及兩個(gè)進(jìn)一步的子系統(tǒng),用于對(duì)輸入刺激進(jìn)行感知和推理評(píng)估(見(jiàn)圖3)。工作記憶存儲(chǔ)編碼視覺(jué)范例和定義類別成員資格的軟規(guī)則的語(yǔ)義指針。動(dòng)作選擇系統(tǒng)控制如何從這些語(yǔ)義指針中提取信息,并以任務(wù)依賴的方式操縱輸入刺激。從解剖學(xué)上講,動(dòng)作選擇系統(tǒng)被映射到基底神經(jīng)節(jié)和丘腦的部分區(qū)域,而其他子系統(tǒng)則被映射到皮層。這些解剖學(xué)映射主要受到其他研究工作的啟發(fā)(Eliasmith, 2013; Eliasmith et al., 2012),在目前的研究中,最好將它們視為合理的假設(shè)。模型的功能性是我們的主要關(guān)注點(diǎn),在下面報(bào)告的模擬中,我們沒(méi)有使用模型以一種獨(dú)立證明這些映射的方式解釋神經(jīng)數(shù)據(jù)。
在每次實(shí)驗(yàn)中,模型首先接收一個(gè)視覺(jué)輸入,提示當(dāng)前的實(shí)驗(yàn)任務(wù),然后是一個(gè)需要分類的刺激。根據(jù)提示,動(dòng)作選擇系統(tǒng)啟動(dòng)過(guò)程,將語(yǔ)義指針解壓縮,以(a)將刺激與之前學(xué)習(xí)的范例進(jìn)行比較,或者(b)應(yīng)用一組定義類別成員資格的規(guī)則。
為了提供更正式的細(xì)節(jié),工作記憶系統(tǒng)包含神經(jīng)元群體,其活動(dòng)代表在每次實(shí)驗(yàn)的訓(xùn)練階段學(xué)習(xí)的概念對(duì)應(yīng)的語(yǔ)義指針。在涉及感知分類的實(shí)驗(yàn)中,這些語(yǔ)義指針將具有以下數(shù)學(xué)描述:
其中 是一個(gè)索引特定規(guī)則的向量,而 是該規(guī)則內(nèi)容的表征。通過(guò)依次檢索和應(yīng)用這些規(guī)則,模型能夠推斷出給定輸入刺激與規(guī)則所編碼的類別描述的一致性程度??傮w而言,(1)和(2)為我們的模型中使用的語(yǔ)義指針提供了表征方案,但需要注意的是,這些方案是為了適應(yīng)特定的分類實(shí)驗(yàn)而選擇的,并不能反映我們框架的表征能力。
動(dòng)作選擇系統(tǒng)的細(xì)節(jié)更為復(fù)雜。許多傳入連接使得該系統(tǒng)能夠監(jiān)測(cè)模型中其他神經(jīng)群體中的表征狀態(tài),并且其中一小部分狀態(tài)與系統(tǒng)執(zhí)行以控制信息流動(dòng)的動(dòng)作相關(guān)聯(lián)。該系統(tǒng)由一系列解剖學(xué)上對(duì)應(yīng)于基底神經(jīng)節(jié)的神經(jīng)群體組成,而對(duì)應(yīng)于尾狀核的輸入群體編碼每個(gè)被監(jiān)測(cè)的表征狀態(tài)與觸發(fā)特定動(dòng)作的狀態(tài)之間的相似性(即,點(diǎn)積)。輸出的內(nèi)蒼白球群體連接到丘腦,丘腦再連接回模型的其他部分,從而在特定時(shí)間執(zhí)行對(duì)應(yīng)于最高編碼相似性度量的動(dòng)作。關(guān)于這一基底神經(jīng)節(jié)動(dòng)作選擇模型的實(shí)現(xiàn)和生物學(xué)合理性的詳細(xì)信息可以在 Stewart、Choo 和 Eliasmith(2010)中找到。然而,我們的關(guān)注點(diǎn)在于利用該系統(tǒng)的功能,而不是直接用它來(lái)解釋神經(jīng)數(shù)據(jù)。
執(zhí)行感知評(píng)估和推理評(píng)估的系統(tǒng)最好通過(guò)例子來(lái)說(shuō)明。在每個(gè)實(shí)驗(yàn)條件下,模型首先接收一個(gè)表示當(dāng)前任務(wù)的向量,隨后接收一個(gè)對(duì)應(yīng)于待分類視覺(jué)刺激的向量。當(dāng)任務(wù)向量通過(guò)視覺(jué)緩沖區(qū)時(shí),它觸發(fā)一個(gè)動(dòng)作,更新工作記憶中任務(wù)上下文的表征,這反過(guò)來(lái)決定了刺激向量將如何被處理。在感知分類任務(wù)的情況下,這種上下文表征觸發(fā)一個(gè)動(dòng)作,將輸入刺激與圖3中標(biāo)記為“感知評(píng)估”子系統(tǒng)中的解壓縮語(yǔ)義指針進(jìn)行比較。從數(shù)學(xué)上講,感知評(píng)估系統(tǒng)的后續(xù)輸出可以描述為:
其中SP是由(1)描述的那種語(yǔ)義指針,而 是正在被分類的輸入向量的偽逆。這個(gè)輸出通過(guò)一個(gè)由當(dāng)前任務(wù)上下文的工作記憶表征觸發(fā)的動(dòng)作被傳遞到運(yùn)動(dòng)緩沖區(qū)。圖4展示了這一過(guò)程在模型執(zhí)行Posner和Keele(1968)的任務(wù)時(shí)的展開(kāi)。
在推理序列完成后,任務(wù)上下文表征的最終狀態(tài)觸發(fā)一個(gè)動(dòng)作,將推理評(píng)估系統(tǒng)的輸出傳遞到運(yùn)動(dòng)緩沖區(qū)。圖5展示了這一過(guò)程在模型執(zhí)行Lin和Murphy(1997)的任務(wù)時(shí)的展開(kāi)。
我們認(rèn)為這個(gè)模型是統(tǒng)一的,原因如下:所有表征都是語(yǔ)義指針,模型結(jié)構(gòu)在不同任務(wù)之間保持不變,動(dòng)作選擇系統(tǒng)可以執(zhí)行的動(dòng)作集合也在不同任務(wù)之間保持不變。
可能會(huì)有人認(rèn)為,因?yàn)槲覀優(yōu)椴煌娜蝿?wù)上下文定義了不同的動(dòng)作,所以我們實(shí)際上提出了一種混合模型。然而,這類似于爭(zhēng)論說(shuō)計(jì)算器沒(méi)有提供算術(shù)的統(tǒng)一實(shí)現(xiàn)。僅僅根據(jù)輸入(例如,按下了哪個(gè)操作按鈕)改變?cè)O(shè)備中的信息流,并不意味著該設(shè)備實(shí)現(xiàn)了算術(shù)的混合解釋。表征、結(jié)構(gòu)和處理步驟都保持不變。
同樣,在我們的模型中,改變動(dòng)作選擇系統(tǒng)執(zhí)行的轉(zhuǎn)換類似于手動(dòng)更換計(jì)算器上的操作按鈕。我們選擇當(dāng)前的實(shí)現(xiàn)方式是為了最小化模型的復(fù)雜性和運(yùn)行時(shí)間。然而,至關(guān)重要的是,改變動(dòng)作選擇系統(tǒng)執(zhí)行的轉(zhuǎn)換,只改變了模型中信息流的控制方式——它并沒(méi)有改變所使用的表征的性質(zhì)、模型的結(jié)構(gòu),或者刺激被分類的整體過(guò)程。
7. 模擬實(shí)驗(yàn)
7.1. 原型理論:實(shí)驗(yàn) 1
我們模擬的第一個(gè)研究是 Posner 和 Keele(1968)對(duì)點(diǎn)模式分類的實(shí)驗(yàn) 3。該實(shí)驗(yàn)旨在探討受試者是否會(huì)在僅被訓(xùn)練對(duì)由原型變形生成的模式進(jìn)行分類時(shí),抽象出有關(guān)類別原型的信息。在實(shí)驗(yàn)的訓(xùn)練階段,30 名受試者通過(guò)糾正性反饋被教導(dǎo)對(duì)一組 12 張幻燈片進(jìn)行分類,每張幻燈片都描繪了一個(gè)在 30×30 矩陣內(nèi)獨(dú)特排列的九個(gè)點(diǎn)的圖案。這些幻燈片分為三個(gè)類別,每個(gè)類別中的四張幻燈片都是通過(guò)隨機(jī)變形一個(gè)單一的“原型”點(diǎn)圖案生成的,而這個(gè)原型點(diǎn)圖案并不存在于訓(xùn)練集中。每個(gè)類別定義原型的四張訓(xùn)練幻燈片是通過(guò)一個(gè)變形規(guī)則生成的,該規(guī)則規(guī)定了每個(gè)點(diǎn)從其起始位置移動(dòng)的距離。當(dāng)受試者能夠連續(xù)兩次無(wú)誤地對(duì)所有 12 張幻燈片進(jìn)行分類時(shí),訓(xùn)練被認(rèn)為完成。
在完成訓(xùn)練階段后,32 名受試者進(jìn)入轉(zhuǎn)移階段,被要求在沒(méi)有反饋的情況下對(duì)一組 24 張幻燈片進(jìn)行分類。這些幻燈片包括來(lái)自訓(xùn)練階段的六個(gè)舊模式(每個(gè)原型兩個(gè))、使用訓(xùn)練階段的變形規(guī)則生成的六個(gè)新模式(每個(gè)原型兩個(gè))、使用較弱變形規(guī)則生成的六個(gè)新模式(每個(gè)原型兩個(gè))、三個(gè)原型以及三個(gè)完全隨機(jī)的模式。轉(zhuǎn)移階段的結(jié)果表明,訓(xùn)練模式和原型的分類效果最好且相當(dāng),而新的低水平變形模式和新的高水平變形模式的分類準(zhǔn)確率則逐漸降低。
為了模擬這個(gè)實(shí)驗(yàn),我們首先假設(shè)所有的視覺(jué)刺激都被壓縮成語(yǔ)義指針,使用第 3 節(jié)中描述的神經(jīng)轉(zhuǎn)換。因此,點(diǎn)模式以神經(jīng)脈沖模式編碼的個(gè)體向量的形式呈現(xiàn)給模型。通過(guò)一種略微受限的隨機(jī)向量生成方式構(gòu)建三個(gè)原型,以確保一定程度的相似性,然后將其歸一化為單位長(zhǎng)度。所有向量均為 128 維。為了生成訓(xùn)練刺激和轉(zhuǎn)移刺激,使用以下公式:
其中,k表示向量的維度, r 表示變形的程度,I 表示一個(gè) k x k 的單位矩陣。用通俗的話說(shuō),刺激向量是通過(guò)將從標(biāo)準(zhǔn)差為 r 的正態(tài)分布中抽取的隨機(jī)數(shù)加到相關(guān)原型向量的每個(gè)元素上而構(gòu)建的。 r 的值用于近似 Posner 和 Keele 對(duì)原型圖案施加的變形程度。需要注意的是,低變形規(guī)則和高變形規(guī)則是彼此的精確比例關(guān)系,因此一個(gè) r 值就足以描述兩者。
為了運(yùn)行實(shí)驗(yàn)的試驗(yàn),創(chuàng)建了一個(gè)模型實(shí)例,該實(shí)例使用語(yǔ)義指針編碼了12個(gè)標(biāo)記的訓(xùn)練圖像(如公式(1)所示),并將它們直接輸入到工作記憶中。對(duì)應(yīng)于任務(wù)上下文(例如,“Posner”)和測(cè)試刺激(例如,“AT1”——原型A,訓(xùn)練項(xiàng)目1)的向量隨后依次輸入到視覺(jué)緩沖區(qū)。任務(wù)向量觸發(fā)一個(gè)動(dòng)作,該動(dòng)作更新工作記憶中的任務(wù)上下文表示,以指示應(yīng)執(zhí)行感知評(píng)估;然后,該表示進(jìn)一步觸發(fā)任務(wù)上下文表示的更新,這使得感知評(píng)估系統(tǒng)的輸出被路由到運(yùn)動(dòng)緩沖區(qū)。圖4詳細(xì)說(shuō)明了實(shí)驗(yàn)單次試驗(yàn)的這一過(guò)程。每次試驗(yàn)對(duì)應(yīng)于450毫秒的模擬處理時(shí)間。
為了詳細(xì)復(fù)制Posner和Keele的實(shí)驗(yàn),我們使用32個(gè)隨機(jī)種子為每個(gè)32名實(shí)驗(yàn)受試者生成模型的獨(dú)特實(shí)例。這些種子固定了模型中用于設(shè)置各種神經(jīng)元參數(shù)(例如,最大放電率、首選刺激向量等)的隨機(jī)數(shù)生成器,并允許在試驗(yàn)中重新創(chuàng)建模型的相同實(shí)例。為了運(yùn)行完整的實(shí)驗(yàn),每個(gè)模型實(shí)例都在獨(dú)立的試驗(yàn)中對(duì)一組測(cè)試刺激進(jìn)行測(cè)試。特定模型實(shí)例涉及的所有試驗(yàn)中使用的測(cè)試刺激是相同的,總共進(jìn)行了21×9×32=672次試驗(yàn)。結(jié)果是通過(guò)統(tǒng)計(jì)模型在每個(gè)刺激類別中犯錯(cuò)誤的比例,并將該比例平均到32個(gè)模型實(shí)例上獲得的。
在所有后續(xù)實(shí)驗(yàn)中都使用了這種程序,并且在實(shí)驗(yàn)中使用相同的模型實(shí)例,以確保所有結(jié)果嚴(yán)格是由于相關(guān)參數(shù)值的變化。
為了評(píng)估模型,我們?cè)谧杂蓞?shù)r和Posner及Keele報(bào)告的數(shù)據(jù)之間找到了最佳擬合。我們?cè)趓值從0.05到0.15的范圍內(nèi)進(jìn)行了11次完整的實(shí)驗(yàn),圖6繪制了每個(gè)刺激條件下分類錯(cuò)誤率與r的關(guān)系。這些結(jié)果表明,該模型在一系列刺激失真值范圍內(nèi)概括了Posner和Keele的發(fā)現(xiàn):分類準(zhǔn)確性對(duì)于訓(xùn)練模式和原型是最高的,并且隨著低水平和高水平失真模式的增加而逐漸降低。
進(jìn)一步檢查這些結(jié)果表明,r值為0.1時(shí),模型結(jié)果與數(shù)據(jù)之間的均方根差最小。基于每個(gè)刺激類別中正分類判斷和負(fù)分類判斷的百分比,分別計(jì)算了模型數(shù)據(jù)和人類數(shù)據(jù)的95%置信區(qū)間。
在總結(jié)這些結(jié)果時(shí),有助于指出,模型在該實(shí)驗(yàn)中的表現(xiàn)主要?dú)w因于語(yǔ)義指針的數(shù)學(xué)結(jié)構(gòu)以及它們的處理方式。具體來(lái)說(shuō),每個(gè)隨機(jī)生成的原型向量可以被視為128維空間中的一個(gè)點(diǎn),每個(gè)刺激可以被視為另一個(gè)從原型隨機(jī)偏移一定量的點(diǎn),該偏移量由r指定。隨著r的增加,這些偏移在低失真和高失真條件下都變得更大,某個(gè)刺激位于與錯(cuò)誤原型(因此是錯(cuò)誤類別標(biāo)簽)更密切相關(guān)的空間區(qū)域的概率增加。因此,圖6中顯示的結(jié)果模式并不令人驚訝。
然而,該模型在訓(xùn)練模式和原型模式上的表現(xiàn)優(yōu)于人類。以下兩點(diǎn)評(píng)論有助于澄清這種差異的意義。首先,每個(gè)刺激類別中平均錯(cuò)誤率的差異大約為10%,這相當(dāng)于在實(shí)驗(yàn)中每?jī)擅麉⑴c者中每個(gè)類別多出一個(gè)錯(cuò)誤。鑒于每次實(shí)驗(yàn)中對(duì)超過(guò)180個(gè)訓(xùn)練刺激進(jìn)行了分類,這種差異實(shí)際上相當(dāng)小。其次,由于原型是隨機(jī)生成的單位向量,它們可能相當(dāng)不相似,這降低了錯(cuò)誤分類的可能性,因?yàn)榕c每個(gè)原型相關(guān)的刺激更有可能位于向量空間的不相交區(qū)域。強(qiáng)制規(guī)定原型之間的最小相似性值可以減少圖7中可觀察到的差異,但也會(huì)為模型增加一個(gè)額外的自由參數(shù)(我們?cè)趫?bào)告的結(jié)果中沒(méi)有明確設(shè)置這個(gè)參數(shù)——見(jiàn)腳注6)。根據(jù)這些因素調(diào)整模型可能會(huì)減少此處觀察到的性能差異。
7.2. 范例理論:實(shí)驗(yàn)2
盡管原型理論和范例理論傳統(tǒng)上被發(fā)展為對(duì)同一現(xiàn)象的相互競(jìng)爭(zhēng)的解釋,但有許多實(shí)驗(yàn)結(jié)果表明,范例表征在概念加工中發(fā)揮著獨(dú)特的作用(Murphy,2002)。為了說(shuō)明這種效應(yīng),我們模擬了Regehr和Brooks(1993)設(shè)計(jì)的實(shí)驗(yàn)(1C),該實(shí)驗(yàn)旨在測(cè)試分析性特征匹配和更整體的刺激相似性測(cè)量在形成分類判斷中的相對(duì)重要性。在實(shí)驗(yàn)過(guò)程中,32名受試者被訓(xùn)練對(duì)虛構(gòu)生物的繪畫(huà)進(jìn)行分類。每種生物都具有一組獨(dú)特的特征集合,這些特征集合定義在五個(gè)二元維度上,并且根據(jù)這一特征集合屬于兩個(gè)類別之一。這兩個(gè)類別被稱為“建造者”類別和“挖掘者”類別。為了成為建造者,一種生物必須具備三個(gè)特定特征中的至少兩個(gè)。否則,這種生物就是挖掘者。在實(shí)驗(yàn)中,對(duì)于每個(gè)受試者,以下四個(gè)規(guī)則中的一個(gè)用于指定哪些特征可用于識(shí)別建造者(第99頁(yè)):
1. 長(zhǎng)腿、棱角分明的身體和斑點(diǎn)。
2. 短腿、長(zhǎng)脖子和斑點(diǎn)。
3. 六條腿、棱角分明的身體和斑點(diǎn)。
4. 兩條腿、長(zhǎng)脖子和斑點(diǎn)。
使用這些不同的規(guī)則旨在平衡特定特征維度在決定類別歸屬方面的相關(guān)性(然而,需要注意的是,斑點(diǎn)與無(wú)斑點(diǎn)的維度始終是相關(guān)的;Regehr & Brooks,1993,第99頁(yè))。
重要的是,每個(gè)特征的感知特性可以在繪畫(huà)中有所不同。例如,“長(zhǎng)脖子”特征在一幅繪畫(huà)中可能有各種彎曲,而在另一幅繪畫(huà)中則相對(duì)筆直。這些分析上相同的繪畫(huà)之間是否存在這類感知差異被用來(lái)定義兩個(gè)實(shí)驗(yàn)條件。在“組合”條件下,分析上等價(jià)的特征在感知上也是等價(jià)的。在“個(gè)體化”條件下,分析上等價(jià)的特征在感知上是不同的。通過(guò)比較這兩個(gè)條件下的分類表現(xiàn),可以評(píng)估分析結(jié)構(gòu)和感知相似性在形成分類決策中的相對(duì)重要性。
在實(shí)驗(yàn)的訓(xùn)練階段,32名受試者中的每一個(gè)都通過(guò)糾正性反饋被教導(dǎo)根據(jù)上述四個(gè)規(guī)則中的一個(gè)對(duì)一組八個(gè)圖形進(jìn)行分類。一半的受試者被安排在組合條件下,另一半被安排在個(gè)體化條件下;每個(gè)條件都有自己的八張訓(xùn)練繪畫(huà)。在遷移階段,受試者被要求在沒(méi)有反饋的情況下對(duì)總共16張繪畫(huà)進(jìn)行分類,其中八張是訓(xùn)練范例,另外八張是新的繪畫(huà)。所有新的繪畫(huà)都與訓(xùn)練集中的一對(duì)“雙胞胎”配對(duì),這對(duì)“雙胞胎”僅在一個(gè)維度上有所不同(即,斑點(diǎn)的存在與否;因此,雙胞胎在感知上相當(dāng)相似)。屬于與其雙胞胎同一類別的新圖形被稱為“良好遷移”(GT)項(xiàng)目,而屬于與其雙胞胎相反類別的新圖形被稱為“不良遷移”(BT)項(xiàng)目。雙胞胎項(xiàng)目之間的感知相似性因此可以暗示正確或錯(cuò)誤的分類決策:對(duì)于GT項(xiàng)目,感知相似性暗示正確的決策,而在BT項(xiàng)目的情況下,感知相似性暗示錯(cuò)誤的決策。
實(shí)驗(yàn)結(jié)果表明,在組合條件下,受試者在訓(xùn)練、GT和BT項(xiàng)目上的分類錯(cuò)誤率大致相同。然而,在個(gè)體化條件下,BT項(xiàng)目的錯(cuò)誤率顯著更高。
為了模擬該實(shí)驗(yàn),我們使用了與原型模擬中相似的方法。我們假設(shè)刺激通過(guò)壓縮過(guò)程被轉(zhuǎn)換為語(yǔ)義指針,并且每個(gè)語(yǔ)義指針的結(jié)構(gòu)符合以下數(shù)學(xué)描述:
其中“DimensionF”和“ValueF”是隨機(jī)生成的向量,用于定義每個(gè)刺激分析結(jié)構(gòu)的組成部分。例如,一個(gè)可能的維度-值對(duì)是“SPOTS(斑點(diǎn))~ YES(有)”。為了增加特征的個(gè)體化,并近似“組合”和“個(gè)體化”實(shí)驗(yàn)條件之間的差異,對(duì)每個(gè)特征值施加了可變幅度的高斯擾動(dòng)。
其中,k 再次表示向量的維度,r表示高斯分布的標(biāo)準(zhǔn)差,I 表示一個(gè)k x k 的單位矩陣。
每個(gè)實(shí)驗(yàn)試驗(yàn)都采用與Posner和Keele模擬中相同的方法進(jìn)行。一個(gè)語(yǔ)義指針對(duì)八個(gè)標(biāo)記的訓(xùn)練刺激進(jìn)行編碼,并作為直接輸入提供給工作記憶,同時(shí)視覺(jué)緩沖區(qū)依次被提供任務(wù)向量和刺激向量。任務(wù)向量啟動(dòng)了圖4中描述的相同動(dòng)作序列,因此模型性能的變化僅是由于使用了不同的測(cè)試刺激和不同的語(yǔ)義指針。每次試驗(yàn)再次對(duì)應(yīng)于450毫秒的模擬處理時(shí)間,模型的分類判斷通過(guò)評(píng)估模型運(yùn)動(dòng)系統(tǒng)中的表征狀態(tài)來(lái)確定。
為了評(píng)估特征個(gè)體化對(duì)分類表現(xiàn)的影響,我們進(jìn)行了15次實(shí)驗(yàn),使用r值從0.01到0.15生成的刺激。每次實(shí)驗(yàn)涉及在前16個(gè)模型實(shí)例上測(cè)試16個(gè)刺激,總共進(jìn)行了16×16=256次試驗(yàn)。圖8繪制了每個(gè)刺激條件下分類錯(cuò)誤率與r的關(guān)系。模型評(píng)估是通過(guò)將自由參數(shù)r擬合到Regehr和Brooks報(bào)告的數(shù)據(jù)來(lái)完成的。我們觀察到,在組合條件下,r值為0.02時(shí),模型結(jié)果與數(shù)據(jù)之間的均方根差最小。同樣,在個(gè)體化條件下,r值為0.1時(shí),模型結(jié)果與數(shù)據(jù)之間的均方根差最小。使用不同的r值來(lái)解釋不同的刺激條件是相當(dāng)合理的,因?yàn)檩^低的r值對(duì)應(yīng)于不同刺激上分析等價(jià)特征之間的相對(duì)較小差異,而較高的r值對(duì)應(yīng)于這些特征之間的相對(duì)較大差異。圖9報(bào)告了組合條件和個(gè)體化條件下模型結(jié)果與實(shí)驗(yàn)數(shù)據(jù)的直接比較。置信區(qū)間如之前所述進(jìn)行計(jì)算。
為了直觀地解釋這些結(jié)果,將每個(gè)刺激視為高維空間中的一個(gè)點(diǎn)是有用的。標(biāo)記的訓(xùn)練刺激定義了與兩個(gè)類別標(biāo)簽之一相關(guān)聯(lián)的空間區(qū)域。當(dāng)沒(méi)有特征個(gè)體化時(shí),分析結(jié)構(gòu)的差異是兩類刺激之間存在的唯一差異。這很重要,因?yàn)樗馕吨總€(gè)標(biāo)記的訓(xùn)練范例都表明某種特定的分析結(jié)構(gòu)是屬于某一特定類別的診斷特征。當(dāng)一個(gè)新刺激被映射到高維空間時(shí),可以認(rèn)為存儲(chǔ)在記憶中的每個(gè)訓(xùn)練范例都會(huì)根據(jù)結(jié)構(gòu)上的重疊點(diǎn)對(duì)新刺激的類別歸屬進(jìn)行“投票”。例如,如果一個(gè)訓(xùn)練范例具有“長(zhǎng)脖子”特征,并且被標(biāo)記為建造者,那么在測(cè)試刺激中出現(xiàn)這一特征將導(dǎo)致該訓(xùn)練范例為將測(cè)試刺激歸類為建造者投出一票。所有這些投票的平衡決定了最終的分類判斷(由于在(6)中描述的刺激構(gòu)建中使用的隨機(jī)生成向量不能保證正交,因此存在一些噪聲)??傮w而言,當(dāng)沒(méi)有特征個(gè)體化時(shí),每個(gè)記憶中的范例產(chǎn)生的投票僅對(duì)分析結(jié)構(gòu)敏感,這意味著GT項(xiàng)目和BT項(xiàng)目之間分析結(jié)構(gòu)的變化會(huì)導(dǎo)致測(cè)試刺激獲得每個(gè)類別的票數(shù)發(fā)生變化。這種對(duì)分析結(jié)構(gòu)的敏感性解釋了為什么在低特征個(gè)體化條件下,模型不太容易出現(xiàn)BT錯(cuò)誤——模型注意到了BT項(xiàng)目與其訓(xùn)練配對(duì)之間的結(jié)構(gòu)變化。
然而,隨著刺激物的個(gè)體化程度增加,每個(gè)訓(xùn)練刺激所提供的投票對(duì)分析結(jié)構(gòu)的敏感性卻降低了。要理解其中的原因,回想一下,特征個(gè)體化產(chǎn)生的是分析上等價(jià)但感知上不同的特征。這意味著,一個(gè)特定訓(xùn)練樣本所提供的投票只適用于具有感知上相似特征的測(cè)試刺激,因?yàn)榉治錾系葍r(jià)的特征可能由于用于近似特征個(gè)體化的扭曲而被表示為高度不同的向量。在這種情況下,如果一個(gè)訓(xùn)練樣本具有高度個(gè)體化的“長(zhǎng)脖子”特征,那么該樣本并不會(huì)為“長(zhǎng)脖子”這一特征在總體上提供支持票。它只對(duì)特定類型的長(zhǎng)脖子提供支持票。這種行為導(dǎo)致在BT項(xiàng)目上的錯(cuò)誤率增加,原因如下。在訓(xùn)練集中與BT項(xiàng)目相對(duì)應(yīng)的樣本在所有維度上都具有相同的特征,只有一個(gè)維度除外(有斑點(diǎn)與無(wú)斑點(diǎn))。這意味著,隨著特征個(gè)體化程度的增加,訓(xùn)練樣本為分類BT測(cè)試刺激提供了越來(lái)越多的相關(guān)投票。而由于訓(xùn)練樣本與BT測(cè)試刺激屬于相反的類別,這些投票增加了分類錯(cuò)誤的可能性。因此,當(dāng)圖8中一系列實(shí)驗(yàn)中r值增加時(shí),模型在BT項(xiàng)目上的表現(xiàn)逐漸變差也就不足為奇了。
最后,值得一提的是,該模型在特征個(gè)體化程度最低的情況下對(duì)GT刺激的分類表現(xiàn)優(yōu)于人類。這可能是因?yàn)镽egehr和Brooks的加性特征規(guī)則設(shè)計(jì)得使得GT項(xiàng)目偶爾(且唯一地)不具有任何表明其屬于相反類別的特征。具體來(lái)說(shuō),每條三特征規(guī)則可以將所有可能的特征劃分為三類:表明屬于建造者(Builder)的特征、表明屬于挖掘者(Digger)的特征以及診斷上中性的特征。大多數(shù)刺激在檢查后都具有一個(gè)表明其不屬于的類別的診斷性特征。然而,一半的GT項(xiàng)目卻不具有任何表明其不屬于的類別的診斷性特征(參見(jiàn)Regehr & Brooks, 1993, p. 102)。因此,這些GT項(xiàng)目更有可能位于與正確分類判斷相關(guān)聯(lián)的向量空間區(qū)域中。人們可能對(duì)這些刺激之間的細(xì)微差異并不敏感,尤其是考慮到Regehr和Brooks觀察到許多受試者報(bào)告說(shuō)僅依賴一兩個(gè)特征來(lái)進(jìn)行分類判斷。該模型沒(méi)有注意力機(jī)制,無(wú)法對(duì)特征賦予不同的優(yōu)先級(jí),這可能是我們?cè)贕T條件下觀察到其表現(xiàn)更準(zhǔn)確的潛在原因。再次強(qiáng)調(diào),根據(jù)這些因素調(diào)整模型可能會(huì)改善我們觀察到的模型與數(shù)據(jù)的擬合程度。
7.3 理論理論:實(shí)驗(yàn)3
除了原型和范例觀點(diǎn)的持續(xù)發(fā)展外,概念的結(jié)構(gòu)類似于它們所指代類別的直覺(jué)理論這一觀點(diǎn),已經(jīng)成為一個(gè)越來(lái)越受歡迎的研究目標(biāo)(Keil, 1989; Murphy & Medin, 1985; Rogers & McClelland, 2004)。推動(dòng)這一發(fā)展的基本觀點(diǎn)是,個(gè)體擁有關(guān)于因果關(guān)系、本質(zhì)和本體論區(qū)別的信念,這些信念似乎影響了他們對(duì)概念的使用(Keil, 1989; Murphy & Medin, 1985; Prinz, 2002; Rogers & McClelland, 2004)。例如,BIRD(鳥(niǎo))指代一個(gè)連貫的類別,并以這種方式對(duì)實(shí)體進(jìn)行分組,是因?yàn)榇蠖鄶?shù)鳥(niǎo)類共享的許多特征(如飛行、翅膀、羽毛和中空骨骼)通過(guò)一組或一組以上的解釋相互關(guān)聯(lián):鳥(niǎo)類能夠飛行是因?yàn)樗鼈冇谐岚?、羽毛以及中空骨骼;鳥(niǎo)類飛行是因?yàn)檫@樣做有助于它們覓食和躲避天敵(Murphy, 2002; Rogers & McClelland, 2004)。在分類任務(wù)中,這種效應(yīng)表現(xiàn)為受試者使用解釋性推理將對(duì)象與類別匹配。
為了對(duì)這種簡(jiǎn)單效應(yīng)進(jìn)行解釋,我們模擬了Lin和Murphy(1997)的實(shí)驗(yàn)2。在這個(gè)實(shí)驗(yàn)中,兩組受試者被賦予了不同的人工類別的功能描述,然后被要求對(duì)相同的圖像集進(jìn)行分類。結(jié)果顯示,受試者根據(jù)他們收到的類別描述,關(guān)注圖像的不同特征。因此,背景知識(shí)被證明對(duì)受試者在基于圖像的分類任務(wù)中的表現(xiàn)有影響。
在實(shí)驗(yàn)的訓(xùn)練階段,20名受試者被平均分為兩組(A組和B組)。每組都得到了一組三個(gè)訓(xùn)練樣本的不同解釋性描述,每個(gè)樣本由四個(gè)不同的特征組成,涉及八個(gè)不同的類別。類別描述的設(shè)計(jì)使得每個(gè)訓(xùn)練樣本所呈現(xiàn)的四個(gè)特征中,一個(gè)被描述為功能上至關(guān)重要的,兩個(gè)被描述為功能上可選的,一個(gè)被描述為功能上無(wú)關(guān)的。因此,以圖10中所示的樣本為例,A組的參與者得到了以下描述:
昆因島的獵人使用圖克(tuk)來(lái)捕捉邦杜(Bondu),這是一種在昆因國(guó)人們喜歡食用的動(dòng)物。要用圖克捕捉邦杜,抓住圖克的手柄(3)。一旦發(fā)現(xiàn)邦杜,將環(huán)(1)套在邦杜的脖子上,然后迅速拉動(dòng)末端的繩子(4)以收緊環(huán)。手柄前面的蓋子(2)可以保護(hù)你的手免受動(dòng)物的咬傷或抓傷。(第1156頁(yè))
相比之下,B組的參與者得到了以下描述:
昆因島的人們使用圖克來(lái)噴灑殺蟲(chóng)劑。三角形的瓶子(2)裝有殺蟲(chóng)劑。當(dāng)(3)被擰開(kāi)時(shí),殺蟲(chóng)劑通過(guò)軟管(4)流出。環(huán)(1)用于將圖克掛在墻上。(第1156頁(yè))
當(dāng)一個(gè)受試者學(xué)會(huì)了所有八個(gè)類別的訓(xùn)練樣本和類別描述后,受試者需要回憶每個(gè)類別的描述性信息,并回答關(guān)于如何最好地照顧每個(gè)類別中的物品的問(wèn)題。在受試者無(wú)錯(cuò)誤地完成這一回憶過(guò)程后,他們被允許進(jìn)入實(shí)驗(yàn)的遷移階段。
在遷移階段,每位受試者被要求盡可能快速且準(zhǔn)確地對(duì)一組新的物品進(jìn)行分類。首先,在計(jì)算機(jī)屏幕上顯示一個(gè)類別標(biāo)簽(例如,“Tuk”)持續(xù)1秒,隨后出現(xiàn)一個(gè)圖像。然后,受試者需要做出“是”或“否”的判斷,之后進(jìn)入下一個(gè)項(xiàng)目。重要的是,每次類別標(biāo)簽出現(xiàn)后所呈現(xiàn)的圖像在與訓(xùn)練階段提供的類別描述的一致性上有所不同。實(shí)驗(yàn)使用了四種類型的圖像。第一種是“原型”圖像,它們包含了類別描述中提到的所有四個(gè)特征。第二種是“與A組一致”的圖像,這些圖像缺少一個(gè)對(duì)A組受試者來(lái)說(shuō)是功能上可選的特征,但對(duì)于B組受試者來(lái)說(shuō)是功能上至關(guān)重要的特征。第三種是“與B組一致”的圖像,這些圖像缺少一個(gè)對(duì)B組受試者來(lái)說(shuō)是功能上可選的特征,但對(duì)于A組受試者來(lái)說(shuō)是功能上至關(guān)重要的特征。最后一種是“對(duì)照”圖像,這些圖像缺少對(duì)A組和B組受試者來(lái)說(shuō)都是功能上至關(guān)重要的特征。
20名受試者每人對(duì)所有八個(gè)類別的每種圖像類型的三個(gè)圖像進(jìn)行了測(cè)試。圖像以隨機(jī)順序呈現(xiàn),每位受試者總共進(jìn)行了96次試驗(yàn)(即3×4×8)。Lin和Murphy的研究結(jié)果表明,原型圖像引發(fā)了非常高比例的肯定判斷,而與給定受試者的類別知識(shí)一致和不一致的圖像引發(fā)的肯定判斷逐漸減少。對(duì)照?qǐng)D像引發(fā)的肯定判斷非常少。
為了模擬這個(gè)實(shí)驗(yàn),我們假設(shè)每個(gè)模擬參與者已經(jīng)學(xué)習(xí)了一個(gè)語(yǔ)義指針,該指針將類別描述編碼為一組簡(jiǎn)單規(guī)則。這些規(guī)則的作用是確定某個(gè)特定特征是否對(duì)屬于正在考慮的類別很重要。例如,A組參與者可能學(xué)到的一條規(guī)則是“如果這個(gè)物品是圖克(Tuk),那么它應(yīng)該有一個(gè)環(huán)(loop)”。這些規(guī)則的語(yǔ)義指針按照(2)的結(jié)構(gòu)如下:
為了運(yùn)行一個(gè)完整的實(shí)驗(yàn),我們創(chuàng)建了20個(gè)模型實(shí)例,并在相同的刺激集上測(cè)試每個(gè)實(shí)例。為了提高運(yùn)行時(shí)間,我們只在每個(gè)類別中測(cè)試每個(gè)模型實(shí)例對(duì)每種遷移類型的刺激,總共進(jìn)行次試驗(yàn)。每次試驗(yàn)中的刺激向量是通過(guò)將考慮中的刺激類型中存在的每個(gè)特征對(duì)應(yīng)的向量相加生成的。例如,屬于圖克(Tuk)類別的一個(gè)一致的刺激將被編碼為:
其中 分別對(duì)應(yīng)于圖克(Tuk)類別描述中提到的環(huán)(loop)、護(hù)手(guard)、手柄(handle)和繩子(string)。實(shí)驗(yàn)中使用的八個(gè)不同類別中,每個(gè)類別的特征對(duì)應(yīng)的向量都是隨機(jī)生成的。
圖11報(bào)告了這個(gè)實(shí)驗(yàn)的結(jié)果,表明模型的表現(xiàn)與Lin和Murphy(1997)中報(bào)告的人類表現(xiàn)相當(dāng)接近。
總體而言,這些結(jié)果表明,該模型能夠逐步應(yīng)用編碼在一組規(guī)則中的知識(shí)以執(zhí)行基于規(guī)則的刺激分類。當(dāng)一個(gè)刺激符合這些規(guī)則時(shí),模型非常有可能判斷該刺激屬于正在考慮的類別。當(dāng)一個(gè)刺激在較小程度上符合這些規(guī)則時(shí),模型判斷該刺激屬于正在考慮的類別的可能性就會(huì)降低。因此,該模型對(duì)給定刺激與編碼在一組規(guī)則中的簡(jiǎn)單知識(shí)庫(kù)的一致性具有適當(dāng)?shù)拿舾行?。我們認(rèn)為這些結(jié)果是模型在分類過(guò)程中解釋簡(jiǎn)單基于規(guī)則的知識(shí)效應(yīng)能力的一個(gè)非常初步的證明。關(guān)于知識(shí)基礎(chǔ)概念處理的可能擴(kuò)展和改進(jìn)的討論在下一節(jié)中呈現(xiàn)。
7.4 模型總結(jié)
我們提供了一個(gè)統(tǒng)一的過(guò)程模型,并將其應(yīng)用于涵蓋三種不同概念理論的三個(gè)實(shí)驗(yàn)結(jié)果。一些評(píng)論可以幫助澄清我們認(rèn)為這些模擬的意義所在。
首先,它們表明語(yǔ)義指針可以以定性上不同的方式被操作和解壓縮。在一個(gè)感知任務(wù)中,語(yǔ)義指針被用于將刺激與類別標(biāo)簽在一次性的過(guò)程中匹配,這本質(zhì)上是一種模式識(shí)別。相比之下,在一個(gè)推理任務(wù)中,語(yǔ)義指針被用于促進(jìn)一系列計(jì)算,以逐步、基于規(guī)則的方式分析刺激。
其次,這些模擬概括了我們?cè)谀M的研究中報(bào)告的實(shí)證發(fā)現(xiàn)。通過(guò)改變單一參數(shù) r ,我們能夠復(fù)制這些研究中報(bào)告的感知分類模式,涵蓋一系列新的刺激。因此,該模型可以用來(lái)生成關(guān)于人類行為的新預(yù)測(cè)。
第三,在每次實(shí)驗(yàn)試驗(yàn)中,單個(gè)語(yǔ)義指針被用于編碼所有到達(dá)分類判斷所需的類別信息。該模型因此展示了語(yǔ)義指針如何為研究概念現(xiàn)象提供一個(gè)統(tǒng)一的框架。
對(duì)我們模型的一個(gè)潛在批評(píng)是,它未能真正解釋知識(shí)基礎(chǔ)方法旨在處理的概念現(xiàn)象類型。這些方法強(qiáng)調(diào)因果和解釋性推理在分類中的作用,而我們?cè)趯?shí)驗(yàn)3中應(yīng)用的規(guī)則本質(zhì)上執(zhí)行的是加權(quán)特征比較,因此似乎不太可能有任何這樣的推理發(fā)生。然而,規(guī)則足以以推理的形式提供解釋,并且當(dāng)它們與感知-運(yùn)動(dòng)操作相關(guān)聯(lián)時(shí),可以表達(dá)因果規(guī)律(Thagard,2012)。要解釋這一點(diǎn),在任何適當(dāng)?shù)耐评砝斫庵校评砜梢员幻枋鰹樾睦頎顟B(tài)之間的轉(zhuǎn)換。這種轉(zhuǎn)換可以自然地以規(guī)則或動(dòng)作的形式捕捉,復(fù)雜的推理形式涉及復(fù)雜的規(guī)則和動(dòng)作,而簡(jiǎn)單的推理形式涉及簡(jiǎn)單的規(guī)則和動(dòng)作。在這種理解下,很明顯,我們的模型正在執(zhí)行一種簡(jiǎn)單的推理。因此,真正的問(wèn)題是模型所展示的效應(yīng)的程度,而不是種類。如果承認(rèn)模型在種類上捕捉了知識(shí)效應(yīng),那么這種批評(píng)就失去了大部分力量。
此外,特征比較與基于規(guī)則的分類的存在并不矛盾。例如,考慮Rips(1989)的經(jīng)典研究,其中參與者被要求判斷一個(gè)直徑為3英寸的物體更有可能是披薩還是硬幣。由于硬幣的直徑是固定的,受訪者通常會(huì)回答該物體更有可能是披薩,即使它與硬幣更相似。這一結(jié)果通常被認(rèn)為表明存在可以覆蓋更典型相似性評(píng)估過(guò)程的基于規(guī)則的分類過(guò)程。然而,需要注意的是,關(guān)于硬幣的相關(guān)背景知識(shí)只能通過(guò)特征比較來(lái)應(yīng)用:必須評(píng)估刺激物體的直徑,并將其與已知的硬幣直徑進(jìn)行比較。因此,完全有可能用我們的模型來(lái)解釋這種效應(yīng)。關(guān)于硬幣的一組軟規(guī)則可以按照公式(2)編碼到語(yǔ)義指針中,其中一條規(guī)則可以非常強(qiáng)烈地懲罰任何足夠大直徑的刺激的連貫性得分。當(dāng)然,解釋更復(fù)雜的效果是未來(lái)工作的一個(gè)重要目標(biāo),但鑒于已經(jīng)使用語(yǔ)義指針實(shí)現(xiàn)了復(fù)雜推理任務(wù)(如漢諾塔謎題)的模型(Stewart & Eliasmith,2011),我們聲稱提供了一個(gè)處理知識(shí)效應(yīng)的良好起點(diǎn)是合理的。
對(duì)我們模型的另一個(gè)潛在批評(píng)是,它所提供的所有解釋性洞見(jiàn)都?xì)w因于語(yǔ)義指針的數(shù)學(xué)結(jié)構(gòu)。雖然可以使用抽象于神經(jīng)實(shí)現(xiàn)的基于向量的模型獲得良好的分類性能(例如,Knapp & Anderson,1984),但這些模型并未描述我們模擬中存在的那種時(shí)間動(dòng)態(tài)。這些動(dòng)態(tài)可以用來(lái)對(duì)(a)不同任務(wù)之間的反應(yīng)時(shí)間差異和(b)任務(wù)執(zhí)行期間神經(jīng)活動(dòng)的時(shí)間和解剖定位進(jìn)行大致預(yù)測(cè)。例如,我們的模型預(yù)測(cè),在執(zhí)行實(shí)驗(yàn)3中的任務(wù)時(shí),與執(zhí)行實(shí)驗(yàn)1或2中的任務(wù)相比,基底神經(jīng)節(jié)和丘腦中的神經(jīng)活動(dòng)會(huì)更多,因?yàn)閳?zhí)行了更多的動(dòng)作。同樣,模型預(yù)測(cè)在實(shí)驗(yàn)3中,運(yùn)動(dòng)系統(tǒng)活動(dòng)的增加應(yīng)該比實(shí)驗(yàn)1或2更晚發(fā)生,因?yàn)橛扇蝿?wù)向量啟動(dòng)的較長(zhǎng)動(dòng)作序列導(dǎo)致執(zhí)行運(yùn)動(dòng)路由的動(dòng)作被延遲。一般來(lái)說(shuō),該模型預(yù)測(cè)涉及對(duì)語(yǔ)義指針進(jìn)行更多操作的任務(wù)比涉及較少操作的任務(wù)需要更長(zhǎng)時(shí)間,其他條件相同的情況下。
最后的一個(gè)問(wèn)題是,該模型目前預(yù)測(cè)在涉及相同實(shí)驗(yàn)任務(wù)的不同條件之間沒(méi)有反應(yīng)時(shí)間(RTs)的差異。例如,在實(shí)驗(yàn)3中,模型生成分類判斷所需的時(shí)間并不取決于正在分類的刺激類型(即,原型和對(duì)照刺激的分類時(shí)間大致相同)。這種行為與Lin和Murphy(第1160頁(yè))的觀察結(jié)果相沖突,他們發(fā)現(xiàn)與不符合類別描述的刺激相比,符合類別描述的刺激的反應(yīng)時(shí)間更快。然而,重要的是要注意,這些RT差異可能是由于我們沒(méi)有明確模擬的因素造成的。例如,可能的情況是,編碼在語(yǔ)義指針中的規(guī)則的應(yīng)用也會(huì)導(dǎo)致引發(fā)特定運(yùn)動(dòng)行為的過(guò)程。在我們的模型中,原型刺激往往比其他刺激更快地達(dá)到高于閾值的連貫性得分,盡管反映這一點(diǎn)的分類判斷直到從存儲(chǔ)在記憶中的語(yǔ)義指針中解碼出所有四條規(guī)則后才會(huì)通過(guò)運(yùn)動(dòng)緩沖區(qū)傳遞。如果運(yùn)動(dòng)啟動(dòng)與連貫性得分的值成比例發(fā)生,那么也許可以解釋這些RT差異。還值得注意的是,在Regehr和Brook的結(jié)果中,在實(shí)驗(yàn)1C中沒(méi)有觀察到不同刺激條件之間的顯著RT差異(見(jiàn)第100頁(yè))??傮w而言,盡管在單一任務(wù)中解釋不同條件之間的差異在我們的建??蚣軆?nèi)仍有待進(jìn)一步探索,但該框架目前確實(shí)對(duì)不同任務(wù)中神經(jīng)活動(dòng)的時(shí)間和解剖定位做出了有趣的預(yù)測(cè)。我們認(rèn)為后一點(diǎn)是我們的建模框架所提供的主要洞見(jiàn),并認(rèn)識(shí)到在該框架內(nèi)進(jìn)一步研究反應(yīng)時(shí)間數(shù)據(jù)的必要性。
8. 總體討論
值得反思語(yǔ)義指針框架的一些更一般的屬性。如前所述,該框架提供了一種相對(duì)直接的策略,用于解釋各種概念功能。這種策略的第一步是假設(shè)某個(gè)感興趣現(xiàn)象背后的語(yǔ)義指針的結(jié)構(gòu)。下一步是假設(shè)一組機(jī)制,這些機(jī)制操縱、壓縮和解壓縮這些語(yǔ)義指針以產(chǎn)生該現(xiàn)象。最近的研究表明,這種策略可以用來(lái)激勵(lì)一種新的認(rèn)知架構(gòu)(Eliasmith, 2013)。最近的文章還使用語(yǔ)義指針來(lái)解釋啟動(dòng)效應(yīng)、意圖、情感、創(chuàng)造力和意識(shí)(Schr?der & Thagard, 2013; Schr?der, Stewart, & Thagard, 2014; Thagard & Schr?der, 2014; Thagard & Stewart, 2011; Thagard & Stewart, 2014)。
與這種廣泛的應(yīng)用一致,語(yǔ)義指針框架合理地滿足了我們對(duì)概念理論的五個(gè)標(biāo)準(zhǔn)。在分類方面,我們能夠用我們的模型解釋一系列重要的實(shí)驗(yàn)結(jié)果,并推導(dǎo)出相關(guān)結(jié)果的預(yù)測(cè)。此外,我們的模型所執(zhí)行的推理和感知評(píng)估表明,它有能力以統(tǒng)一的方式解釋涉及規(guī)則和記憶的分類行為(參見(jiàn)Sloman, 1996; Smith, Patalano, & Jonides, 1998)。還可以擴(kuò)展到涉及更多分類現(xiàn)象的情況。例如,Eliasmith(2013)描述了使用語(yǔ)義指針對(duì)手寫(xiě)數(shù)字圖像進(jìn)行分類的模擬,其準(zhǔn)確率達(dá)到了人類水平。同樣,Hunsberger, Blouw, Bergstra和Eliasmith(2013)在實(shí)驗(yàn)1和2中描述的任務(wù)中實(shí)現(xiàn)了人類水平的分類表現(xiàn),同時(shí)使用了一個(gè)層次化的視覺(jué)網(wǎng)絡(luò),該網(wǎng)絡(luò)以刺激的原始圖像作為輸入。
為了實(shí)現(xiàn)遞歸綁定,我們使用卷積來(lái)定義如公式(1)和(2)中描述的表示方案中的那種結(jié)構(gòu)豐富的語(yǔ)義指針。這些方案也可以修改以解釋簡(jiǎn)單自然語(yǔ)言表達(dá)式的形成。例如,Eliasmith(2013)證明,可以使用語(yǔ)義指針對(duì)簡(jiǎn)單句子進(jìn)行編碼,這些指針將單詞的表征與其所占據(jù)的語(yǔ)法角色的表征綁定在一起,Stewart, Choo和Eliasmith(2014)提出了使用這種相同架構(gòu)解析簡(jiǎn)單自然語(yǔ)言句子的方法。研究語(yǔ)義指針在自然語(yǔ)言處理任務(wù)中的應(yīng)用是一個(gè)重要的進(jìn)一步研究課題。
通過(guò)使用LIF(漏電積分-發(fā)放)神經(jīng)元以及基底神經(jīng)節(jié)、丘腦和皮層等解剖區(qū)域之間生物學(xué)上合理的連接模式,滿足了神經(jīng)實(shí)現(xiàn)標(biāo)準(zhǔn)。此外,由于感知和推理處理是在模型的不同子系統(tǒng)中完成的,該模型與表明抽象和具體概念在不同神經(jīng)系統(tǒng)中被處理的證據(jù)一致(Shallice & Cooper, 2013)。盡管如此,我們神經(jīng)實(shí)現(xiàn)的某些方面仍需進(jìn)一步研究。例如,目前沒(méi)有直接證據(jù)表明大腦在概念處理過(guò)程中使用了卷積操作。但由于假設(shè)這種操作帶來(lái)了眾多的解釋優(yōu)勢(shì),我們認(rèn)為這是一個(gè)合理的假設(shè)。
在范圍方面,我們模型中使用的不同語(yǔ)義指針編碼了不同種類的表征,將這些差異推廣以解釋高度復(fù)雜和抽象的概念是相當(dāng)直接的。例如,Eliasmith(2013)描述了操縱語(yǔ)義指針的技術(shù),這些指針包括從成年人詞匯量中提取的數(shù)百個(gè)綁定元素,同時(shí)仍然符合已知的解剖學(xué)約束。類似地,Crawford, Gingerich和Eliasmith(2013)展示了使用語(yǔ)義指針對(duì)整個(gè)WordNet圖進(jìn)行可擴(kuò)展編碼的方法。
關(guān)于表征內(nèi)容,還需要多說(shuō)一些。先前的研究表明,NEF(神經(jīng)工程框架)與所謂的語(yǔ)義兩因素理論兼容(Eliasmith, 2000, 2003)。兩因素理論從外部原因(例如,驅(qū)動(dòng)神經(jīng)元群體活動(dòng)的刺激)和計(jì)算角色(例如,神經(jīng)群體對(duì)其他群體產(chǎn)生的后續(xù)影響)兩個(gè)方面描述心理表征的內(nèi)容。因此,以一個(gè)神經(jīng)群體表征聽(tīng)覺(jué)圖像為例,刺激被編碼為神經(jīng)脈沖,這指定了因果因素,而脈沖的解碼(以恢復(fù)傳遞給其他神經(jīng)元的信號(hào))則指定了計(jì)算因素。這兩個(gè)因素共同定義了表征的內(nèi)容,并大致指定了它的外延和內(nèi)涵。對(duì)于通過(guò)壓縮眾多表征構(gòu)建的語(yǔ)義指針,相關(guān)的因素將由其他神經(jīng)群體中的脈沖模式來(lái)支撐。這些群體中的活動(dòng)可能反過(guò)來(lái)更直接地受到感知刺激的驅(qū)動(dòng),這將因果地貢獻(xiàn)于構(gòu)建的語(yǔ)義指針的內(nèi)容。當(dāng)然,理論細(xì)節(jié)需要進(jìn)一步完善,但追蹤神經(jīng)活動(dòng)模式之間的功能關(guān)系的一般策略為識(shí)別任意復(fù)雜語(yǔ)義指針的內(nèi)容提供了一種合理的方法。
總體而言,盡管仍有許多工作要做,以擴(kuò)展語(yǔ)義指針框架以解釋更復(fù)雜的概念現(xiàn)象,但它比現(xiàn)有方法有明顯的優(yōu)勢(shì)。首先,其神經(jīng)計(jì)算的詳細(xì)程度超過(guò)了大多數(shù)(如果不是全部的話)其他解釋。其次,它為一系列分類現(xiàn)象提供了一種合理的統(tǒng)一解釋。第三,它對(duì)概念綁定和自然語(yǔ)言表達(dá)式形成提供了機(jī)械性的描述。在更哲學(xué)的層面上,語(yǔ)義指針框架有工具來(lái)解釋不同種類的概念以及概念的語(yǔ)義內(nèi)容。在心理學(xué)文獻(xiàn)中,語(yǔ)義和范圍的討論常常被忽視或擱置,而哲學(xué)家(盡管有少數(shù)例外,如Prinz, 2002)對(duì)概念處理的實(shí)證研究關(guān)注相對(duì)較少。最后,我們認(rèn)為該框架的主要貢獻(xiàn)在于,它提供了一種通用的表征方案和生物學(xué)上合理的機(jī)制,可以用這些機(jī)制來(lái)實(shí)現(xiàn)通常被認(rèn)為在本質(zhì)上根本不同的概念功能(例如,Machery, 2009)。我們?cè)谶@里建模的現(xiàn)象范圍顯然有其局限性,但應(yīng)該清楚的是,語(yǔ)義指針提供了一種單一的表征格式,能夠描述所有主要類型的概念處理。將這種表征格式應(yīng)用于更廣泛的現(xiàn)象是未來(lái)工作的一個(gè)重要方向。
9. 結(jié)論
回到我們的引言部分,我們認(rèn)為語(yǔ)義指針為當(dāng)前概念研究中所面臨的問(wèn)題提供了一個(gè)有希望的解決方案。由于該框架不需要依賴多個(gè)共指代的表征結(jié)構(gòu)來(lái)解釋類別知識(shí),因此避免了多元論的問(wèn)題。在我們所有的模擬中,一個(gè)語(yǔ)義指針(加上用于解壓縮等的處理機(jī)制)就足以解釋使用概念進(jìn)行分類所涉及的所有認(rèn)知過(guò)程。由于一個(gè)單一的語(yǔ)義指針能夠以這種方式全面支持概念處理,因此聲稱“概念”這一術(shù)語(yǔ)指代一組不相關(guān)的表征和過(guò)程是沒(méi)有意義的。我們建議,如果我們的方法具有任何說(shuō)服力,那么概念將會(huì)長(zhǎng)期存在。
注釋
1. 專注于分類模擬還有三個(gè)其他原因。首先,篇幅限制使得一篇文章無(wú)法對(duì)眾多概念現(xiàn)象進(jìn)行建模。其次,分類是一個(gè)典型的概念任務(wù),因此吸引了來(lái)自不同學(xué)科背景的廣泛研究者的興趣。第三,大多數(shù)現(xiàn)有的概念實(shí)證研究都集中在分類研究上,因此我們有豐富的數(shù)據(jù)可以與我們的結(jié)果進(jìn)行比較。對(duì)于那些研究興趣有限的任務(wù),模型與數(shù)據(jù)的比較是不可行的。
2. 神經(jīng)工程框架(NEF)從兩個(gè)方面定義心理表征:一是將刺激編碼為神經(jīng)脈沖模式,二是將脈沖序列解碼為它們所代表的物理變量(Eliasmith, 2003)。舉一個(gè)非常簡(jiǎn)單的例子,腦干中的兩個(gè)區(qū)域——舌下前核(NPH)和腹內(nèi)側(cè)前庭核(VN)——包含具有調(diào)諧曲線的神經(jīng)元,這些曲線描繪了水平眼位與脈沖活動(dòng)之間的關(guān)系(Eliasmith & Anderson, 2003, 第44—49頁(yè))。因此,NPH和VN中的神經(jīng)元共同“編碼”了眼位的測(cè)量值為神經(jīng)脈沖模式。解碼過(guò)程涉及為每個(gè)神經(jīng)元的反應(yīng)分配一個(gè)最優(yōu)權(quán)重(根據(jù)解碼表征的維度,可以是一個(gè)標(biāo)量或向量),并對(duì)相關(guān)群體和時(shí)間內(nèi)的所有加權(quán)反應(yīng)進(jìn)行求和。在NPH和VN中,這個(gè)求和結(jié)果是對(duì)眼睛位置的估計(jì)。關(guān)于這些編碼和解碼關(guān)系的更詳細(xì)數(shù)學(xué)定義,請(qǐng)參閱補(bǔ)充材料的A部分。
3. 還值得注意的是,這種單一的綁定網(wǎng)絡(luò)可以計(jì)算任意兩個(gè)輸入向量的循環(huán)卷積,而NEF具備資源,可以通過(guò)使用生物學(xué)上合理的赫布學(xué)習(xí)規(guī)則來(lái)解釋如何學(xué)習(xí)實(shí)現(xiàn)這種綁定網(wǎng)絡(luò)的權(quán)重(Stewart, Bekolay, & Eliasmith, 2011)。
4. 獲得向量的偽逆是一個(gè)簡(jiǎn)單的線性變換,因此可以在神經(jīng)群體之間的連接上計(jì)算。將語(yǔ)義指針與向量的偽逆進(jìn)行卷積,可以提取語(yǔ)義指針中綁定到該向量的任何項(xiàng)目的近似值。
5. 具體來(lái)說(shuō),第一個(gè)原型的向量是隨機(jī)生成的,而第二個(gè)和第三個(gè)原型的向量是隨機(jī)生成向量與第一個(gè)向量的和。
6. 在Posner和Keele(1968)的論文中,訓(xùn)練和高失真刺激是通過(guò)7.7比特失真規(guī)則生成的,而低失真模式是通過(guò)5比特失真規(guī)則生成的。由于失真值是彼此的倍數(shù),我們使用“基礎(chǔ)失真水平”等于sigma來(lái)擬合模型,并使用標(biāo)準(zhǔn)差為7.7/5倍sigma的值來(lái)生成訓(xùn)練和高條件下的刺激模式。
7. 為了減少模型的運(yùn)行時(shí)間,沒(méi)有進(jìn)行涉及完全隨機(jī)刺激的試驗(yàn),因?yàn)檫@些刺激沒(méi)有正確性的衡量標(biāo)準(zhǔn)。
8. 完整的特征維度和值如下:身體(角形或圓形);腿部(長(zhǎng)或短);腿的數(shù)量(2條或6條);斑點(diǎn)(有或無(wú));脖子(長(zhǎng)或短)。
9. 這里還需要進(jìn)一步說(shuō)明的一點(diǎn)是,區(qū)分概念獲取和概念使用是很重要的。在Lin和Murphy的實(shí)驗(yàn)中,是在概念獲取過(guò)程中,利用關(guān)于環(huán)的收縮與殺死邦杜之間因果關(guān)系的知識(shí),來(lái)優(yōu)先考慮圖克(Tuk)上環(huán)的存在。在使用概念進(jìn)行分類時(shí),這些因果關(guān)系不需要直接考慮。由于我們并不打算對(duì)概念獲取進(jìn)行全面解釋,因此在我們的模型中省略這些因果推理是合理的。
10. 我們選擇450毫秒的模擬窗口并沒(méi)有特別的意義,只是這個(gè)窗口為所有三種分類任務(wù)的完成提供了足夠的時(shí)間,同時(shí)最小化了總的模擬時(shí)間。此外,我們的研究中并沒(méi)有隱含反應(yīng)時(shí)間應(yīng)該在450毫秒左右的預(yù)測(cè),因?yàn)槟P团懦舜罅康母兄瓦\(yùn)動(dòng)處理過(guò)程,這些過(guò)程需要納入對(duì)反應(yīng)時(shí)間的精確估計(jì)中。
11. 這是一個(gè)過(guò)度簡(jiǎn)化的說(shuō)法。為了避免因誤表征而產(chǎn)生的問(wèn)題,使用各種神經(jīng)活動(dòng)觸發(fā)因素之間的統(tǒng)計(jì)依賴性來(lái)指定相關(guān)的因果因素。詳情請(qǐng)參閱Eliasmith(2000)。
原文鏈接: https://onlinelibrary.wiley.com/doi/pdfdirect/10.1111/cogs.12265
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.