01
兩位諾貝爾獎(jiǎng)得主
約翰·J·霍普菲爾德(左),1933年出生于美國(guó)伊利諾伊州芝加哥市,1958年獲得美國(guó)康奈爾大學(xué)博士學(xué)位,現(xiàn)任美國(guó)普林斯頓大學(xué)教授。
杰弗里·E·辛頓(右),1947年出生于英國(guó)倫敦,1978年獲得英國(guó)愛(ài)丁堡大學(xué)博士學(xué)位,現(xiàn)任加拿大多倫多大學(xué)教授。
02
機(jī)器學(xué)習(xí)的3種基本方法
機(jī)器學(xué)習(xí)是人工智能和計(jì)算機(jī)科學(xué)的重要分支,是基于樣本數(shù)據(jù)構(gòu)建模型并利用模型在沒(méi)有明確編程的情況下做出預(yù)測(cè)或決策的一類算法。監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督和強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的基本方法。
01
監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)使用人工標(biāo)記的訓(xùn)練樣本將已有知識(shí)應(yīng)用于新數(shù)據(jù),以預(yù)測(cè)未來(lái)事件。1936年,英國(guó)數(shù)學(xué)家費(fèi)希爾(Ronald Fisher)提出的線性判別分析是最早的監(jiān)督學(xué)習(xí)算法。20世紀(jì)50年代,基于貝葉斯決策理論的貝葉斯分類器開(kāi)始被用于分類問(wèn)題。1958年,美國(guó)認(rèn)知心理學(xué)家羅森布拉特(Frank Rosenblatt)發(fā)明感知器算法,它被認(rèn)為是人工神經(jīng)網(wǎng)絡(luò)的前身。1967年,美國(guó)信息理論家科弗(Thomas Cover)和計(jì)算機(jī)科學(xué)家哈特(Peter Hart)提出基于模板匹配思想的K-最近鄰算法。20世紀(jì)八九十年代,決策樹(shù)和神經(jīng)網(wǎng)絡(luò)算法開(kāi)始興起。1995年,兩種重要算法——支持向量機(jī)和AdaBoost誕生。支持向量機(jī)是處理線性分類和非線性分類問(wèn)題的主要方法,而AdaBoost可以將許多其他類型的算法集成起來(lái)使用以達(dá)到最佳性能。1995年至1997年,德國(guó)計(jì)算機(jī)科學(xué)家霍赫賴特(Sepp Hochreiter)和施米德胡貝(Juergen Schmidhuber)提出長(zhǎng)短期記憶算法,可以部分處理梯度消失問(wèn)題。2013年,長(zhǎng)短期記憶算法與深度循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)合成功應(yīng)用于語(yǔ)音識(shí)別。2001年,美國(guó)統(tǒng)計(jì)學(xué)家布賴曼(Leo Breiman)提出優(yōu)化的隨機(jī)森林算法。隨機(jī)森林是一個(gè)用隨機(jī)方式建立的包含多個(gè)決策樹(shù)的分類器,對(duì)多數(shù)據(jù)集和高維數(shù)據(jù)的處理有很大優(yōu)勢(shì)。
監(jiān)督學(xué)習(xí)的常見(jiàn)應(yīng)用場(chǎng)景包括評(píng)估信用分?jǐn)?shù)、手寫(xiě)識(shí)別、語(yǔ)音識(shí)別、信息檢索、財(cái)務(wù)分析、偵測(cè)垃圾郵件等。
02無(wú)監(jiān)督學(xué)習(xí)
無(wú)監(jiān)督學(xué)習(xí)是基于統(tǒng)計(jì)的學(xué)習(xí)方法,通過(guò)對(duì)未知數(shù)據(jù)進(jìn)行分析來(lái)發(fā)現(xiàn)數(shù)據(jù)隱藏特征。無(wú)監(jiān)督學(xué)習(xí)包括聚類和數(shù)據(jù)降維兩種主要算法類型。1963年,美國(guó)空軍研究員沃德(Joe Ward)根據(jù)方差分析提出了最早的聚類算法——層次聚類算法。1967年,美國(guó)數(shù)學(xué)家麥奎因(James MacQueen)提出的k均值算法是聚類算法中知名度最高的算法,在此基礎(chǔ)上出現(xiàn)了大量的改進(jìn)算法和成功應(yīng)用。1977年,美國(guó)統(tǒng)計(jì)學(xué)家登普斯特(Arthur Dempster)提出最大期望算法,被用于聚類問(wèn)題和極大似然估計(jì)問(wèn)題。1995年,美國(guó)辛辛那提大學(xué)教授程(Yizong Cheng)提出可用于計(jì)算機(jī)視覺(jué)和圖像處理的均值漂移算法。2000年,美國(guó)計(jì)算機(jī)科學(xué)家史建波(Jianbo Shi)推廣了譜聚類算法,可以將聚類問(wèn)題轉(zhuǎn)化為圖的最優(yōu)切割問(wèn)題。最早的數(shù)據(jù)降維算法是1901年英國(guó)數(shù)學(xué)家及生物統(tǒng)計(jì)學(xué)家皮爾遜(Karl Pearson)提出的主成分分析法,比第一臺(tái)真正的計(jì)算機(jī)的誕生早了40多年。然而,在此后的近100年里數(shù)據(jù)降維算法在機(jī)器學(xué)習(xí)領(lǐng)域沒(méi)有出現(xiàn)重量級(jí)成果。1998年,德國(guó)計(jì)算機(jī)科學(xué)家舍爾科普夫(Bernhard Sch?lkopf)提出基于核方法的核主成分分析算法,可以實(shí)現(xiàn)高維數(shù)據(jù)的非線性降維。2000年以后,流形學(xué)習(xí)開(kāi)始成為熱點(diǎn),它的主要思想是將高維的數(shù)據(jù)映射到低維,使該低維的數(shù)據(jù)能夠反映原高維數(shù)據(jù)的某些本質(zhì)結(jié)構(gòu)特征。基于流行學(xué)習(xí)出現(xiàn)了局部線性嵌入、拉普拉斯特征映射、局部保持投影等距映射等新算法。2008年出現(xiàn)的t-分布式隨機(jī)鄰居嵌入算法是降維算法中最年輕的成員。
無(wú)監(jiān)督學(xué)習(xí)的常見(jiàn)應(yīng)用場(chǎng)景包括反洗錢、客戶分組、廣告推薦、銷售趨勢(shì)預(yù)測(cè)等。
03
強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)源于心理學(xué)中的行為主義理論,強(qiáng)調(diào)智能體在獎(jiǎng)勵(lì)或懲罰的環(huán)境刺激下如何做出能取得最大化預(yù)期利益的行動(dòng),也就是說(shuō),讓智能體在環(huán)境中自我學(xué)習(xí)。早在1954年,明斯基就提出了“強(qiáng)化學(xué)習(xí)”的概念和術(shù)語(yǔ)。1965年,美國(guó)普渡大學(xué)教授傅京孫(King-Sun Fu)在研究控制論時(shí)提出“智能控制”的概念,明確了“試錯(cuò)”作為強(qiáng)化學(xué)習(xí)的核心機(jī)制。1957年,美國(guó)應(yīng)用數(shù)學(xué)家貝爾曼(Richard Bellman)為了求解最優(yōu)控制問(wèn)題的馬爾可夫決策過(guò)程提出了動(dòng)態(tài)規(guī)劃法,這一方法采用了類似強(qiáng)化學(xué)習(xí)的試錯(cuò)迭代求解機(jī)制。最早的強(qiáng)化學(xué)習(xí)算法是1988年加拿大計(jì)算機(jī)科學(xué)家薩頓(Richard Sutton)提出的時(shí)序差分學(xué)習(xí),它不需要獲知環(huán)境的全部信息就可以直接從實(shí)際經(jīng)驗(yàn)來(lái)獲取信息,同時(shí)不需要完整的收益反饋信息就可以實(shí)時(shí)更新決策。1989年,英國(guó)計(jì)算機(jī)科學(xué)家沃特金斯(Chris Watkins)提出的Q學(xué)習(xí)進(jìn)一步拓展了強(qiáng)化學(xué)習(xí)的應(yīng)用,使得強(qiáng)化學(xué)習(xí)不再依賴于問(wèn)題模型,Q學(xué)習(xí)也因此成為最廣泛使用的強(qiáng)化學(xué)習(xí)方法之一。此后近20年的時(shí)間里,強(qiáng)化學(xué)習(xí)被監(jiān)督學(xué)習(xí)的光芒所遮掩而發(fā)展緩慢。2010年以后,強(qiáng)化學(xué)習(xí)結(jié)合神經(jīng)網(wǎng)絡(luò)發(fā)展出深度強(qiáng)化學(xué)習(xí)算法,強(qiáng)化學(xué)習(xí)由此迎來(lái)大發(fā)展時(shí)期。2013年,谷歌公司旗下的深度思維公司(DeepMind)發(fā)表了利用強(qiáng)化學(xué)習(xí)玩雅達(dá)利(Atari)游戲的論文。2015年,深度思維公司開(kāi)發(fā)的AlphaGo程序擊敗了圍棋二段選手樊麾,成為第一個(gè)無(wú)須讓子即可以擊敗圍棋職業(yè)棋手的計(jì)算機(jī)圍棋程序。2016年,AlphaGo在一場(chǎng)五番棋比賽中以4:1擊敗頂尖圍棋職業(yè)棋手李世石。
強(qiáng)化學(xué)習(xí)的常見(jiàn)應(yīng)用場(chǎng)景包括無(wú)人駕駛、機(jī)器翻譯、醫(yī)療保健、新聞定制、廣告營(yíng)銷、機(jī)器人控制等。
03
深度學(xué)習(xí)發(fā)展歷程
為了理解此次獲獎(jiǎng)的兩位科學(xué)家在機(jī)器學(xué)習(xí)發(fā)展過(guò)程中,究竟做出了怎樣的開(kāi)創(chuàng)性貢獻(xiàn),讓我們一同來(lái)回顧深度學(xué)習(xí)的發(fā)展歷程,在其中搜尋霍普菲爾德與辛頓的名字。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,是一種模擬大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法。深度學(xué)習(xí)源于對(duì)人腦工作機(jī)制的研究。獲得1981年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)的美國(guó)神經(jīng)生理學(xué)家休伯爾(David Hubel)和維澤爾(Torsten Wiesel)發(fā)現(xiàn)人的視覺(jué)系統(tǒng)的信息處理是分級(jí)的,人類對(duì)高層特征的感知基于低層特征的組合。例如,對(duì)人臉的識(shí)別經(jīng)過(guò)瞳孔攝入像素(形狀判斷)抽象出人臉概念——識(shí)別為人臉的過(guò)程,從低層到高層的特征表達(dá)越來(lái)越抽象和概念化。這一發(fā)現(xiàn)意味著大腦是一個(gè)深度架構(gòu),認(rèn)知過(guò)程也是深度的,而深度學(xué)習(xí)恰恰就是通過(guò)組合低層特征形成更加抽象的高層特征。深度學(xué)習(xí)的發(fā)展可以分為感知器、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等3個(gè)階段。
1943年,美國(guó)心理學(xué)家麥卡洛克(Warren S. McCulloch)和數(shù)理邏輯學(xué)家皮茨(Walter Pitts)提出人工神經(jīng)網(wǎng)絡(luò)的概念,并構(gòu)建了人工神經(jīng)元的數(shù)學(xué)模型,即MCP模型,從而開(kāi)創(chuàng)了人工神經(jīng)網(wǎng)絡(luò)研究的時(shí)代。1949年,加拿大心理學(xué)家赫布(Donald Hebb)描述了突觸可塑性的基本原理,從神經(jīng)科學(xué)理論上解釋了學(xué)習(xí)過(guò)程中大腦神經(jīng)細(xì)胞所發(fā)生的變化。赫布理論是人工神經(jīng)網(wǎng)絡(luò)的生物學(xué)基礎(chǔ)。1958年,羅森布拉特在康奈爾航空實(shí)驗(yàn)室發(fā)明感知器算法,這是世界上第一個(gè)具有完整算法描述的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。感知器算法是簡(jiǎn)單配置的單層神經(jīng)網(wǎng)絡(luò),可以區(qū)分三角形等基本形狀。但是,受限于計(jì)算機(jī)硬件,感知器算法在當(dāng)時(shí)無(wú)法被廣泛應(yīng)用。1969年,明斯基和佩珀特(Seymour Papert)證明感知器不能解決簡(jiǎn)單的異或(XOR)等線性不可分問(wèn)題,感知器研究隨之在20世紀(jì)70年代陷入低谷。
1959年,休伯爾和維澤爾在研究貓的視覺(jué)神經(jīng)系統(tǒng)時(shí)發(fā)現(xiàn),在大腦的初級(jí)視覺(jué)皮層中存在兩種細(xì)胞:簡(jiǎn)單細(xì)胞和復(fù)雜細(xì)胞,其中,簡(jiǎn)單細(xì)胞感知光照信息,復(fù)雜細(xì)胞感知運(yùn)動(dòng)信息。受此啟發(fā),1980年日本計(jì)算機(jī)科學(xué)家福島邦彥(Kunihiko Fukushima)提出了一個(gè)網(wǎng)絡(luò)模型——“神經(jīng)認(rèn)知機(jī)”(Neocognitron)。這種網(wǎng)絡(luò)分成多層,每層由一種神經(jīng)元組成。在網(wǎng)絡(luò)內(nèi)部,兩種神經(jīng)元交替出現(xiàn),分別用來(lái)提取圖形信息和組合圖形信息。這兩種神經(jīng)元后來(lái)分別演化成卷積層(Convolution Layer)和提取層(Pooling Layer)。然而,這個(gè)網(wǎng)絡(luò)的神經(jīng)元都是人工設(shè)計(jì)的而不能根據(jù)計(jì)算結(jié)果自動(dòng)調(diào)整,所以只能識(shí)別少量簡(jiǎn)單數(shù)字而不具備學(xué)習(xí)能力。
1982年,美國(guó)物理學(xué)家霍普菲爾德(John J. Hopfield)基于統(tǒng)計(jì)物理提出了有少量記憶能力的霍普菲爾德神經(jīng)網(wǎng)絡(luò)模型,開(kāi)創(chuàng)性地論證了按照赫布法則設(shè)計(jì)權(quán)重的神經(jīng)網(wǎng)絡(luò)穩(wěn)定性問(wèn)題。同年,芬蘭計(jì)算機(jī)科學(xué)家科霍寧(Teuvo Kohonen)通過(guò)模擬大腦神經(jīng)元的信號(hào)處理機(jī)制,提出了自組織映射網(wǎng)絡(luò),被用于數(shù)據(jù)分析和數(shù)據(jù)探索,其第一個(gè)應(yīng)用領(lǐng)域是語(yǔ)音分析。科霍寧的關(guān)鍵發(fā)明是引入了一個(gè)系統(tǒng)模型,包含一個(gè)實(shí)現(xiàn)贏家通吃功能的競(jìng)爭(zhēng)性神經(jīng)網(wǎng)絡(luò)和一個(gè)實(shí)現(xiàn)可塑性控制的子系統(tǒng)。1987年,美國(guó)科學(xué)家格羅斯伯格(Stephen Grossberg)和卡彭特(Gail Carpenter)提出了自適應(yīng)共振理論網(wǎng)絡(luò),通過(guò)讓已知信息和未知信息發(fā)生“共振”,從已知信息推測(cè)未知信息來(lái)實(shí)現(xiàn)類比學(xué)習(xí)。然而,這些神經(jīng)網(wǎng)絡(luò)存在學(xué)習(xí)效率不高、需要不斷優(yōu)化設(shè)計(jì)、網(wǎng)絡(luò)記憶容量小等不足,實(shí)際應(yīng)用范圍有限。
1986年,美國(guó)心理學(xué)家魯姆哈特(David Rumelhart)、計(jì)算機(jī)科學(xué)家威廉姆斯(Ronald Williams)和加拿大認(rèn)知心理學(xué)家及計(jì)算機(jī)科學(xué)家辛頓(Geoffrey E. Hinton)共同提出反向傳播算法(BP算法)。BP算法通過(guò)梯度的鏈?zhǔn)椒▌t使輸出結(jié)果和真實(shí)值之間的差異反饋到每一層的權(quán)重中,從而讓每一層函數(shù)都能像感知機(jī)那樣得到訓(xùn)練。BP算法階段性解決了神經(jīng)網(wǎng)絡(luò)自適應(yīng)、自主學(xué)習(xí)的難題。1989年,貝爾實(shí)驗(yàn)室的法國(guó)計(jì)算機(jī)科學(xué)家楊立昆(Yann LeCun)第一次成功實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)的實(shí)踐應(yīng)用。他將卷積神經(jīng)網(wǎng)絡(luò)與BP算法結(jié)合,提出LeNet網(wǎng)絡(luò)。20世紀(jì)90年代,美國(guó)郵政署將LeNet網(wǎng)絡(luò)用于自動(dòng)讀取信封上的郵政編碼。然而,基于BP算法的神經(jīng)網(wǎng)絡(luò)僅能求解局部最優(yōu),而且這種情況隨著網(wǎng)絡(luò)層數(shù)的增加越來(lái)越嚴(yán)重,這一問(wèn)題制約了神經(jīng)網(wǎng)絡(luò)的發(fā)展。
2006年,辛頓提出深度學(xué)習(xí)算法,通過(guò)無(wú)監(jiān)督學(xué)習(xí)和逐層預(yù)訓(xùn)練的方式有效降低了訓(xùn)練難度,從而解決了BP神經(jīng)網(wǎng)絡(luò)難以達(dá)到全局最優(yōu)的問(wèn)題。2012年,辛頓的研究小組采用深度學(xué)習(xí)贏得了ImageNet圖像分類比賽的冠軍,準(zhǔn)確率超出第二名10%以上,在計(jì)算機(jī)視覺(jué)領(lǐng)域產(chǎn)生極大震動(dòng),引發(fā)了深度學(xué)習(xí)的熱潮。2013年,《麻省理工科技評(píng)論》將深度學(xué)習(xí)列為年度世界十大技術(shù)突破之首。如今,深度學(xué)習(xí)已經(jīng)被廣泛用于搜索引擎、語(yǔ)音識(shí)別、自動(dòng)機(jī)器翻譯、自然語(yǔ)言處理、自動(dòng)駕駛、人臉識(shí)別等領(lǐng)域,是人工智能最熱門(mén)的研究方向之一。
“獲獎(jiǎng)?wù)叩墓ぷ饕呀?jīng)產(chǎn)生了巨大的效益。在物理學(xué)領(lǐng)域,我們將人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于廣泛的領(lǐng)域,例如開(kāi)發(fā)具有特定屬性的新材料。”2024年諾貝爾物理學(xué)獎(jiǎng)委員會(huì)主席穆恩斯(Ellen Moons) 如是說(shuō)。
本文作者為中國(guó)科協(xié)創(chuàng)新戰(zhàn)略研究院博士后王楠、中國(guó)科協(xié)創(chuàng)新戰(zhàn)略研究院研究員王國(guó)強(qiáng)。
本文節(jié)選自《智能時(shí)代的算法發(fā)展》,微信公眾號(hào)發(fā)表時(shí)有改動(dòng)。文中圖片均來(lái)自瑞典皇家科學(xué)院。
科學(xué)畫(huà)報(bào)
2024年諾貝爾獎(jiǎng)系列文章敬請(qǐng)期待
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.