人類大腦是如何學習的?想要全面地回答這個問題并不容易。
人腦是目前已知最復雜的神經(jīng)網(wǎng)絡,也是唯一能夠實現(xiàn)復雜認知功能的器官,它的神經(jīng)元多達數(shù)百億個,并且每個神經(jīng)元都與數(shù)千乃至上萬個其他神經(jīng)元形成連接網(wǎng)絡。
盡管科學家們一直在努力探索,但迄今為止人們對大腦的功能和信號傳遞機制尚未完全明晰。
美國著名物理學家理查德·費曼(Richard Feynman)曾說過,“如果我不能創(chuàng)造它,我就不能理解它(If I cannot create,I do not understand)。”
為進一步理解大腦的工作原理,復旦大學馮建峰教授團隊構建了一個全人腦尺度大腦模擬平臺數(shù)字孿生腦(DTB,Digital Twin Brain),首次在世界上實現(xiàn)了對 860 億神經(jīng)元和百萬億突觸的具有生物已知結構的模擬。
數(shù)字孿生腦是通過計算機或芯片來實現(xiàn)的虛擬大腦,它能夠幫助研究人員理解信息如何在大腦中傳播和處理的過程。
大腦在臨界點附近的動態(tài)行為,被認為是其認知功能的關鍵時空特性,這與大模型中經(jīng)常提到的 Scaling Law(縮放定律)有“異曲同工之妙”。
研究人員發(fā)現(xiàn),DTB 在規(guī)模與結構方面越接近人類大腦時,其在功能上表現(xiàn)出的現(xiàn)象也更接近真實人腦的認知功能。
當神經(jīng)元數(shù)量達到 50 億以上規(guī)模時,會在數(shù)字孿生腦中觀察到人腦智能的涌現(xiàn)特征。
該研究有望為腦疾病的診療提供更好的策略,為生物實驗提供平臺,以及為發(fā)展類腦 AI 提供新的工具和理念。
圖丨馮建峰(來源:馮建峰)
ARM 處理器硬件微型體系架構原創(chuàng)者、英國曼徹斯特大學斯蒂芬·B·弗伯(Stephen B. Furber)教授對該研究評價稱:“我已經(jīng)深入了解了 DTB 團隊的工作,他們有著很大的目標,通過基于生物數(shù)據(jù)的全腦計算模型的模擬和整合來探索類腦智能。”
在英國倫敦大學學院卡爾·J·弗里斯頓(Karl J. Friston)教授看來,DTB 是“全球計算神經(jīng)科學和生物信息學領域最全面、技術原則最嚴謹和最重要的工作之一”。
圖丨期刊當期封面(來源:National Science Review)
日前,相關論文以《通過模仿大腦休息和執(zhí)行任務狀態(tài)的類腦計算:擴展和架構》(Imitating and exploring human brain's resting and task-performing states via resembling brain computing: scaling and architecture)為題,以期刊封面形式發(fā)表在National Science Review[1]。
復旦大學盧文聯(lián)教授是第一作者,馮建峰教授擔任通訊作者。
圖丨相關論文(來源:National Science Review)
解決 243 萬 Gbit 每秒海量信息傳遞擁堵問題
據(jù)悉,該研究由 20 多名成員組成的交叉團隊共同完成,包括數(shù)學、神經(jīng)科學、計算機科學等。自 2018 年底,他們開始對數(shù)字孿生腦進行探索,整個研究經(jīng)歷了近 6 年時間。
歐盟“未來新型旗艦技術項目人類腦計劃”首席科學家、法國艾克斯-馬賽大學維克托·吉爾薩(Viktor Jirsa)教授指出,模擬具有 860 億個神經(jīng)元的人腦,并處理與動力學和參數(shù)空間相關的復雜性,是數(shù)學和計算機科學本身所面臨的一個挑戰(zhàn)。
在計算科學方面,想實現(xiàn)模擬如此大規(guī)模的神經(jīng)元,首先需要解決神經(jīng)元之間通訊量的挑戰(zhàn)。據(jù)課題組估算,860 億個神經(jīng)元之間的通訊量相當于中國所有無線通訊總量的 30 倍。
為了解決該問題,研究人員使用了 14012 張圖形處理器(GPU,Graphics Processing Unit),最大程度為計算的可靠性和準確性提供保障。
通過使用高性能計算系統(tǒng)和設計優(yōu)化路由,改進了神經(jīng)元組的分布,從而解決了 243 萬 Gbit 每秒海量信息傳遞的擁堵問題。
(來源:National Science Review)
在數(shù)學方面,如何準確地估計神經(jīng)元之間的連接權重,使得數(shù)字孿生腦的信號與人腦的信號盡可能相似,是研究中的關鍵難題之一。
英國皇家學會院士、2024 年諾貝爾物理學獎得主杰弗里·辛頓(Geoffrey Hinton)此前在接受《麻省理工科技評論》采訪時曾指出,人腦的突觸參數(shù)高達 100 萬億,比 GPT-3 的參數(shù)量(1750 億個)還高出 1000 倍 [2]。
研究人員使用數(shù)據(jù)同化方法,從有限的數(shù)據(jù)中估計出神經(jīng)元之間的連接權重。“這種方法使我們能夠將數(shù)字孿生腦的信號與人腦靜息態(tài)信號之間的相似度提高到 93% 以上。”馮建峰說。
(來源:National Science Review)
除了數(shù)學和計算科學上的挑戰(zhàn),該研究在生物學方面也經(jīng)歷了技術攻關。在靜息狀態(tài)下,數(shù)字孿生腦與大腦活動的高相似度是在大腦處于完全放松、不做任何事情的狀態(tài)下實現(xiàn)的。
當要求大腦執(zhí)行具體任務,例如對某個圖像進行評分或表達喜好時,情況會變得更復雜。
這時,大腦需要與外界環(huán)境進行交互,接收輸入信息(如視覺圖像)。因此生物學方面的挑戰(zhàn)在于,如何將這些環(huán)境輸入有效地傳遞給數(shù)字孿生腦,使其能夠模擬人腦與環(huán)境的互動。
馮建峰表示,這不僅要模擬大腦在靜息狀態(tài)下的活動,還要模擬大腦在執(zhí)行具體任務時的活動。
其涉及到大腦如何利用環(huán)境信息來執(zhí)行任務,即從“不做任何事情”到“做某件事情”的轉變,還涉及到對大腦功能更深層次的理解。
研究人員不僅整合了豐富的生物學知識,還利用課題組通過掃描技術獲得的大腦內部連接情況的實驗數(shù)據(jù),以及神經(jīng)元數(shù)量等詳細信息。
他們運用逆向工程計算方法,以確保模擬出的神經(jīng)元活動模式能夠反映真實的大腦信號。
為發(fā)展類腦 AI 提供新工具
在全球范圍內,虛擬腦孿生項目 EBRAINS 與該課題組構建的數(shù)字孿生腦平臺類似,但前者只在宏觀的腦區(qū)水平實現(xiàn)了全腦模擬。
馮建峰表示:“我們的模型跨越了宏觀、介觀和微觀世界,實現(xiàn)了模擬包括神經(jīng)元之間的精細連接在內的大腦復雜結構,并達到了神經(jīng)元水平。”
數(shù)字孿生腦平臺有望在以下三個領域發(fā)揮重要作用,具體來說:
第一,作為醫(yī)學平臺用于模擬各種復雜的腦疾病,如腦腫瘤、腦卒中、抑郁癥、精神分裂癥、老年癡呆癥等,從而幫助研究人員深入理解相關疾病的發(fā)病機制,并為治療方法的開發(fā)提供新思路。
馮建峰指出,通過數(shù)字孿生腦模擬患者的大腦活動,來預測腦腫瘤的生長速度,可為手術或干預的最佳時機的選擇提供依據(jù)。
據(jù)悉,目前研究人員基于數(shù)字孿生腦技術,已在 6 名抑郁癥患者的腦組織上進行試驗。通過對比模擬結果與實際大腦中的信號,在抑郁癥患者的腦組織中模擬信號的準確性能達到 90% 以上。
第二,作為生物平臺,對斑馬魚(約 10 萬個神經(jīng)元)、小鼠(約 7000 萬個神經(jīng)元)、猴子(超過 60 億個神經(jīng)元)的大腦進行模擬,從而替代部分真實的生物實驗,減少對動物的傷害,有望用于藥物研發(fā)等生物科學領域。
例如,在研究中為模擬大腦的內感受回路,驗證靜息狀態(tài)活動反映內部身體狀態(tài)的假設。研究人員發(fā)現(xiàn),去除從初級視覺皮層到下游視覺通路的連接會顯著降低模型與生物大腦在海馬體的相似性,而對整個大腦的影響較小。
第三,作為通用人工智能平臺,為開發(fā)類腦 AI 系統(tǒng)提供重要參考。
AI 的發(fā)展在很大程度上受人腦結構和功能研究的啟發(fā)。通過模仿大腦的工作原理,AI 技術在許多方面取得了顯著的進步,例如神經(jīng)網(wǎng)絡的設計、深度學習算法的開發(fā)以及自然語言處理等領域。
實現(xiàn)通用人工智能是人類未來的目標之一,如果能夠精確地模擬人腦處理信息的方式,有望通過揭示其背后的機制,指導人們加速發(fā)展通用人工智能。
馮建峰指出,隨著技術的發(fā)展,未來人們或許會擁有三種類型的計算機。
一種是傳統(tǒng)計算機,用于日常計算任務和數(shù)據(jù)處理;另一種是量子計算機,用來幫助加速計算;還有一種是類腦計算機,能夠幫助人類做出更加智能的決策。
終極科學夢想:真正地理解人腦
馮建峰教授本科畢業(yè)于北京大學數(shù)學系,并在該校概率統(tǒng)計系獲得碩士和博士學位。“我是學數(shù)學出身的,后來對生物產(chǎn)生了興趣,三十多年來,我一直用數(shù)學方法研究神經(jīng)科學。”馮建峰表示。
他是在全球頂級 AI 會議神經(jīng)信息處理系統(tǒng)大會(NeurIPS,Conference on Neural Information Processing Systems)上發(fā)表論文的首位中國學者。
1994 年,馮建峰在 NeurIPS 發(fā)表重要論文,對無監(jiān)督學習規(guī)則 Hebbian 學習進行分析,為理解神經(jīng)網(wǎng)絡中的學習規(guī)則提供了重要的理論基礎。
此前,他曾在英國華威大學計算機科學系擔任講席教授。2015 年起,馮建峰擔任復旦大學類腦智能科學與技術研究院院長,目前,他還擔任上海數(shù)學中心首席教授兼任復旦大學大數(shù)據(jù)學院院長。
圖丨馮建峰課題組(來源:該團隊)
數(shù)字孿生腦平臺的開發(fā)是向理解人腦邁出重要的一步,但馮建峰也指出,“我們的模擬速度比人腦正常運行速度慢 70 倍,因此我們在計算模擬方面還有很大的提升空間。”
未來,該課題組希望通過擴大模擬規(guī)模和提高模擬精度,模擬超過人腦神經(jīng)元數(shù)量(例如 1000 億神經(jīng)元),探索超腦中可能出現(xiàn)的各種新現(xiàn)象,以增進對大腦功能和智能行為的理解。
目前,研究人員也在探索利用數(shù)字孿生腦平臺對人腦過去狀態(tài)和未來可能出現(xiàn)的變化進行模擬,從而幫助理解大腦的工作原理和發(fā)育過程。
“現(xiàn)在我們也在探索將數(shù)字孿生腦安裝在機器人上,真正地與環(huán)境發(fā)生作用的效果,以確定在自動駕駛等工業(yè)界應用的可能性。”馮建峰表示。
在該研究中另一個不可忽視的問題是,需要龐大計算資源的支持。因此,他們計劃在下個研究階段與斯蒂芬·B·弗伯(Stephen B. Furber)教授共同探索在神經(jīng)形態(tài)超級計算機 SpiNNaker2 實現(xiàn)人腦模擬的可能性,硬件芯片的使用有望降低計算資源。
展望未來,該團隊希望將數(shù)字孿生腦開放為公共平臺,讓全球的科學家都可以用起來。“腦科學是科學領域中最后的堡壘,而真正地理解人腦是我們的終極目標。”馮建峰說。
參考資料:
1.Lu,W. et al. Imitating and exploring human brain's resting and task-performing states via resembling brain computing: scaling and architecture.National Science Review11: 080(2024). https://doi.org/10.1093/nsr/nwae080
2.https://www.technologyreview.com/2020/11/03/1011616/ai-godfather-geoffrey-hinton-deep-learning-will-do-everything/
排版:劉雅坤、何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.