人工智能(AI)驅(qū)動的科研新范式通過數(shù)據(jù)、算力、算法的深度耦合深度嵌入科學研究的全過程,引發(fā)科研流程、思考邏輯和組織模式的深刻變革。文章系統(tǒng)總結(jié)了AI驅(qū)動科研新范式的主要特征與形式,提出AI驅(qū)動科研新范式的演化方向由“科研自動化”向“科研模型化”“科研智能化”發(fā)展。AI在科研中的應(yīng)用深度與范圍不斷拓展,并將推動科研組織治理模式等的重大變革。進一步,文章圍繞科研學科特征研究AI應(yīng)用在各領(lǐng)域的適用條件,分析AI驅(qū)動科研新范式在各學科領(lǐng)域的成功案例,在此基礎(chǔ)上解析科研資助機構(gòu)、數(shù)據(jù)庫建設(shè)運營方、科技領(lǐng)軍企業(yè)、科研機構(gòu)與科研人員等主體探索AI驅(qū)動的科研應(yīng)用面臨挑戰(zhàn),并提出相關(guān)啟示與建議。
科研范式是科研人員進行科學觀察、思考和操作的基本過程和邏輯,是根本的科研世界觀和對應(yīng)方法論體系。為了解決關(guān)鍵科研問題,在科研新范式形成過程中,往往涉及過往范式的推進與提升,以及科研路徑的多元耦合。當前,數(shù)據(jù)、算法與算力成為國家基礎(chǔ)戰(zhàn)略資源,美國、英國等發(fā)達國家相繼提出通過建立國家人工智能研究基礎(chǔ)設(shè)施。例如,美國國家科學基金(NSF)會牽頭啟動“國家人工智能研究資源項目”(NAIRR)、英國政府發(fā)布《產(chǎn)業(yè)戰(zhàn)略:人工智能領(lǐng)域行動》(Industrial Strategy:Artificial Intelligence Sector Deal)為人工智能發(fā)展提供算力、數(shù)據(jù)、模型、軟件等關(guān)鍵資源,推動科研方式、生產(chǎn)方式和治理方式深刻變革,提升經(jīng)濟和社會效益。以Chat GPT大語言模型等為代表的革命性技術(shù)應(yīng)用為人工智能(AI)賦能科研提供了新的方法和工具。2022年8月,我國科學技術(shù)部等6部門聯(lián)合印發(fā)《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展的指導(dǎo)意見》,將圍繞高水平科研活動打造重大場景列為需要著力打造的AI重大場景之一。在此背景下,將科學研究與AI相結(jié)合、把握AI驅(qū)動的科研新范式的發(fā)展規(guī)律、探索科研范式轉(zhuǎn)型路徑是我國面向科技強國建設(shè),搶抓未來科技創(chuàng)新方向、形成國際科技競爭優(yōu)勢的重要抓手。
科研范式經(jīng)歷了從“經(jīng)驗科學”“理論科學”“計算科學”向“數(shù)據(jù)密集型科學”的演化,目前正在向“第五范式:人工智能+科學”發(fā)展。第一范式:經(jīng)驗科學以伽利略的物理學、動力學為代表,是通過描述記錄自然現(xiàn)象、基于經(jīng)驗進行歸納的實用性科學。隨著科研深入發(fā)展,經(jīng)驗科學由于受實驗條件限制逐漸向理論科學范式演化。第二范式:理論科學以牛頓力學和相對論為典型代表,在自然現(xiàn)象的基礎(chǔ)上進行了抽象簡化,并通過構(gòu)建數(shù)學模型進行歸納總結(jié)。第三范式:計算科學通過電子計算機對科學實驗進行模擬仿真,如模擬核試驗、天氣預(yù)報等。第四范式:隨著數(shù)據(jù)累積和運算量不斷增加、計算設(shè)施不斷升級迭代,由傳統(tǒng)的假設(shè)驅(qū)動逐漸轉(zhuǎn)向基于科學數(shù)據(jù)驅(qū)動的研究范式。“第五范式”:隨著AI模型的準確性與預(yù)測能力獲得革命性突破,科研范式進一步向通用模型驅(qū)動演化。“人工智能+科學”定位于依托海量大數(shù)據(jù)與大算力進行通用AI大模型訓(xùn)練與優(yōu)化,發(fā)揮其在精度、效率、可遷移性、涌現(xiàn)性等方面的優(yōu)勢,進行多學科領(lǐng)域的多元化科研應(yīng)用,對于科研組織模式產(chǎn)生了重大影響。本文首先探討AI驅(qū)動的科研新范式的主要特征與演化方向,進一步探究科研學科特征對AI應(yīng)用的要求,通過對AI驅(qū)動科研新范式的成功案例進行深入剖析,提出我國推動AI在科研應(yīng)用的相關(guān)啟示與建議。
01 人工智能驅(qū)動科研新范式的主要特征
科研范式是特定歷史時期科學共同體進行科學研究的方式,與科技創(chuàng)新的內(nèi)在規(guī)律要求相適應(yīng)。當前,AI驅(qū)動的科研新范式正在形成并且迅速發(fā)展,2016年,以蒙特卡洛樹搜索算法為核心的Alpha Go在圍棋上首次超越人類并取得一系列的突破性勝利之后,基因組學和物理學等領(lǐng)域的科學團隊開始把深度神經(jīng)網(wǎng)絡(luò)和機器學習運用到相關(guān)研究當中。例如,美國芝加哥大學的團隊開始嘗試用深度神經(jīng)網(wǎng)絡(luò)預(yù)測蛋白質(zhì)三維結(jié)構(gòu),日本東京大學與IBM公司合作建立醫(yī)學診療的大數(shù)據(jù)神經(jīng)網(wǎng)絡(luò)用于臨床研究。此后,AI的應(yīng)用在學界的影響不斷攀升。2020年,Alpha Fold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測大賽中達到人類的預(yù)測觀察水平。與此同時,我國也在積極部署與推動AI技術(shù)的突破與科研應(yīng)用,在2017年啟動“新一代人工智能重大科技項目”,布局重點領(lǐng)域的相關(guān)研究。2018年,鄂維南院士提出“AI for Science”概念,強調(diào)利用AI解決科研實際問題。2022年10月,中國科學技術(shù)大學建立數(shù)據(jù)驅(qū)動的AI化學家機器人“小來”。目前,AI驅(qū)動科研范式變革的主要特征體現(xiàn)在嵌入科研全流程、推動科研設(shè)施升級、重構(gòu)科研人員與儀器設(shè)備定位及角色分工、促進科研組織治理模式變革4個部分。
1.1 人工智能深入嵌入研究問題形成、實驗設(shè)計、實驗操作、數(shù)據(jù)分析等科研全過程
科學研究包括研究問題形成、實驗設(shè)計、實驗操作、數(shù)據(jù)分析等主要環(huán)節(jié)。AI驅(qū)動的科研范式通過對海量數(shù)據(jù)的收集與處理并進行智能模型訓(xùn)練,賦能科研多場景,嵌入科研全過程。例如,通過深層神經(jīng)網(wǎng)絡(luò)計算與推導(dǎo),模擬實驗設(shè)計并自主生成研究問題;智能化大科學裝置進行高精度高強度的實驗操作并能夠?qū)崿F(xiàn)一定程度的自主決策等。相比之前幾代科研范式的升級,“人工智能+科學”范式可以更直觀、更徹底、更全面地作為科研突破的“加速器”與“倍增器”。在微軟公司官網(wǎng)的創(chuàng)新博客中,微軟全球技術(shù)院士、微軟研究院科學智能中心負責人Chris Bishop認為,AI深度學習可能會極大地提高人類在差異巨大的空間和時間尺度上對自然現(xiàn)象進行建模和預(yù)測的能力,并將這一能力視為科學新范式出現(xiàn)的曙光。
1.2 人工智能推動科研設(shè)施升級
AI驅(qū)動的科研范式轉(zhuǎn)變需要大型數(shù)據(jù)庫、大型AI基礎(chǔ)模型、大科學裝置、智能設(shè)備的支撐,其中智能軟硬件的協(xié)同和人機協(xié)同發(fā)揮關(guān)鍵作用。算法和算力的強耦合,是AI驅(qū)動科研的必要條件;在以AI計算中心為代表的計算基礎(chǔ)設(shè)施支撐下,極大地提升了AI大模型的訓(xùn)練效率。BP算法、分層訓(xùn)練等新的算法模型和訓(xùn)練模型,以及去中心化自治組織(DAO)等新的組織和運營方式逐步被引入并推廣至大范圍使用。
1.3 人工智能重構(gòu)科研人員與儀器設(shè)備定位及角色分工
基于AI算法的大模型訓(xùn)練將推動科研儀器設(shè)備自主推理決策能力不斷增強,在人機交互中,科研人員不斷重新定位人機分工模式。在科研儀器智能化升級迭代的過程中,AI相關(guān)設(shè)備通過實驗過程的自動控制與自主決策可以大幅減少原來需要科研人員大量精力與時間的重復(fù)性實驗工作。在此基礎(chǔ)上,科學家專注發(fā)揮其前沿研究思想的想象力和創(chuàng)造力,使其能夠更有效地實現(xiàn)目標。例如,在生物信息學等領(lǐng)域,通過機器學習算法分析海量基因數(shù)據(jù),可以高效進行基因模式和關(guān)系識別以預(yù)測特定基因的功能。這極大地降低了以往科研人員進行海量數(shù)據(jù)分析計算的工作量,使其能夠?qū)W⒂诨蜓芯恐械男聞?chuàng)意的思考與實踐。
1.4 人工智能推動科研組織治理模式變革
AI與各學科不斷交叉融合,需要科研組織治理模式發(fā)生相應(yīng)變革以適應(yīng)交叉學科的發(fā)展。大量科學家團隊基于AI通用基礎(chǔ)模型開發(fā)平臺進行科學研究,形成“大平臺、小用戶”組織模式,成為AI驅(qū)動的科研組織模式變革的重要方向。在此過程中,科研基礎(chǔ)設(shè)施更加注重開放和共享,科研人員跨學科、跨部門的開放協(xié)作,兼具AI及各科研領(lǐng)域知識和技術(shù)積累的復(fù)合型人才成為新型組織模式的關(guān)鍵支撐力量。人工智能在科研中的深度應(yīng)用將推動數(shù)據(jù)與代碼共享、文檔信息交互、科研流程開放及合作研發(fā),以虛擬實驗室、開源平臺等為代表的“大平臺、小用戶”新型科研組織模式將持續(xù)發(fā)展。
02 人工智能驅(qū)動科研新范式的演化方向
AI驅(qū)動科研新范式的演化方向由“科研自動化”向“科研模型化”“科研智能化”發(fā)展,其在科研中應(yīng)用的深度與范圍不斷拓展(圖1)。
圖1 人工智能驅(qū)動科研新范式的演化方向
2.1 科研自動化——實驗過程模仿復(fù)制
隨著科研任務(wù)量的不斷提升,高重復(fù)性、高精度的科研過程往往需要實驗人員花費大量的時間,在重復(fù)進行實驗的同時提升實驗精度。科研自動化能夠通過對實驗操作過程的模仿復(fù)制實現(xiàn)對科研人員一定程度的替代,解決高強度、高重復(fù)、高頻率、高精度的科學實驗與試錯問題。目前,根據(jù)自動化的程度和規(guī)模,實驗室自動化大致可分為單模塊形式自動化、工作站形式自動化、流水線形式自動化、機器人形式自動化4種類型。實驗室自動化程序可根據(jù)預(yù)定好的模型和程序輔助科研人員執(zhí)行相應(yīng)科研任務(wù),讓科研人員集中精力投入創(chuàng)造性的科研工作中。在實驗操作中,科研自動化適合進行高危高頻高強度實驗,可實現(xiàn)在高溫、劇毒、黑暗等惡劣實驗環(huán)境下對人力的替代。在高精度實驗試劑的操作中能夠提升克級、毫克級高通量試劑篩選中的效率與準確性。科研自動化能夠最大程度地降低科學家或?qū)嶒灢僮魅藛T身體疲憊或情緒變化等主觀因素帶來的負面影響。
2.2 科研模型化——大模型探索應(yīng)用
隨著數(shù)據(jù)海量擴張、計算模型升級,實驗所需計算維度呈指數(shù)級增長,解析難度和運算維度不斷增加。通過對AI大模型的探索應(yīng)用,優(yōu)化實驗設(shè)計,使高維計算和高效解析得以在短時間內(nèi)實現(xiàn),實現(xiàn)科研模型化。通過探索并依托特定領(lǐng)域模型訓(xùn)練,AI可以解決高維度科學問題,在短時間內(nèi)推動生物學、物理學等領(lǐng)域的重要突破。已有科研范式往往以第一性原理理論為基礎(chǔ),從最基本的公理、命題或假設(shè)出發(fā),逐步推導(dǎo)、演算出現(xiàn)實問題的一個或多個解決方法。測算化學結(jié)構(gòu)、物化特性再到應(yīng)用實踐,要經(jīng)過無數(shù)次結(jié)構(gòu)、性能,以及應(yīng)用維度的測算,這個過程往往面臨極大的思考能力與計算能力的局限。AI在科研中的應(yīng)用能夠通過高維度的計算和高精準度的自主實驗控制打破原有的科研瓶頸。在生物學領(lǐng)域,生命系統(tǒng)的復(fù)雜性隱藏了背后的原理,AI的應(yīng)用有助于理解生命涌現(xiàn)原理。在物理學領(lǐng)域,AI改變了以往物質(zhì)標定、解析,以及底層圖譜處理的方式。以反應(yīng)氣體測量為例,中國科學院工程熱物理研究所基于AI模型提出等效特征圖譜法(ECSA),通過智能儀器和程序?qū)崿F(xiàn)了對氣體圖譜的精準識別;通過多模態(tài)數(shù)據(jù)輸入輸出,以及多類型算法提升模型的有效性,實現(xiàn)高維度圖譜矩陣的檢測及解析,顛覆領(lǐng)域內(nèi)原有的科研范式。
2.3 科研智能化——大模型深度應(yīng)用
通過建立通用大模型訓(xùn)練平臺并持續(xù)推動模型迭代與優(yōu)化,“人工智能+科學”將實現(xiàn)高復(fù)雜度、高任務(wù)量科研的過程自主決策,推動科研范式的智能化發(fā)展。隨著結(jié)構(gòu)化科研數(shù)據(jù)庫的不斷完善,AI算法與算力的提升將支撐其實現(xiàn)更為復(fù)雜的分析能力與自主決策過程。深度學習、遷移學習、強化學習等算法與模型的不斷改進和發(fā)展,在提升模型適用度的同時降低訓(xùn)練成本;科研數(shù)據(jù)、算法資源庫的優(yōu)化將提升AI計算精度與效率,實現(xiàn)高效高精度求解的復(fù)雜問題。AI的感知智能、認知智能和決策智能在基礎(chǔ)設(shè)施層的提升和模型規(guī)律訓(xùn)練的基礎(chǔ)上不斷完善,從多方面、多角度與科研領(lǐng)域融合,推動實現(xiàn)科研智能化。在處理高任務(wù)量和高復(fù)雜度的科研工作中,通過智能大模型與科研設(shè)備的融合應(yīng)用,促進復(fù)雜研究過程中智能決策能力的持續(xù)提升,實現(xiàn)科研智能化。例如,中國科學技術(shù)大學研發(fā)出覆蓋收集信息、提出假設(shè)、分析處理等科研全流程的智能科研設(shè)備——機器人化學家“小來”(圖2)。“小來”能夠在智能查找并閱讀文獻過程中,將前人的論文、專利等文本通過自然語言形成機器可以“理解”的結(jié)構(gòu)化數(shù)據(jù),并以此為基礎(chǔ)提出科學假說、設(shè)計實驗方案。在實驗配方優(yōu)化過程中,由于缺少通用可預(yù)測物理模型,科研人員需要較長時間才能夠合成合格樣品。然而,通過機器學習驅(qū)動的AI學機器人,可以在沒有物理模型的前提下優(yōu)化離散和連續(xù)目標,并通過2個配方機器人平臺自主完成復(fù)雜的合成程序,在無需人工干預(yù)的情況下執(zhí)行半自動樣品制備和表征。該種由機器學習自動觸發(fā)的實驗可以實現(xiàn)在15個工作日內(nèi)找到符合要求的實驗配方。
圖2 機器化學家“小來”的工作流程
03 科研學科特征對人工智能應(yīng)用的要求
AI驅(qū)動的科研新范式主要在物理學、化學、材料科學、生物學等基礎(chǔ)科學領(lǐng)域,以及生物醫(yī)藥、天體物理、地球科學、能源化學等交叉學科進行應(yīng)用。隨著AI模型的通用性不斷加強,其對于各領(lǐng)域科研過程的嵌入程度持續(xù)加深。其在各學科中的應(yīng)用需要充分考慮學科領(lǐng)域在數(shù)據(jù)獲得積累、模型規(guī)律凝練、多維數(shù)據(jù)計算、實驗過程試錯等多方面面臨的瓶頸問題,并對學科需求與適用條件進行深入分析。
3.1 訓(xùn)練數(shù)據(jù)的可發(fā)現(xiàn)、可獲取、可復(fù)用
AI模型訓(xùn)練過程中,科研領(lǐng)域數(shù)據(jù)需要具備可發(fā)現(xiàn)、可獲取、可復(fù)用等特性以擴大AI模型訓(xùn)練的數(shù)據(jù)規(guī)模,提升數(shù)據(jù)質(zhì)量。海量數(shù)據(jù)的持續(xù)訓(xùn)練有力提升AI模型的通用性和有效性,從而準確把握問題需求與邏輯形成有價值的新發(fā)現(xiàn)。當前,隨著材料、生物、化學等領(lǐng)域的數(shù)據(jù)庫的積累建設(shè)不斷完善,實驗數(shù)據(jù)量呈現(xiàn)數(shù)據(jù)級增長,部分領(lǐng)域甚至實現(xiàn)從GB級別到PB級別的飛躍。例如,生物領(lǐng)域龐大的基因數(shù)據(jù)庫、醫(yī)學領(lǐng)域的診斷數(shù)據(jù)及案例圖像、化學反應(yīng)中數(shù)以萬計的化合物和反應(yīng)結(jié)構(gòu)都為機器學習和訓(xùn)練提供了數(shù)據(jù)支持。
3.2 科學規(guī)律的模型凝練
AI驅(qū)動的科研新范式在“復(fù)雜性高、變量因子多,依靠經(jīng)驗科學、理論科學等以往科學范式難以歸納總結(jié)”的領(lǐng)域具有重要應(yīng)用價值,需要依靠AI模型在海量多維數(shù)據(jù)中找出科學規(guī)律。依托國內(nèi)外已有海量科學數(shù)據(jù)的訓(xùn)練,AI模型能夠通過對相關(guān)領(lǐng)域科學規(guī)律的系統(tǒng)凝練,突破科研人員或團隊個體認知的局限并產(chǎn)生突破性進展。例如,在生物醫(yī)藥領(lǐng)域,利用AI技術(shù)建立虛擬藥物篩選模型,實現(xiàn)更快檢索、更廣覆蓋范圍的化合物篩選及優(yōu)化。在藥物性質(zhì)研究中,利用深度神經(jīng)網(wǎng)絡(luò)算法提取結(jié)構(gòu)特征,提升性質(zhì)預(yù)測的準確度。未來隨著通用AI模型通用性、有效性的增強,其在海量多維數(shù)據(jù)中探尋科學規(guī)律的能力將不斷增強。
3.3 多維數(shù)據(jù)計算
在科學理論發(fā)展到一定程度后,多維數(shù)學計算問題成為研究人員的掣肘。英國理論物理學家、量子力學的奠基者之一狄拉克提出,對物理化學問題做數(shù)學求解的基本規(guī)則已完全清楚,困難在于基本規(guī)則應(yīng)用于真實體系的方程過于復(fù)雜而無法求解。生物學領(lǐng)域也存在同樣的困難,描述生命系統(tǒng)復(fù)雜性的模型內(nèi)部因素關(guān)系極其復(fù)雜,理解生命功能涌現(xiàn)原理面臨的核心難點是維數(shù)災(zāi)難。AI模型為破解科學研究中的多維計算問題提供了有效的路徑。例如,在天體物理學領(lǐng)域,僅僅是可觀測星系的天體樣本數(shù)達到數(shù)十億。運用AI方法進行星系形狀分類和指定天體辨識、天體物理現(xiàn)象的快速自動化建模及仿真圖像的生成,可大幅提升研究效率。
3.4 實驗試錯過程的數(shù)據(jù)模型迭代
在化學、生物制藥等領(lǐng)域,實驗試錯是驗證科研人員直覺的重要路徑,是科研過程中高成本、耗時、費力的環(huán)節(jié)。當前,AI模型推動新物質(zhì)的發(fā)現(xiàn)模式向可預(yù)測、可設(shè)計的方向轉(zhuǎn)變,通過模型預(yù)測逐步替代耗時費力的實驗過程。隨著AI模型的不斷發(fā)展,未來可以在海量物質(zhì)中預(yù)測相關(guān)“成分—結(jié)構(gòu)—工藝—性質(zhì)”之間的關(guān)系,并進一步得到所需物質(zhì),推動相關(guān)領(lǐng)域形成革命性突破。例如,在能源化學領(lǐng)域,AI能夠加速鋰離子電池電解液的設(shè)計開發(fā)與實踐,通過預(yù)測溶劑分子和相應(yīng)電解液的性質(zhì),為選擇合適的電解液提供有效方法。在合成生物學領(lǐng)域,谷歌的AI團隊Deep Mind開發(fā)的Alpha Fold2提出基于深度學習算法可以在原子精度上預(yù)測蛋白質(zhì)結(jié)構(gòu),能夠僅根據(jù)未知蛋白質(zhì)所含氨基酸的DNA或RNA源序列,準確、有效預(yù)測其三維形狀,徹底改變了蛋白質(zhì)折疊的技術(shù)路線。同樣,在我國深圳合成生物研究重大科技基礎(chǔ)設(shè)施中,通過AI學習7輪迭代,將400萬種可能的組合收縮到714種組合,獲得高于30倍的蛋白產(chǎn)量提升。在生物醫(yī)藥領(lǐng)域,基于AI模型進行新藥物在人體內(nèi)代謝分布預(yù)測,可提升新藥物對癌癥細胞的作用與治療效果,并在研究早期階段評估藥物的安全性和有效性。
04 對人工智能驅(qū)動科研范式的未來展望
AI驅(qū)動科研范式以大模型、大數(shù)據(jù)、大算力為支撐,深度嵌入科研全流程,將推動科研組織治理模式發(fā)生重大變革,使得整體科研能力與效率大幅提升。Chat GPT大語言模型能夠基于對海量文獻與資料的訓(xùn)練學習快速掌握科研問題的研究進展,輔助進行代碼編寫、統(tǒng)計分析及論文撰寫等各項工作。然而,目前Chat GPT等生成式AI技術(shù)在科研論文撰寫中仍存在倫理等多方面風險爭議。在科研組織治理模式方面,區(qū)塊鏈智能合約的發(fā)展,以及與AI相結(jié)合的DAO基礎(chǔ)設(shè)施的完善,為分布式自主科學(De Sci)的發(fā)展奠定了基礎(chǔ)。由分布式網(wǎng)絡(luò)構(gòu)建的數(shù)據(jù)收集、模型構(gòu)建和知識生成體系通過更加靈活、聚焦的方式將顯著提高科研效率。
當然,要實現(xiàn)真正的AI科研范式對現(xiàn)有研究范式的替代還有很長的路要走。從技術(shù)層面來看,AI面臨的關(guān)鍵技術(shù)挑戰(zhàn)之一是數(shù)據(jù)的質(zhì)量和數(shù)量。大模型訓(xùn)練需要依靠大量、優(yōu)質(zhì)的數(shù)據(jù),以提升模型的準確性。當前,許多國際化的開源平臺已經(jīng)運行,并以可互相操作的形式支持AI模型的訓(xùn)練。以最典型的基因組學研究為例,國際上已有包括Gene Expression Omnibus (GEO)、Array Express、Protein Data Bank(PDB)等多個開源基因數(shù)據(jù)庫用于訓(xùn)練機器模型,以預(yù)測腫瘤的類型。同時,在數(shù)據(jù)隱私和安全方面,需要對數(shù)據(jù)收集、存儲及處理方式進行加密和脫敏處理。除此之外,實現(xiàn)AI賦能科研,構(gòu)建國際科技競爭新優(yōu)勢,還需要科研資助機構(gòu)、數(shù)據(jù)庫建設(shè)運營方、科技領(lǐng)軍企業(yè)、科研機構(gòu)與科研人員等打破壁壘、合作創(chuàng)新。
(1)加強對“人工智能科研基礎(chǔ)模型與應(yīng)用”方向的部署。
AI驅(qū)動的科研新范式建立需要科研資助部門有層次、分重點地推進“人工智能+學科”的相關(guān)項目,統(tǒng)籌布局和合理分配資源,加強跨學科項目支持力度。建議科研資助機構(gòu)進一步強化對AI原創(chuàng)算法、原型系統(tǒng)等底層技術(shù)建立長期穩(wěn)定支撐機制,培育科研領(lǐng)域原創(chuàng)性AI計算框架。對以生物制藥等為代表的關(guān)鍵領(lǐng)域,打造專用于動態(tài)蛋白結(jié)構(gòu)模擬的超算平臺,布局生物制藥底層算法和原型系統(tǒng),促進相關(guān)軟件的開發(fā)與應(yīng)用。同時,要重視對于科研項目成果的評估和問責機制,特別是在數(shù)據(jù)開源開放、De Sci持續(xù)發(fā)展的背景下,需要進一步評估參與者質(zhì)量、建立網(wǎng)絡(luò)環(huán)境信任、建立適應(yīng)科研新范式的問責機制。
(2)加強人工智能模型訓(xùn)練的科研數(shù)據(jù)庫建設(shè)。
當前,我國用于AI訓(xùn)練的數(shù)據(jù)仍面臨質(zhì)量良莠不齊、依賴國外數(shù)據(jù)庫資源、不同部門/學科之間存在較高數(shù)據(jù)流動壁壘、數(shù)據(jù)標準不統(tǒng)一等問題。同時,各研究機構(gòu)與大學對于科研數(shù)據(jù)庫建設(shè)與運營的激勵力度不足,研究人員缺乏投入數(shù)據(jù)庫建設(shè)相關(guān)工作的動力。亟須建立并優(yōu)化國家級科學計算與應(yīng)用創(chuàng)新平臺、國家級科學大數(shù)據(jù)應(yīng)用服務(wù)環(huán)境、國家級知識服務(wù)平臺,以更快、更好地實現(xiàn)數(shù)據(jù)讀取、篩選、識別等跨平臺、跨學科的數(shù)據(jù)應(yīng)用。進一步提升相關(guān)數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量,在數(shù)據(jù)安全的前提下建立跨平臺的數(shù)據(jù)共享與交換機制,充分發(fā)揮數(shù)據(jù)可溯源、可編程、可感知、可交流和可關(guān)聯(lián)等特性;完善數(shù)據(jù)庫建設(shè)、運營的激勵機制,將科研數(shù)據(jù)庫作為重要研究成果納入人員考評、項目驗收機制。
(3)促進科技領(lǐng)軍企業(yè)運用人工智能提升研發(fā)效能。
近年來,AI開始在生命科學、新藥研發(fā)、發(fā)動機設(shè)計等企業(yè)應(yīng)用研究場景發(fā)揮重要作用。AI大幅提升了工程研發(fā)智能模擬的精準度,通過把復(fù)雜應(yīng)用場景情況納入AI模型降低研發(fā)試錯成本,縮短研發(fā)流程。在此過程中,亟須推動科技領(lǐng)軍企業(yè)向創(chuàng)新鏈前端攀升,推動企業(yè)加強AI領(lǐng)域應(yīng)用模型研發(fā)投入,加強AI軟件應(yīng)用生態(tài)建設(shè)布局,特別是加強探索AI平臺方與領(lǐng)域應(yīng)用方的合作模式。以制藥產(chǎn)業(yè)為例,加強AI制藥公司與傳統(tǒng)藥企的合作,通過傳統(tǒng)藥企為AI制藥公司選定靶點,以及提供小分子化合物庫、基因組學信息、化學、臨床數(shù)據(jù)等信息作為輸入數(shù)據(jù)或訓(xùn)練數(shù)據(jù),AI制藥公司基于模型從大量的輸入數(shù)據(jù)中識別或轉(zhuǎn)化出有應(yīng)用價值的輸出結(jié)果,以優(yōu)化靶點發(fā)現(xiàn)、化合物合成和篩選的精確性與效率。
(4)建立跨學科復(fù)合型人才和管理人才培養(yǎng)體系。
科研機構(gòu)需要加強AI領(lǐng)域與物理學、化學、生物學等領(lǐng)域?qū)<抑g的跨學科合作;高校應(yīng)在國家重大戰(zhàn)略需求的驅(qū)動下,打通學科群鏈條和科技創(chuàng)新鏈條,建立跨學科的人才培養(yǎng)與合作機制,并形成專業(yè)化的支撐團隊。2018年鄂維南院士提出“建立一個交叉學科項目,通過跨學科布局,探索機器學習在各個科學和工程領(lǐng)域的應(yīng)用”,建議加強在AI交叉學科專業(yè)方向的布局,加強基礎(chǔ)學科領(lǐng)域科研人員的跨學科研究能力。同時,培養(yǎng)復(fù)合型管理人才,以為AI平臺的治理提供保障。加強管理人員在AI、區(qū)塊鏈等智能加密新興技術(shù)成果方向的學習與應(yīng)用。
(5)鼓勵科研人員運用人工智能技術(shù)探索科技突破的新路徑。
在AI驅(qū)動的科研新范式背景下,DAO與De Sci等新技術(shù)新模式為科學的發(fā)展提供新的組織方式和科研生態(tài),將改變現(xiàn)有科學體系的結(jié)構(gòu)、規(guī)范、激勵機制。科研人員需要積極學習接納AI帶來的科研新范式,主動學習培養(yǎng)AI思維模式,掌握AI嵌入科學研究的流程,運用AI技術(shù)進行專業(yè)學科前沿技術(shù)探索。在DAO分布式?jīng)Q策技術(shù)特性的基礎(chǔ)上,充分調(diào)動具有共同興趣和愿景的科研人員積極性、激發(fā)研究人員潛力、提高研究人員權(quán)益。例如,通過去中心化交易、協(xié)作平臺發(fā)布科研提案,在相關(guān)DAO組織中爭取更大話語權(quán)。主動探索De Sci在科研資助與知識共享中的應(yīng)用,積極應(yīng)對其發(fā)展早期階段面臨的內(nèi)外部治理困境和挑戰(zhàn)。
本文來源于《中國科學院院刊》2025(02)。余江,中國科學院科技戰(zhàn)略咨詢研究院研究員,中國科學院大學公共政策與管理學院教授、博士生導(dǎo)師。張越,中國科學院科技戰(zhàn)略咨詢研究院副研究員。周易,英國曼徹斯特大學全球發(fā)展研究院。文章觀點不代表主辦機構(gòu)立場。
◆ ◆ ◆
編輯郵箱:sciencepie@126.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.