2025年4月2日,美國(guó)國(guó)立衛(wèi)生研究院(NIH)主任辦公室(OD)在網(wǎng)站上發(fā)布一份《實(shí)施更新:增強(qiáng)NIH受控訪問數(shù)據(jù)的安全措施》聲明文件,稱自2025年4月4日起,NIH將禁止位于中國(guó)、俄羅斯、伊朗等受關(guān)注國(guó)家的機(jī)構(gòu)訪問NIH受控訪問數(shù)據(jù)存儲(chǔ)庫和相關(guān)數(shù)據(jù),涉及dbGaP(基因型與表型數(shù)據(jù)庫)、AnVIL云平臺(tái)、SEER(癌癥監(jiān)測(cè)數(shù)據(jù)庫)數(shù)據(jù)庫和NCBI基因組數(shù)據(jù)共享平臺(tái)等。消息一出,引發(fā)國(guó)內(nèi)外科研界的熱烈關(guān)注和討論。本文在對(duì)該事件進(jìn)行深入分析的基礎(chǔ)上,結(jié)合我國(guó)當(dāng)前科學(xué)數(shù)據(jù)工作的主要問題,討論其對(duì)我國(guó)科學(xué)數(shù)據(jù)管理和共享工作可能產(chǎn)生的影響,并提出意見和建議。
1. 本次NIH數(shù)據(jù)訪問限制政策的深入分析
本次申明提到兩個(gè)依據(jù)文件,一個(gè)是2024年2月28日發(fā)布的第14117條行政命令(Preventing Access to Americans' Bulk Sensitive Personal Data and United States Government-Related Data by Countries of Concern,防止受關(guān)注國(guó)家訪問美國(guó)人的批量敏感個(gè)人數(shù)據(jù)和美國(guó)政府相關(guān)數(shù)據(jù),簡(jiǎn)稱EO 14117)。另外一個(gè)是2025年1月8日才更新完成的28 CFR Part 202(Preventing Access to U.S. Sensitive Personal Data and Government-Related Data by Countries of Concern or Covered Persons,防止相關(guān)國(guó)家/地區(qū)或所涵蓋人員訪問美國(guó)敏感個(gè)人數(shù)據(jù)和政府相關(guān)數(shù)據(jù))。第一個(gè)文件只是對(duì)數(shù)據(jù)類型和行為進(jìn)行了界定,第二個(gè)文件則明確指定了關(guān)注國(guó)家(Country of Concern)清單,具體包括中國(guó)(包括香港和澳門)、古巴、伊朗、朝鮮、俄羅斯和委內(nèi)瑞拉等6個(gè)國(guó)家。關(guān)注國(guó)家的認(rèn)定原則和依據(jù)是:長(zhǎng)期存在或存在嚴(yán)重行為,對(duì)美國(guó)國(guó)家安全或美國(guó)公民的安全構(gòu)成嚴(yán)重危害,并且存在利用政府相關(guān)數(shù)據(jù)或大量美國(guó)敏感個(gè)人數(shù)據(jù),損害美國(guó)國(guó)家安全或美國(guó)公民安全的巨大風(fēng)險(xiǎn)。
要看到的是,本次聲明有一定的范圍界定,并不是所有的科學(xué)數(shù)據(jù),主要聚焦的是“敏感個(gè)人數(shù)據(jù)”。該詞適用《外國(guó)情報(bào)監(jiān)視法》第203(b)(1)和(b)(3)條的規(guī)定,是指涵蓋的個(gè)人識(shí)別信息、精確地理位置數(shù)據(jù)、生物識(shí)別信息、人體組學(xué)數(shù)據(jù)、個(gè)人健康數(shù)據(jù)、個(gè)人財(cái)務(wù)數(shù)據(jù)或其任何組合,具體內(nèi)容如下表所示。
表1 “敏感個(gè)人數(shù)據(jù)”包括的數(shù)據(jù)類型和具體內(nèi)容
盡管本次聲明是數(shù)據(jù)從嚴(yán)管理和共享的原則出發(fā)的。但是,兩份依據(jù)文件中卻都提到在科研方面對(duì)開放合作行為的支持。如第一份文件中提到“美國(guó)繼續(xù)支持跨境的數(shù)據(jù)流動(dòng)開放、全球、互操作、可靠且安全,以及維持美國(guó)與其他國(guó)家之間重要的消費(fèi)者、經(jīng)濟(jì)、科學(xué)和貿(mào)易關(guān)系”,第二份文件中也提到“美國(guó)支持開放科學(xué)數(shù)據(jù)和樣本共享,以通過國(guó)際合作與合作加速研究和開發(fā)”。可見,美國(guó)這次事件并不是完全的“一刀切”,也為國(guó)際科技合作留出了空間。但是前提是“保護(hù)美國(guó)人的敏感個(gè)人健康數(shù)據(jù)和人類基因組數(shù)據(jù)免受威脅”,并在積極“承諾增加公眾獲取納稅人資助科學(xué)研究成果的機(jī)會(huì),促進(jìn)電子健康信息的共享和互操作性,以及患者對(duì)其數(shù)據(jù)的訪問”。
2. 我國(guó)科學(xué)數(shù)據(jù)的問題分析
我國(guó)對(duì)科學(xué)數(shù)據(jù)工作非常重視,在2018年出臺(tái)了國(guó)家層面的《科學(xué)數(shù)據(jù)管理辦法》,提出了“開放為常態(tài)、不開放為例外”的基本原則。在專業(yè)數(shù)據(jù)的管理和保護(hù)方面,也出臺(tái)了《中華人民共和國(guó)人類遺傳資源管理?xiàng)l例》(2019年)、《中華人民共和國(guó)生物安全法》(2020年)和《中華人民共和國(guó)個(gè)人信息保護(hù)法》(2021年)等一系列的法律法規(guī)。但是,我國(guó)科學(xué)數(shù)據(jù)工作仍然存在諸多不足。
(1)科學(xué)數(shù)據(jù)資源本底狀況不清楚,缺乏國(guó)家頂層設(shè)計(jì)和協(xié)調(diào)框架。
我國(guó)雖然在科技部和財(cái)政部的支持下,建成了以20個(gè)國(guó)家科學(xué)數(shù)據(jù)中心和31個(gè)國(guó)家資源庫為重要基礎(chǔ)的科技資源共享平臺(tái)。但是還有很多數(shù)據(jù)零散地分布在各個(gè)部委、科研機(jī)構(gòu)、高校、企業(yè)、公益機(jī)構(gòu)、期刊出版單位建立的大大小小平臺(tái)中,缺乏國(guó)家層面跨部門之間的數(shù)據(jù)統(tǒng)籌協(xié)同交互機(jī)制。通過表1的歐盟數(shù)據(jù)門戶、美國(guó)政府?dāng)?shù)據(jù)門戶和中國(guó)科技資源共享網(wǎng)的數(shù)據(jù)共享情況可以看出,歐美可以非常清楚地從行業(yè)分類和政府部門的角度對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和盤點(diǎn),歐盟數(shù)據(jù)門戶甚至將高質(zhì)量數(shù)據(jù)集等特色數(shù)據(jù)產(chǎn)品也做了集成。而我國(guó)的科學(xué)數(shù)據(jù)和政府?dāng)?shù)據(jù)則由于缺乏國(guó)家統(tǒng)一匯繳和管理平臺(tái)(雖然已經(jīng)大部分建成了省市級(jí)平臺(tái),但仍然缺乏國(guó)家統(tǒng)一的數(shù)據(jù)平臺(tái)),無法進(jìn)行全面的統(tǒng)計(jì)。這對(duì)于國(guó)家數(shù)據(jù)資產(chǎn)的盤點(diǎn)、管理和調(diào)度都極為不利的。另外,從下表的數(shù)據(jù)統(tǒng)計(jì)來看,歐美則是社會(huì)公共領(lǐng)域和自然環(huán)境類的數(shù)據(jù)居多。而我國(guó)的生物、臨床和人口健康數(shù)據(jù)的共享數(shù)據(jù)占比非常大,這也正是NIH數(shù)據(jù)事件的焦點(diǎn),如果不加限制即可訪問和使用這些數(shù)據(jù)則會(huì)有較大的風(fēng)險(xiǎn),需要引起重視。
表2 歐洲和美國(guó)政府?dāng)?shù)據(jù)和中國(guó)科技資源數(shù)據(jù)統(tǒng)計(jì)表
注:歐洲數(shù)據(jù)門戶(European data,網(wǎng)址:https://data.europa.eu/en)匯總了35個(gè)歐洲國(guó)家199個(gè)數(shù)據(jù)目錄的1,874,254條數(shù)據(jù)集。美國(guó)政府?dāng)?shù)據(jù)(網(wǎng)址:https://data.gov/)匯總了美國(guó)政府各大部門的307,366個(gè)公共數(shù)據(jù)集。中國(guó)科技資源共享網(wǎng)是由國(guó)家科技基礎(chǔ)條件平臺(tái)中心主辦的綜合性門戶網(wǎng)站(網(wǎng)址:https://www.escience.org.cn/),包括20家國(guó)家科學(xué)數(shù)據(jù)中心和31家國(guó)家生物種質(zhì)與實(shí)驗(yàn)材料資源庫,共計(jì)4,263,891個(gè)資源目錄。
(2)中國(guó)科學(xué)數(shù)據(jù)外流現(xiàn)象非常嚴(yán)重,個(gè)中原因復(fù)雜多樣。
除了存繳在國(guó)內(nèi)各大數(shù)據(jù)平臺(tái)之外,我國(guó)的科學(xué)數(shù)據(jù)還大量地流失在國(guó)外的數(shù)據(jù)平臺(tái)中。從Dimensions數(shù)據(jù)庫中可以檢索到70.2萬條中國(guó)學(xué)者發(fā)布的數(shù)據(jù)集(僅次于美國(guó)的85.3萬條)。對(duì)這些數(shù)據(jù)進(jìn)行不同維度的統(tǒng)計(jì)分析,從圖1的學(xué)科分類和資助機(jī)構(gòu)的熱力統(tǒng)計(jì)圖來看,具有明顯的學(xué)科特征,生物、醫(yī)學(xué)、臨床、健康和化學(xué)領(lǐng)域以國(guó)內(nèi)資助為主,而物理和數(shù)學(xué)領(lǐng)域則與美國(guó)、德國(guó)、英國(guó)和日本等國(guó)有重要的合作關(guān)系。
圖1 中國(guó)學(xué)者在國(guó)際上發(fā)表科學(xué)數(shù)據(jù)的學(xué)科分類和資助基金統(tǒng)計(jì)表
(數(shù)據(jù)來自Dimensions數(shù)據(jù)庫,2025年4月9日)
另外一個(gè)令人擔(dān)憂的情況是,這些能夠在國(guó)際上檢索、發(fā)現(xiàn)和收錄的科學(xué)數(shù)據(jù)相對(duì)來說都是質(zhì)量比較高的數(shù)據(jù)。而從數(shù)據(jù)所在TOP 10倉儲(chǔ)平臺(tái)來看(表2),沒有一家來自中國(guó)國(guó)內(nèi)。盡管從表1的中國(guó)科技資源共享網(wǎng)的數(shù)據(jù)來看,我國(guó)實(shí)際的數(shù)據(jù)資源遠(yuǎn)不止這個(gè)情況。但是國(guó)內(nèi)的數(shù)據(jù)倉儲(chǔ)為什么被統(tǒng)計(jì)進(jìn)來?是國(guó)內(nèi)平臺(tái)自己不積極主動(dòng)和國(guó)際接軌?還是不知道其中的操作流程和規(guī)范?亦或是其他原因,就不得而知了。這種情況如果依然不引起重視,中國(guó)的科學(xué)數(shù)據(jù)外流現(xiàn)象依然會(huì)持續(xù)。
表3 中國(guó)學(xué)者發(fā)表科學(xué)數(shù)據(jù)的TOP 10數(shù)據(jù)倉儲(chǔ)平臺(tái)
(3)科學(xué)數(shù)據(jù)的開放生態(tài)系統(tǒng)建設(shè)依然任重道遠(yuǎn)。
科學(xué)數(shù)據(jù)相關(guān)工作包括政策、技術(shù)、軟硬件、代碼、標(biāo)準(zhǔn)、人才、質(zhì)量控制、出版、共享重用、傳播推廣等方面,涉及科研人員、科研機(jī)構(gòu)、學(xué)術(shù)期刊、出版社、學(xué)術(shù)組織等諸多學(xué)術(shù)共同體,是一個(gè)復(fù)雜的系統(tǒng)性工程。我國(guó)一方面缺乏深入系統(tǒng)的理論研究,未能形成類似NIST(美國(guó)國(guó)家標(biāo)準(zhǔn)和技術(shù)研究所)提出的“科學(xué)數(shù)據(jù)框架(RDaF)”的理論體系(圖2)。該體系幾乎涉及科學(xué)數(shù)據(jù)工作所有方方面面,是一個(gè)集大成的框架,同樣也適合指導(dǎo)我國(guó)的科學(xué)數(shù)據(jù)研究和應(yīng)用工作。但是目前來看,我國(guó)的科學(xué)數(shù)據(jù)理論研究要遠(yuǎn)遠(yuǎn)低于這個(gè)框架設(shè)計(jì)和關(guān)注的內(nèi)容。
圖2 NIST(美國(guó)國(guó)家標(biāo)準(zhǔn)和技術(shù)研究所)提出的“科學(xué)數(shù)據(jù)框架(RDaF)”的理論體系
另一方面是缺乏對(duì)實(shí)踐問題的總結(jié)和方案應(yīng)對(duì),特別是需要不同“圈子”的跨界和融合。我國(guó)在數(shù)據(jù)開放生態(tài)系統(tǒng)方面存在問題具體包括:數(shù)據(jù)出版發(fā)布和文獻(xiàn)中的數(shù)據(jù)引用并沒有建立有效的機(jī)器可讀關(guān)聯(lián)機(jī)制,導(dǎo)致數(shù)據(jù)的發(fā)現(xiàn)、獲取、重用和評(píng)估都非常困難。數(shù)據(jù)貢獻(xiàn)沒有和績(jī)效評(píng)估和職稱晉升結(jié)合起來,導(dǎo)致科研人員主動(dòng)融入數(shù)據(jù)共享的積極性并不高。科技期刊缺乏對(duì)數(shù)據(jù)匯繳和共享的引導(dǎo)和投稿政策要求,導(dǎo)致科學(xué)數(shù)據(jù)不能順利匯繳或者白白流失到國(guó)外。缺乏專業(yè)和多維度的標(biāo)引,導(dǎo)致不能很好地作為專業(yè)“語料庫”服務(wù)于各類人工智能或大語言模型的應(yīng)用場(chǎng)景。缺乏對(duì)數(shù)據(jù)的組織和深加工,不能為開放科學(xué)、數(shù)字公共產(chǎn)品和聯(lián)合國(guó)可持續(xù)發(fā)展目標(biāo)(SDGs)等國(guó)際行動(dòng)計(jì)劃提供有力支撐。敏感數(shù)據(jù)(如基因、地理信息)的脫敏技術(shù)和分級(jí)分類保護(hù)機(jī)制尚不完善或者不明確或者怕?lián)?zé)任,導(dǎo)致有的數(shù)據(jù)直接就不對(duì)外共享。缺乏有效的全局性DMP(數(shù)據(jù)管理計(jì)劃)設(shè)計(jì)和執(zhí)行,導(dǎo)致管理工作顧此失彼。“科學(xué)數(shù)據(jù)圈”和“開源軟件圈”、“教育課程圈”、“論文出版圈”等圈子沒有很好地形成良好的互補(bǔ)和互動(dòng)。
(4)中國(guó)科學(xué)數(shù)據(jù)總體上缺乏國(guó)際話語權(quán),缺乏具有國(guó)際影響力的專業(yè)數(shù)據(jù)平臺(tái)和數(shù)據(jù)期刊。
在兩個(gè)國(guó)際知名的數(shù)據(jù)倉儲(chǔ)編目系統(tǒng)中,re3data上中國(guó)數(shù)據(jù)平臺(tái)有86家(占比2.56%),F(xiàn)AIRSharing收錄中國(guó)的數(shù)據(jù)平臺(tái)有130家(占比5.58%)。這些數(shù)據(jù)其實(shí)并不是中國(guó)的實(shí)際數(shù)據(jù)倉儲(chǔ)情況。造成這種情況主要包括:一是沒有加入相關(guān)國(guó)際組織,導(dǎo)致在國(guó)際數(shù)據(jù)標(biāo)準(zhǔn)制定和重要數(shù)據(jù)庫的建設(shè)發(fā)展中參與度有限。二是雖然加入了國(guó)際組織,但是由于個(gè)人或者組織機(jī)構(gòu)的原因,沒有明確的工作規(guī)劃和要求,導(dǎo)致沒有發(fā)揮相應(yīng)的國(guó)際帶動(dòng)作用。三是可能壓根就不知道有哪些國(guó)際組織可以發(fā)揮作用,需要有人指導(dǎo)或者帶領(lǐng)進(jìn)入,熟悉相關(guān)流程和規(guī)則。如在上述數(shù)據(jù)倉儲(chǔ)編目系統(tǒng)中,國(guó)內(nèi)很多數(shù)據(jù)平臺(tái)缺乏國(guó)際合作意識(shí),并沒有主動(dòng)去錄入、維護(hù)和宣傳,導(dǎo)致國(guó)內(nèi)數(shù)據(jù)平臺(tái)不為國(guó)際所知。目前,國(guó)家也缺乏相關(guān)政策引導(dǎo)、鼓勵(lì)和支持科研人員在國(guó)際組織中積極發(fā)揮作用。在國(guó)際組織中地位或話語權(quán)的缺失弱化,也會(huì)進(jìn)一步削弱中國(guó)在區(qū)域事務(wù)中(亞洲或者一帶一路地區(qū))的影響力。
3. 對(duì)我國(guó)科學(xué)數(shù)據(jù)工作的影響
(1)最直接影響是科學(xué)數(shù)據(jù)獲取受限,合作項(xiàng)目受阻或停止。
NIH的受控?cái)?shù)據(jù)庫(如SEER、dbGaP、TCGA、ClinVar等)存儲(chǔ)了大量人類基因組、癌癥研究、罕見病等關(guān)鍵數(shù)據(jù),中國(guó)科研人員將無法直接訪問,影響精準(zhǔn)醫(yī)學(xué)、遺傳學(xué)等領(lǐng)域的研究進(jìn)展。如中美聯(lián)合癌癥研究、傳染病基因組分析等依賴NIH數(shù)據(jù)的國(guó)際合作項(xiàng)目可能會(huì)停止。我國(guó)的數(shù)據(jù)和成果無法及時(shí)更新到這些數(shù)據(jù)庫中來,影響與其他國(guó)家的科研合作。我國(guó)與不同國(guó)家的國(guó)際合作影響也可以從合作論文中得到印證。下圖3是來自Web of Science核心合集數(shù)據(jù)庫與中國(guó)合作最多的5個(gè)國(guó)家這20年的合作論文情況。可以看出,中美合作從2019年達(dá)到頂峰之后,就開始逐年下降。但是,中國(guó)和英國(guó)、澳大利亞、加拿大以及日本的合作情況卻是在逐年增加的。這也為未來我國(guó)開展中美以外的國(guó)際合作奠定了良好基礎(chǔ)。
圖3 中國(guó)合作最多的5個(gè)國(guó)家20年來的論文統(tǒng)計(jì)情況(來自web of Science分析數(shù)據(jù))
(2)研究效率下降和科研成本增加。
國(guó)內(nèi)研究者或者藥企需轉(zhuǎn)向美國(guó)以外的其他國(guó)際數(shù)據(jù)或者本土數(shù)據(jù)庫,無論哪種方式都會(huì)導(dǎo)致時(shí)間和經(jīng)濟(jì)成本的增加,同時(shí)還要考慮數(shù)據(jù)的質(zhì)量和合法合規(guī)性。如國(guó)內(nèi)一些醫(yī)院擁有自己的小樣本生物數(shù)據(jù)庫,但沒有一個(gè)共享的機(jī)制,再加上有數(shù)據(jù)安全風(fēng)險(xiǎn)責(zé)任和數(shù)據(jù)利益,我國(guó)迄今也沒有建立諸如腫瘤生物樣本的數(shù)據(jù)平臺(tái)。
(3)推動(dòng)本地化同類數(shù)據(jù)庫的建設(shè)和發(fā)展。
盡管我國(guó)已建立國(guó)家基因庫(CNGBdb)、國(guó)家基因組科學(xué)數(shù)據(jù)中心(NGDC)等平臺(tái),但數(shù)據(jù)規(guī)模、標(biāo)準(zhǔn)化程度與國(guó)際領(lǐng)先數(shù)據(jù)庫仍有差距。我國(guó)其實(shí)有大量類似的人口健康數(shù)據(jù),但是零散地分布在各類醫(yī)院和研究機(jī)構(gòu)中,缺乏統(tǒng)一共享機(jī)制,此次事件可能會(huì)促使政府加大力度推動(dòng)該類數(shù)據(jù)共享利用。
(4)重構(gòu)我國(guó)的數(shù)據(jù)共享文化和貢獻(xiàn)機(jī)制。
此次事件表明,國(guó)際科學(xué)數(shù)據(jù)共享正受政治因素干擾,數(shù)據(jù)主權(quán)成為大國(guó)博弈和保護(hù)人種隱私的工具。我國(guó)如果長(zhǎng)期依賴國(guó)外數(shù)據(jù)庫,可能面臨更廣泛的“數(shù)據(jù)斷供”風(fēng)險(xiǎn)。在這種背景下,我國(guó)科研人員、機(jī)構(gòu)和政府都需重新評(píng)估數(shù)據(jù)存繳與共享策略和文化,激勵(lì)對(duì)數(shù)據(jù)所做的各類貢獻(xiàn)。政府要從頂層框架上,跨部門打通數(shù)據(jù)的交互流通障礙,加快構(gòu)建自主可控的國(guó)家級(jí)科學(xué)數(shù)據(jù)平臺(tái),推動(dòng)數(shù)據(jù)資源本地化存儲(chǔ)與利用。
4. 對(duì)我國(guó)科學(xué)數(shù)據(jù)工作的建議
(1)加強(qiáng)國(guó)家層面的頂層框架設(shè)計(jì),加速本土數(shù)據(jù)庫建設(shè)與融合,提升數(shù)據(jù)自主性。
在中國(guó)科技資源共享網(wǎng)等現(xiàn)有科學(xué)數(shù)據(jù)體系的基礎(chǔ)上,加強(qiáng)建立跨部門之間的數(shù)據(jù)協(xié)同機(jī)制,吸納更多的跨部門數(shù)據(jù)資源。加強(qiáng)中國(guó)科學(xué)數(shù)據(jù)的國(guó)際回流計(jì)劃,讓更多的中國(guó)數(shù)據(jù)在本土產(chǎn)生、本土存繳和本土再利用,同時(shí)避免“數(shù)據(jù)孤島”現(xiàn)象。積極融入國(guó)家數(shù)據(jù)局的整體設(shè)計(jì)框架中,也為數(shù)字經(jīng)濟(jì)、數(shù)字中國(guó)、AI4Science科研范式和“國(guó)家級(jí)人工智能訓(xùn)練場(chǎng)”等核心基礎(chǔ)設(shè)施的建設(shè)提供有力支撐。
(2)加強(qiáng)戰(zhàn)略和理論問題研究,加強(qiáng)政策與法律的引導(dǎo)和支持。
對(duì)社會(huì)主義制度下的科學(xué)數(shù)據(jù)問題進(jìn)行深入的理論研究,特別是數(shù)據(jù)要素和新質(zhì)生產(chǎn)力方面的研究。制定相關(guān)法律法規(guī),明確數(shù)據(jù)所有權(quán)、使用權(quán)與共享規(guī)則。設(shè)立專項(xiàng)基金,支持?jǐn)?shù)據(jù)平臺(tái)建設(shè)與關(guān)鍵技術(shù)研發(fā)。推動(dòng)建立多邊區(qū)域數(shù)據(jù)共享框架,減少地緣政治對(duì)科研合作的影響。建立科研數(shù)據(jù)共享激勵(lì)機(jī)制,將數(shù)據(jù)貢獻(xiàn)納入科研考核,打破部門與機(jī)構(gòu)間的壁壘。鼓勵(lì)公眾參與,豐富數(shù)據(jù)來源,增加數(shù)據(jù)產(chǎn)品類型。
(3)推動(dòng)數(shù)據(jù)標(biāo)準(zhǔn)化與共享文化,加強(qiáng)科學(xué)數(shù)據(jù)的開放社區(qū)建設(shè)。
制定統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和原則,確保與國(guó)際接軌,如FAIR原則(可查找、可訪問、可互操作、可重用)和CARE原則(集體利益、控制權(quán)、責(zé)任、倫理)。整合科研機(jī)構(gòu)、企業(yè)、學(xué)校與公眾資源,形成數(shù)據(jù)采集、存儲(chǔ)、分析和應(yīng)用的開放生態(tài)鏈,積極融入開放科學(xué)社區(qū)建設(shè)。加強(qiáng)和推動(dòng)科學(xué)數(shù)據(jù)與科技文獻(xiàn)、軟件代碼、大語言模型等科技資源之間的關(guān)聯(lián)和交互,加強(qiáng)數(shù)據(jù)應(yīng)用服務(wù)和影響力的評(píng)估,加強(qiáng)學(xué)術(shù)期刊和數(shù)據(jù)存繳平臺(tái)的聯(lián)動(dòng)政策發(fā)布和指導(dǎo),建設(shè)和完善整個(gè)社區(qū)的生態(tài)建設(shè)和生態(tài)效應(yīng)。
(4)優(yōu)化數(shù)據(jù)安全與合規(guī)管理,加強(qiáng)對(duì)人才的培養(yǎng)和培訓(xùn)。
采用區(qū)塊鏈、加密技術(shù)等手段,保障數(shù)據(jù)安全與隱私。完善數(shù)據(jù)分級(jí)保護(hù)制度,區(qū)分公開數(shù)據(jù)與敏感數(shù)據(jù)(如人類遺傳信息、精確地理位置信息等),確保安全共享。支持科研人員參與國(guó)際學(xué)術(shù)會(huì)議、合作項(xiàng)目和國(guó)際組織任職,提升國(guó)際視野與協(xié)作能力,傳播中國(guó)的數(shù)據(jù)共享政策方案和實(shí)踐案例。加強(qiáng)科研人員數(shù)據(jù)合規(guī)培訓(xùn),適應(yīng)國(guó)際數(shù)據(jù)政策變化,避免項(xiàng)目因合規(guī)問題受阻。
(5)加強(qiáng)國(guó)際合作,降低對(duì)單一數(shù)據(jù)源的依賴。
積極與歐盟、亞洲等其他國(guó)家和地區(qū)的科研機(jī)構(gòu)開展合作,建立數(shù)據(jù)共享機(jī)制與科研項(xiàng)目合作平臺(tái),在開放中謀發(fā)展,通過多邊合作降低對(duì)特定國(guó)家數(shù)據(jù)資源的依賴,推動(dòng)科研工作的持續(xù)開展。推動(dòng)亞洲區(qū)域及“一帶一路”科學(xué)數(shù)據(jù)共享計(jì)劃,引領(lǐng)和倡導(dǎo)新型國(guó)際科技合作關(guān)系和科學(xué)計(jì)劃,增強(qiáng)全球數(shù)據(jù)治理話語權(quán)。
許哲平,中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心研究館員。文章觀點(diǎn)不代表主辦機(jī)構(gòu)立場(chǎng)。
◆ ◆ ◆
編輯郵箱:sciencepie@126.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.