“這一做法非常 Stupid!不過,從美國政府對華為實施技術限制措施的時候,我們團隊的研究就已經預料到會發展到這一步。”對于美國禁止中國用戶訪問科研數據庫的做法,一名 C9 院校的資深教授告訴 DeepTech。
當地時間 4 月 4 日,由美國國家癌癥研究所(NCI,National Cancer Institute)維護的、全球最大、最權威的公開癌癥數據庫之一 SEER(Surveillance, Epidemiology, and End Results)數據庫,已經禁止中國用戶使用,此前已經注冊過的用戶再也無法登錄。另據悉,很快英國方面的相關數據庫也將禁止中國用戶使用。
圖 | SEER 禁止中國用戶登錄的頁面顯示(來源:資料圖)
SEER 在一封回復給用戶的郵件中表示:“如果您最近失去了對 SEER*Stat 賬戶的訪問權限,并且無法再登錄,請留意最近的政策變化,該變化要求美國國家癌癥研究所刪除對 SEER 數據的訪問權限。目前,我們無法恢復您的賬戶訪問權限。為了支持最近的安全指令,國家衛生研究院正在實施技術更新,以加強安全措施,重點是保護國家衛生研究院受控訪問數據存儲庫(CADRS,Controlled Access Data Repository System)提供的數據。具體而言,自 2025 年 4 月 4 日起,國家衛生研究院將禁止特定國家的研究人員和機構訪問任何涉及國家衛生研究院 CADRS 和相關數據的正在進行中的項目,并將會終止這些項目。這些特定國家包括中國(含香港和澳門)、俄羅斯、伊朗、朝鮮、古巴和委內瑞拉,這符合行政令 14,117 和 28 CFR Part 202 規定的‘防止受關注國家或受關注人員訪問美國敏感個人數據和政府相關數據。’請參見 Guide Notice NOT-OD-25-083 以獲取更多信息。”
圖 | 上述郵件內容的截圖(來源:資料圖)
上述郵件所說的行政命令指的是,2024 年美國政府曾推出一項名為《關于防止關注國家獲取美國公民大量敏感個人數據和美國政府相關數據的行政命令》。這一行政命令禁止或限制包括中國、俄羅斯、伊朗等六個“受關注國家”及相關個人獲取美國人敏感數據的交易。其中,個人健康數據與人類基因組數據是重點受限領域。有些諷刺的是,美國政府還在這一行政命令中強調“美國致力于推動開放、全球、可互操作、可靠和安全的互聯網”。
(來源:資料圖)
那么,此次禁止中國用戶使用的 SEER 數據庫為何如此備受關注?據了解,SEER 數據庫建立于 1973 年,數據范圍覆蓋大約 34.6% 的美國人口,數據內容包含癌癥發病率、患病率、死亡率、治療和生存率等數據。此前,SEER 數據庫每年都會發布新數據,研究人員可以免費申請使用。通過使用 SEER 數據庫的數據,科研人員通常將其用于癌癥流行病學研究、癌癥預后因素分析、醫療政策制定和評估、癌癥生存率趨勢研究等。
一位業內人士告訴 DeepTech:“國內科技人員對于這一限制是有一些心理準備的,知道早晚會有這么一天,只是不知道什么時候會來而已。美國作為‘領頭羊’挑起關稅貿易壁壘之后,又開始在科研合作方面更進一步采取保護主義。以前科研人員還有渠道能夠進行溝通,從當前形勢來看,未來的渠道會越來越少。當前這種限制訪問肯定會影響到美國科研人員與中國科研人員的合作。這也再次說明,科學無國界,但是科學家是有祖國的。”
廣州大學關躍峰教授告訴 DeepTech,本次事件對于醫學數據的對比研究來說,可能會因為數據不足導致研究結論的片面性。國際合作通常要數據共享,在雙方脫鉤的趨勢下,建立合作將越開越難。考慮中國醫學領域研究應用 SEER 的比例很高,預計短期內對醫學研究的沖擊會很大,比如癌癥流行病學研究通常對數據庫非常依賴。但是,中國也已經建設本土數據庫,所以沖擊不是致命的。
浙江湘湖實驗室李果對全球性高影響力數據庫的建設提出了自己的看法,他建議中國應該加快基礎數據庫的建設,在該領域具備足夠的話語權與國際地位。
他說:“作為一名從事基因編輯技術開發與應用研究的科研人員,數據庫就是我們最日常打交道的平臺。沒有數據信息共享,實際具體的科研工作很難開展。2023 年的數據顯示,中國 75% 的癌癥機制研究依賴美國數據庫。原來可以通過生物信息學篩選靶點的研究現在被迫回歸實驗室試錯,濕實驗成本飆升,單課題成本預計增加 2-3 倍。如果這些公共數據庫對我們都實施關停,那我們將不得不去尋找替代數據庫,而使用替代數據庫的研究可能會被質疑‘數據代表性不足’,如僅用中國生物銀行(China Kadoorie Biobank)數據發表的成果,在 SCI 期刊接收率將會下降。無法獲取 GTEx 正常組織表達譜,就會導致腫瘤特異性突變研究難以完成同行評審要求的對照實驗,而這些都會嚴重影響我們的學術產出。”
李果表示,早在自己的學生時代,他就產生了一個疑問:中國為什么沒有自己的具有全球性代表的數據庫?他說:“說到這里就不得不聊聊國內科研圈面臨的建設數據庫具備高成本、低回報率的問題。雖然我們有每年發文量占世界第一的中國科學院,但僅僅以 2024 年的 CNS 三大刊發文數據來看,即便年年攀升占比卻仍然低得可憐。這揭示出我們的原創性工作太少、引領性地位太低。我們現在在軍事、半導體、芯片等領域已經有一席之地,但是在生命科學領域美國關停一個數據庫,就會讓我們的生命科研圈‘傷筋動骨’,這不得不讓我們反思。什么時候我們能有堪比 NCBI 的數據庫?什么時候我們能有比肩 CNS 的期刊?可能我們需要從現在就要做破局者,而不是在經歷這次風波這后還在擔心下一次的到來。”
但是,作為一名 60 后的科研老人,上述 C9 院校資深教授認為所謂的國際合作或許反而能夠得到加強。在本次禁令以后,假如中國學者翻墻使用國外數據庫,那么對于相關論文國外雜志將會不予發表。“但是,國內生物研究做得好的哪個不是和國外有聯系的?”他表示,“所以,一方面確實中國學者的確會變得不太方便,很多本來能夠采集到的數據還得去翻墻獲取;另一方面,可能反而會迫使我們和國外學者開展更加緊密的合作,大家會一起從各個方面繞開這一次所謂的‘非常 Stupid’ 的限制。”
他表示:“就像歐盟一樣,對于咱們國家它也是時不時地跟美國保持同一步調,要制裁這個要制裁那個。但是這次特朗普針對全世界開征關稅之后,法國總統馬克龍反而和中國站在同一立場,而在學術領域這也是同樣的道理。”
同時,據這位 C9 院校資深教授預計這些數據庫后面還有可能會重新開放。他分析稱:“將來咱們也有自己的數據庫,他們賣不出去了不還得再重新開放嗎?”他繼續說道,中國的生物技術和醫藥研究 99% 依然是在追隨歐美的研究。等到中國也發展起來,國外還要反過來追隨中國。“到時他們不開放數據給我們,我們說不定還要像他們當初這樣卡他們的脖子呢。”而談及國內數據庫的現狀,他表示:“這就不能跟你說了,國內的數據庫有它的特點……”
作為一名即將滿六十歲的資深學者,對于發論文的態度已經相對“佛系”。他表示:“將論文發到國外的期刊對我以及我們整個組來說,已經不是特別重要。當然,能發 CNS 還是挺好的,發不了 CNS 在國內的期刊發表,大家一起共同成長也可以。但是,在 CNS 發表論文對于 80 年代出生的那批 40 歲上下的人有著很大影響。因為他們在評各種頭銜的時候,一說起來就會問你,有沒有在 CNS 正刊上發表論文?因此,本次數據庫禁用事件對于他們影響比較大。”
然而,宏觀來看,上述 C9 院校資深教授并不認為美國方面禁用數據庫會帶來過于重大的影響。他指出,在藥物大部分研究以及治療方式的研究方面,很多國內研究都是跟著國外做。所以,美國卡生物數據庫只是一種意識形態上的姿態,實際上沒有太大的用處。“國內有幾家生物技術和醫藥企業有可能會走在國際前列,但是他們還沒有意識到。而到將來這些企業的‘海盜基因’就會暴露出來,到時就不會按所謂的國際法則行事了。所以,美國卡我們數據庫這件事雖然不好,但也不必看得太嚴重。”
與此同時,其指出中國并非沒有這方面的數據庫,只是沒有國外那么全。“我們團隊做了一些調研,發現美國有一兩千號人專門維持數據庫。之前國內沒有太重視這個事,現在國內的已有數據庫要拿出來用也不是不行。只不過就像國產芯片一樣,我們在制程上 7 納米以下可能還有點問題,但是我們使用別的方法也能達到 5 納米的水平。別看這次被卡脖子了,沒準今年下半年咱們自己的某些數據庫就會出來。總之,卡是卡不住的。比如,曾經被美國卡脖子的華為有海思這樣的備胎,一備就是 10 年多甚至 20 年,而我們生物數據庫也有類似的‘備胎’。”
上述 C9 院校資深教授還表示:“其實對咱們最狠的是拜登,他對待中國就像溫水煮青蛙一樣。拜登太陰了,短期內好像沒有看到拜登有什么明顯動作,但是從整個長期來看拜登針對咱們的措施比特朗普更強。”
在這種情況之下,國內的中小課題組恐將面臨生存危機,但他認為這未必是一件壞事。“這反而可以讓中小課題組重新反思自己該做什么。不僅是中小課題組,我認為 95% 以上的國內生物醫藥方面的所謂研究都存在一定問題。最近一兩年我一直在說,生物醫藥在國內好像發展得烈火烹油、繁花似錦,但是如果把依賴國外數據這個‘拐棍’給掐掉了,還能做什么呢?如果做不了,又說明了什么呢?”
上述 C9 院校資深教授還指出:“中國做生物醫藥研究只是在發表論文方面排在前列,最近幾年,我們只是把中國基礎研究的水平提升到了國際上過去二三十年來所謂的主流分子醫學的水平。但是,這個分子醫學在分子生物學方面是否一定程度上需要重新審視?如果把中國生物醫學‘前幾名’的地位給打下來,如果真能這樣也挺好,就像刺破房地產泡沫一樣。”
那么,面對如今的局面,中國學者除了讓國外合作者幫忙找數據之外,是否還有別的破局之法?前文提到的業內人士認為:“數據庫是美國建的,這等于是人家自己的東西,我們能做的其實不多。不過,應對這種數據庫限制訪問的問題,我認為可能有幾點值得去嘗試。首先是中國學者可以集體呼吁,和美方展開一些磋商,看看有沒有一些可行的解決方案,比如將本次被限制訪問的數據庫改為付費制。其次,可以和其它不受限的第三方國家合作。最后,最重要的一點就是中國需要快速建立屬于我們自己的數據庫。當我們建好自己的數據庫后,再去和美國人談判磋商的時候籌碼就多一些,比如就可以討論雙方是否相互開放數據庫,實現雙方的互相共享。不過,眼下可能需要一些有識之士或者有影響力的人站出來呼吁。學術原本是一件純粹的事情,非常希望這件事可以盡早結束,從而減少對于科學家的干擾,有利于持續推動科學發展,為人類社會發展創造新增量空間。”
關躍峰指出,這一變化只是開始,未來一定有更多脫鉤政策出現。中國多年前就在未雨綢繆地建設本土數據庫。加大本土數據庫建設和使用,是中國科研圈的必然趨勢。此外,加強美國以外的學術合作,也是重點方向。特朗普政府不只針對中國,也是在針對整個科研領域。因此,唯有抱團取暖,才能對抗風險。
參考資料:
https://bidenwhitehouse.archives.gov/briefing-room/presidential-actions/2024/02/28/executive-order-on-preventing-access-to-americans-bulk-sensitive-personal-data-and-united-states-government-related-data-by-countries-of-concern/
排版:劉雅坤
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.