2024年諾貝爾化學獎授予了在蛋白質結構設計領域作出開創性貢獻的美國科學家戴維·貝克,以及在蛋白質結構預測方面作出突出貢獻的英國科學家杰米斯·哈薩比斯和美國科學家約翰·江珀。他們的研究極大地促進了人類對蛋白質的理解和認識,為生物學研究帶來了革命性的變化,推動生命科學進入了一個嶄新的時代。
《科學畫報》編輯部
文/鄧元慧 王國強
鄧元慧,中國科協創新戰略研究院副研究員。
王國強,中國科協創新戰略研究院研究員。
蛋白質的發現之路曲折漫長
18世紀以前,人們就已在生活實踐中發現有一種“類膠質”的“動物物質”——在加熱時,它們會變成堅硬的角狀物質;在潮濕、溫暖的環境中則腐爛變臭,產生堿性的揮發物。這些特征與在潮濕、溫暖的儲藏環境中會產生酸性物質的淀粉、糖類以及多數的植物體有著天壤之別。
18世紀的一些發現揭開了蒙在這個問題上的面紗一角。1728年,意大利學者雅各布·貝卡里將和好的生面團在水中揉搓清洗,除去細小的白色淀粉顆粒,獲得了有黏性的面筋團。他認為,面筋具有“動物物質”的全部特性,才使小麥富有營養。事實上,中國人早已發現面筋這種物質,但遺憾的是我們并沒有對其進行深入的研究。
1785年,法國化學家安托萬·富克魯瓦發現,人類和動物的肌肉纖維都含有一種化學性質與凝固血液中的纖維物質相似的物質。1838年,荷蘭化學家赫拉爾杜斯·米爾德將白蛋白、纖維蛋白、酪蛋白等暴露于多種化學試劑的作用下,獲得了它們的氧化、氯化、硝化等產物。他發表論文《動物物質的組成》指出,所有蛋白質都由碳、氫、氮和氧的自由基化合物(蛋白質)以及不同數量的硫和磷組成。因此,用一個含有碳、氫、氧、氮的化學式作為它們的通式,再加上不同數量的含硫或含磷基團,就可以表示這種類型的不同化合物。他提出,動物通過食用植物就可以獲取大部分蛋白質。在瑞典著名化學家約恩斯·貝爾塞柳斯的建議下,米爾德第一次使用了“蛋白質”(法語proteine,源于希臘詞匯proteios,意為“第一位的”)一詞,將其作為生命系統中最重要的物質。
荷蘭化學家赫拉爾杜斯·米爾德
1902年,德國化學家赫爾曼·費歇爾與弗朗茨·霍夫邁斯特幾乎同時提出了多肽結構學說,即“相同或不同種類的氨基酸通過肽鍵相連形成了多肽鏈,一條或多條多肽鏈組成了蛋白質”的設想,并進行了驗證。我們可以將蛋白質想象成一條由氨基酸串成的項鏈,每一種蛋白質項鏈的串珠都有它獨特的排列方式,有的長、有的短,且不同的排列和鏈接方式會使項鏈具有不一樣的三維形狀,或彎曲,或扭轉,或折疊。1907年,費歇爾還嘗試使用光反應合成了18肽的長鏈,這個肽鏈雖然只含有15個甘氨酸和3個亮氨酸,卻是蛋白質肽鍵結構理論的一個初步證明,為后人開展蛋白質結構的研究奠定了方法基礎。
然而,關于“蛋白質是大分子”的理論確立并非一帆風順。受膠體化學理論的影響,化學家錯誤地將蛋白質視為膠體,而非具有特定結構的分子,這種誤解影響了初步形成的蛋白質結構理論的發展。1922年,德國高分子化學家赫爾曼·施陶丁格在天然橡膠中發現了存在高分子長鏈的直接證據,提出了高分子是由長鏈大分子構成的觀點,動搖了傳統的膠體理論,并將大分子的概念引入生物化學。1925年,瑞典化學家特奧多爾·斯韋德貝里研制出超速離心機,用于蛋白質和膠體研究,并第一次測定了蛋白質的分子量。此后,蛋白質是由多種氨基酸連接成的大分子和多肽結構理論逐漸被科學界認可。
德國高分子化學家赫爾曼·施陶丁格
新奇而又神秘的蛋白質結構探索之旅
隨著蛋白質大分子結構的確立以及分析手段的不斷演進,到20世紀50年代蛋白質的結構已基本得到闡明。1931年,中國生物化學家吳憲從研究蛋白質的變性出發,提出蛋白質變性是由于天然蛋白質中緊緊盤繞的肽鏈展開,使內部結構瓦解所致。這一結論曾得到國際生化學界的廣泛承認。然而,關于蛋白質如何維持其天然構象的化學機制,仍是未解之謎。1936年,美國化學家艾爾弗雷德·米爾斯基與萊納斯·鮑林等人共同揭示了蛋白質大分子結構中除了強有力的肽鍵之外,還存在著一種較弱的氫鍵,且正是這種氫鍵,在維持長肽鏈穩定構象方面發揮著關鍵作用。一旦氫鍵遭到破壞,蛋白質就會發生變性。1950年,鮑林與合作伙伴羅伯特·科里進一步闡釋了氫鍵如何使蛋白質大分子的整體外觀呈現螺旋狀結構。這些發現深化了我們對蛋白質結構的認識,為蛋白質結構的研究開辟了新天地。
英國生物化學家弗雷德里克·桑格
電泳法、色層析法、紙層析法等的發明,為科學家分離、提純和鑒定蛋白質中的氨基酸奠定了基礎。1955年,英國生物化學家弗雷德里克·桑格應用紙層析法、電泳法等首次完整地測定了胰島素的氨基酸序列,同時證明蛋白質具有明確構造,為準確了解蛋白質的結構及其與蛋白質功能之間的關系、研究蛋白質的人工合成和蛋白質的生物合成奠定了基礎。20世紀50年代末,英國生物學家約翰·肯德魯和馬克斯·佩魯茨將蛋白質培育成晶體,用X射線轟擊它們,并測量射線的彎曲情況。通過這種方法,他們確定了血紅蛋白和肌紅蛋白的三維結構,展示了第一個蛋白質的三維模型。這種技術被稱為X射線晶體學。隨著這一方法的不斷改進,特別是與計算機相結合后,蛋白質的晶體結構分析速度逐漸加快,分辨率也越來越高,一些蛋白質的氨基酸順序和立體結構相繼得到了闡明,為科學家能在蛋白質大分子的一級結構,甚至三級結構的基礎上研究結構和功能的關系提供了支撐。
英國生物學家約翰·肯德魯(左)和馬克斯·佩魯茨(右)
雖然科學家早已用經典的有機化學的縮合方法合成多肽,但這僅限于很簡單的氨基酸縮合,還不能合成出天然蛋白質。隨著20世紀50年代蛋白質大分子中氨基酸的測序技術的突破,用化學方法合成天然蛋白質成為科學家新的重要研究方向,胰島素的人工合成成為各國科學家爭相突破的重要問題。中國的科學家花了7年多的時間實現了這一重大突破。同期,美國生物化學家羅伯特·梅里菲爾德建立了多肽固相合成技術,這一技術與傳統制造多肽方法相比更加簡便、高效,成為多肽合成的基本方法。他還研制了第一臺自動化合成儀,大大提升了蛋白質合成的效率。
中國科學家首次合成人工牛胰島素
人工智能為蛋白質的解密插上“翅膀”
時至今日,我們早已認識到蛋白質在生命體中發揮著核心作用,參與了幾乎所有生物體內的生化過程。但是,蛋白質是如何從一維的氨基酸鏈折疊成三維的空間結構的?已發現的這些蛋白質又是如何在機體中發揮作用的?我們是否能設計創造出自然界中沒有的蛋白質?
20世紀50年代末,美國生物化學家克里斯蒂安·安芬森提出了假說:蛋白質的氨基酸序列包含其天然結構的全部信息,而蛋白質的天然結構是其熱力學最穩態。人們開始猜想:如果化學家知道蛋白質的氨基酸序列,是否就能夠預測出蛋白質的三維結構?這就是我們常說的蛋白質折疊問題。直到2005年,蛋白質折疊問題仍被《科學》雜志列為125個未解決的科學問題之一,蛋白質對人類來說依舊“讀之難解其句,思之難釋其惑”。
幾十年來,科學家不斷尋找著解密蛋白質的線索,并建立了蛋白質數據庫。從1971年建立時僅有7個蛋白質的結構,到1992年達到了700多個,每一個結構都是科學家耗時多年努力的成果。但是,當實驗主義者還在花費大量時間研究蛋白質的物理模型時,計算主義者開始了通過編寫程序來探求蛋白質結構的嘗試。如何將兩種研究方向和思路結合起來,使蛋白質研究既擁有計算主義者的工作速度,又能保證有實驗主義者的工作精度呢?為了解決這一問題,1994年,美國馬里蘭大學細胞生物學和分子遺傳學系教授約翰·莫爾特等人舉辦了結構預測關鍵評估競賽,這個競賽活動每兩年開展一次,旨在確定和推進從氨基酸序列建模蛋白質結構的最新技術水平。在活動中,組織者會發布一份已經實驗驗證過結構但尚未發表的蛋白質氨基酸序列列表。世界各地的計算團隊會使用各自的方法來預測這些蛋白質的結構,最后由一個獨立的科學家小組對結果進行比較來評選出最佳的技術方法。這個活動迅速成為蛋白質折疊問題計算方法的試驗場。
在1998年舉辦的第三屆結構預測關鍵評估競賽中,戴維·貝克的算法“羅塞塔”(Rosetta)一鳴驚人。在這個算法中,貝克將蛋白質數據庫中的蛋白質打碎成小肽段,并通過隨機插入組裝的方法,用能量函數判斷是否接受每一步,像搭積木一樣。雖然這個算法準確率仍有待提升,但貝克認為,既然“羅塞塔”算法的蛋白質構象空間搜索和能量評估已經取得一定成績,為什么不反其道而行之?從結構出發,設計蛋白質,再計算能折疊成該結構的蛋白質序列。2003年,貝克團隊設計出了首個具有全新折疊方式的Top7蛋白,從此開啟了計算蛋白質設計的新紀元。自那以來,貝克實驗室設計了各種功能、形態各異的蛋白質,從化學催化酶到藥物結合蛋白靶點、小分子結合蛋白,再到納米材料等。蛋白質設計成為蛋白質研究的重要方向。
首個具有全新折疊方式的Top7蛋白
在此過程中,人工智能逐漸嶄露頭角。2016年3月,當人工智能公司DeepMind的聯合創始人哈薩比斯見證了“阿爾法圍棋”(AlphaGo)擊敗人類圍棋世界冠軍后,他回想起了自己在大學時挑戰由貝克設計的蛋白質折疊游戲Foldit的情景。他大膽設想了可以讓人工智能參與到蛋白質折疊問題的解析中。2017年,江珀加入DeepMind,與哈薩比斯等人一起開始了人工智能蛋白質結構預測模型的研究。2020年,他們開發的“阿爾法折疊2”(AlphaFold 2)大獲成功。這個模型能夠根據蛋白質的氨基酸序列預測其復雜的3D結構,并且達到了原子級精度,解決了困擾人類50年的蛋白質折疊難題。
盡管“阿爾法折疊2”的預測并不能說是完美無瑕,但它極大地提升了蛋白質結構解析的速度,并打破了結構生物學原本的研究范式。2021年,“阿爾法折疊2”完成了人類所有蛋白質的結構預測。2022年7月,“阿爾法折疊2”為蛋白質數據庫提供了2億多種蛋白質的預測結構。最新推出的“阿爾法折疊3”(AlphaFold 3)已不僅僅是單純地對簡單蛋白質結構進行預測,它可以高準確度和高精度預測蛋白質復合物、蛋白質-核酸、蛋白質與小分子配體等三維結構。
通過蛋白質研究探尋生命的密碼,仿佛是在崇山峻嶺間攀緣,以摘取那顆照亮生命科學奧秘的璀璨明珠,是人類百年來的宏偉夢想。在人工智能的助力下,科學家正以前所未有的速度和精確度,讓夢想成為現實。人工智能不僅深化了我們對生命科學的認知,更為生物學、醫學等多個領域開辟了新的研究和發展路徑,帶來了新的科學發現和技術創新的契機,更預示了未來無限的可能。
點擊圖片訂閱
2025年《科學畫報》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.