Efficiency, Robustness and Stochasticity of Gene Regulatory Networks in Systems Biology: λSwitch as a Working Example
系統生物學中基因調控網絡的效率、魯棒性與隨機性:以 λ 開關為例
摘要
噬菌體λ是現代分子生物學中研究最廣泛的生物模型之一。在過去的50年里,關于這一生物模型的定量實驗知識已在各個層面積累了豐富的數據:物理學、化學、基因組學、蛋白質組學、功能學等。其所有組成部分都已被詳細解析。理論任務則是將這些組成部分整合起來,使該生物體能夠以一種和諧的方式實現定量運作。這將檢驗我們對生物學的理解,并為更深入的研究和應用奠定堅實的基礎,這也是系統生物學的一個顯而易見的目標。然而,在實現這一目標的過程中,一個突出的挑戰就是所謂的λ開關穩定性謎題:即生物學上觀察到的魯棒性與基于已知實驗值的數學重建之間的困難。在本章中,我們回顧了近期針對這一問題的理論和實驗努力。重點放在最小定量建模上,其中實驗與建模之間已成功實現了數值上的吻合。此外,從這項研究中涌現出的一種新方法——暫命名為**隨機動力學結構分析**——也將在廣泛的建模視角下進行討論。
簡短標題:λ開關的系統生物學研究
關鍵詞:噬菌體λ,基因開關,魯棒性,效率,協作,隨機過程,動力學景觀,系統生物學
1. 引言
人類基因組計劃的完成將生物與醫學研究推向了一個生物學史上前所未有的新階段。顯然,一片廣闊而未被探索的領域正在前方展現,充滿巨大的潛力 [1]。許多具有重要概念和實踐意義的重大問題已被提出并討論 [2-4]。自本世紀初以來,關于這些問題背后的普遍原則以及解決它們的一般方法論,已有廣泛的爭論 [5,6]。本文的作者之一一直致力于推動這種闡述,并為這一趨勢做出了貢獻 [7]。這樣的努力不僅是為了“號召行動”,還幫助定義了各種新興領域。然而,在實際研究中,必須探索全方位的努力。需要發明新的工具來解決新問題,并嘗試解決遺留下來的老問題。在本篇綜述中,我們將注意力轉向另一方面的思考,這并非低估宏大主題的價值,而是為了平衡其宏偉性提供一個例子。與其提出一般性的問題并得到有限的答案,我們希望在一個有限的系統上提出有限的問題,并盡可能找到完整的答案,同時獲得一些普遍性的結論。過去幾年中,我們一直在進行這樣的努力。這種方法自現代科學誕生以來一直非常有效,最早由伽利略所示范。具體而言,我們的關注點將集中在噬菌體λ遺傳開關 [8,9] 的魯棒性和穩定性上,這一模型可以說是開啟了現代分子生物學的研究 [10]。
在現代信息時代,開關式結構是所有架構中的基本構建模塊。它是二進制數字的實現形式,是信息的單位,也是今天的“原子”。隨著生物學越來越被視為一門信息科學 [11-13],對這一基本構建模塊的深入理解是非常必要的。事實上,詳細分析表明,復雜網絡的響應通常涉及各種開關 [14],并且遺傳網絡被證明具有計算能力 [15]。通過類比電子電路板中的集成線路,這種方法已成功應用于海膽早期發育階段的基因調控建模 [16]。如今,生物學中開關的研究范圍廣泛,包括對環境變化的響應 [17,18]、發育生物學 [19-21]、神經網絡 [22,23]、生理反應 [24,25]、基因調控 [26-28]、信號轉導 [30]、記憶效應 [31,32]、嗅覺感知 [33]、合成生物學 [34]、生物技術應用 [35-38]、光合作用 [39] 以及其他許多領域 [40-43]。甚至在細胞周期過程中,如果將其視為不是由循環引擎驅動,而是由交通燈控制的過程,則開關式結構很可能起主導作用 [44-46]。開關確實已經成為生物過程中的基本元素之一,并成為生物學實驗和理論研究的范式。
那么,為什么會有如此多的努力投入到研究一種特定病毒的遺傳開關——λ開關上?正如Ptashne已經指出的 [8],這是一個合理的問題,值得在一開始加以澄清。畢竟,生物學中的每個案例至少部分是偶然和特殊的,每個生物體的功能都是由其進化歷史決定的,我們對某一生物體內某過程的精確描述可能不會完全適用于另一個生物體。因此,生物結構中的魯棒性和隨機性必須被納入考慮并仔細研究。這一點在上述段落提到的基本生物過程中得到了很好的說明。如前所述,在發展的各個階段,根據環境信號的不同,細胞會選擇使用一組或另一組基因,從而沿著一條或多條發育路徑前進。了解決定這些選擇的分子機制將具有極大的價值。因此,λ生命周期確實是這一問題的原型,具有反饋回路的結構和隨機性的影響。此外,我們對其所有組成部分幾乎都有了完整的理解,其基因組早在人類基因組計劃完成之前就已被知曉 [47],并且相應的定量知識已在各個層面積累:物理學、化學、DNA、蛋白質和功能 [8,48,49]。盡管對其定量研究的歷史悠久,但至少到2004年,λ開關的穩定性和魯棒性仍然是計算生物學中的一個突出問題 [9,50,51]。理論挑戰在于將其所有組成部分整合起來,使其成為一個和諧運作的有機體,這是系統生物學的主要任務之一。
此外,有人可能會質疑使用定量和詳細建模的價值。生物理論通常以其描述性著稱。例如,當達爾文提出他的進化論時,并沒有使用任何方程。值得注意的是,盡管達爾文的一個主要預測(地球的年齡)與他當時的已知物理學直接沖突,最終是物理學而不是達爾文的理論經歷了根本性的轉變以解決這一明顯的矛盾,這對物理學和生物學都有益處。然而,認為定量方法在生物學中毫無用處是錯誤的。事實上,生物學的一些子領域,如生理學和群體遺傳學,是自然科學中最數學化的領域之一 [3]。隨著生物學逐漸成為一門信息科學 [11-13],未來這種情況會更加普遍。重要問題是,什么是數學描述的正確框架 [9,52]。誠然,過度使用數學語言(可能對建模者有吸引力)通常無助于對特定生物現象的理解 [53]。例如,通過引入過多參數,可以用一組方程描述任何現象。這種情況在奧卡姆剃刀原則下是不可接受的。另一個極端是尋找有效的描述,以期捕捉生物學本質。這種描述必然是粗略且定性的,盡管在生物學中極為流行且特別成功。然而,許多特征顯然被這種方法忽略了。理想的狀況是有一個詳細的定量研究,可以彌合這兩種方法之間的差距。噬菌體λ遺傳開關恰好為生物學提供了這樣一個絕佳的機會 [54]:一方面是布爾型開關的開/關描述,另一方面是詳細的物理和化學方程。
本文其余部分組織如下:第2節總結了關于噬菌體λ開關的重要生物學實驗研究。第3節總結了其關鍵的生化建模元素。第4節在最小定量模型的基礎上討論了隨機動力學結構分析方法。第5節討論了計算結果及其與生物學數據的比較。第6節總結了已完成的工作,并將最小定量建模方法置于更廣泛的背景下。第7節對λ開關的研究進行了樂觀展望。
2. 噬菌體λ的遺傳開關
2.1 噬菌體λ的生命周期
噬菌體λ是一種寄生于細菌上的病毒 [8,55,56]。它是已知最簡單的生命形式之一。在過去的50年中,其幾乎所有的組成部分都已被研究清楚。噬菌體λ的基因組由一條單鏈DNA分子組成,并被包裹在一個蛋白質外殼中。當感染宿主大腸桿菌(E. coli)細胞時,噬菌體λ將其基因組注入細菌內部,而將蛋白質外殼留在外部。進入細菌后,它會選擇兩種生長模式之一。噬菌體λ利用宿主細胞的分子遺傳裝置運行并執行自身的發育子程序,以產生新的λ噬菌體顆粒,最終導致細胞裂解。或者,它可以進入潛伏狀態(溶源狀態),將其基因組整合到宿主的DNA中,并作為宿主基因組的一部分進行復制。在這兩種不同的生命周期中,由于分子間的相互作用,噬菌體表達出不同的基因集合。對這一過程的魯棒性和穩定性進行現實建模仍然是生物計算和生物信息學領域最重要的挑戰之一。因為類似噬菌體λ的分子相互作用可能構成了許多發育 [8] 和表觀遺傳 [56] 過程的基礎,人們希望通過研究噬菌體λ的遺傳開關,深入了解分子水平上主要生物功能的調控機制。其中一個功能是表觀遺傳狀態的編程:噬菌體決定是否進入溶源狀態或裂解生長狀態的方式。在過去的五十年中,廣泛的生物學研究已經為此提供了一個相當好的定性圖景。存在一種合理的場景可以指導對實驗觀察的理解 [8]。
遺傳開關的維持和運作是基因調控網絡執行的另一項功能 [8,55,56]。處于溶源狀態的噬菌體保持潛伏,除非受到刺激。例如,當一個信號激活RecA蛋白時,RecA會切割CI單體,觸發噬菌體進入裂解生長狀態。實驗觀察表明,噬菌體λ的遺傳開關既高度穩定又高效。當噬菌體處于溶源狀態時,它可以保持潛伏許多代。自發誘導的發生率低于百萬分之一的細胞分裂次數。一旦噬菌體接收到適當的信號,它幾乎以100%的概率切換到裂解狀態。這種穩定性與效率在噬菌體λ遺傳開關中的共存,從理論和數學建模的角度來看一直被認為是一個謎。
2.2 建模努力
在對噬菌體λ進行建模方面,數學和數值研究活動一直在持續進行。其基本原理相當直接:生物功能應作為系統性質從基于噬菌體調控元件分子機制及其獨立測量參數的模型中涌現出來。Shea和Ackers [48] 提出的關于噬菌體λ基因調控的優雅物理化學模型已成為后續研究的基礎。然而,不久之后,Reinitz和Vaisnys [57] 指出,理論結果與實驗數據之間的不一致性可能表明存在額外的協同作用。Arkin等人 [58] 對噬菌體λ發育過程進行了隨機模擬,以研究裂解決定的早期階段,證明這一過程具有隨機性。最近,Aurell和Sneppen [59] 使用基于Onsager-Machlup泛函的方法 [58] 分析了噬菌體λ遺傳開關的魯棒性,并得出結論:他們的理論分析無法重現噬菌體λ遺傳開關的魯棒性。他們進一步的研究證實了他們之前的結論 [51]。從另一個角度來看,類似的困惑也被數學方法發現 [50]。
開關的穩定性和切換效率的共存顯然存在以下矛盾之處。溶源狀態異常穩定,生長環境中的波動(即所謂的外在波動)以及由于化學反應離散性引起的基因開關內在波動,并不容易意外觸發開關的翻轉。然而,當噬菌體受到“威脅”時,為何切換過程能夠在如此少的外部干預下完成得如此徹底?這些模型內部是否存在不一致的問題自然浮現:Shea和Ackers的工作 [48] 中描述的那種易于操作的誘導或高效的切換,是否是以犧牲基因開關的魯棒性為代價實現的?換句話說,如果一個模型被構建得能夠忠實再現觀察到的基因開關魯棒性,那么它是否會失去開關的效率?毫無疑問,一個可信的噬菌體λ模型應該同時再現基因開關的魯棒性、穩定性和效率特性。通過這樣的模型,我們還應能夠計算出噬菌體發育過程中觀察到的數量特征,例如蛋白質數量和溶源化頻率。我們希望表明,這樣一個與實驗數據相符的數學框架的基礎已經存在,這要歸功于近期在噬菌體λ研究方面的理論努力 [9,48,57-59]。
2.3 建模策略
我們的步驟首先是基于第一性原理和生物學觀察,總結出一個最小化的定量模型來描述噬菌體λ的遺傳開關。然后我們提出一個問題:這種最小化建模是否能夠成功用于定量再現各種實驗結果,并且在生物學上定性正確?如果成功,模型中分子參數的必要調整可以被視為體內與體外差異的表現。細胞內額外或不同的分子過程應該對這些差異負責,其中一些可能通過當前的實驗技術加以識別。如果上述問題的答案是否定的,我們將得出結論:最小化定量建模是不夠的,需要尋找更多的生物學原因。我們將表明,迄今為止答案是肯定的。通過結合一種新開發的強大非線性動力學分析方法(該方法考慮了隨機力 [61-63],并將隨機動力學結構分為四個不同要素)與先前建立的物理化學模型 [48],我們構建了一種新穎的數學框架,用于計算以下表觀遺傳狀態和發育路徑的定量特征 [9,64]:單個細菌中的蛋白質數量、蛋白質數量分布、每種狀態的壽命,以及以野生型為參考的突變體溶源化頻率。我們應該強調,盡管我們已努力將這項工作置于更廣泛的視角中,但本綜述的重點是一個特定的生物系統。
3. 走向定量建模
3.1 結合構型
控制和維持噬菌體λ功能的遺傳開關由兩個調控基因(cI 和 cro)以及λ DNA上的調控區域(OR 和 OL)組成。已建立的溶源狀態由蛋白質CI維持,CI通過阻斷操縱子**OR**和OL,阻止包括cro在內的所有裂解基因的轉錄 [8,55,56]。在溶源狀態下,CI的數量作為細菌狀態的指示器:如果DNA受到損傷(例如紫外線照射),RecA的蛋白酶活性會被激活,導致CI的降解。少量的CI允許裂解基因的轉錄開始,首先是cro,其產物是蛋白質Cro。
決策過程或開關切換圍繞操縱子OR展開,OR包含三個結合位點:OR1、OR2 和 OR3,每個位點都可以被Cro二聚體或CI二聚體占據 [55,56]。如圖2所示,這三個結合位點分別控制兩個啟動子PRM和PR的活性,分別負責cI和cro的轉錄。cro的轉錄從PR開始,PR部分與OR1和OR2重疊;而cI的轉錄從PRM開始,PRM與OR3重疊。RNA聚合酶對這兩個啟動子的親和力以及隨后兩種蛋白質的產生,取決于Cro和CI如何結合到這三個操縱子位點上,從而以每細菌約500個CI分子的數量維持溶源狀態。然而,如果CI的數量變得足夠少,Cro產量的增加會觸發開關進入裂解狀態。
已有大量關于噬菌體λ開關穩定性的定量實驗研究。最近,三個獨立的研究小組報告了刪除recA基因菌株中自發誘導的頻率 [65-67],這些研究由Aurell等人 [67] 進行了綜述。這些研究都證實了兩個早期的重要觀察結果:存在開關行為,并且該開關是穩定的。此外,盡管使用了不同的菌株背景,并且實驗在不同的大陸和時間進行,但它們都得到了一致的開關頻率數值。
然而,即使考慮到野生型可能更穩定的可能性 [59,67],試圖通過計算和數學方法定量理解這一行為的努力尚未取得成功。
更近期的數據 [68] 表明,野生型的穩定性可能比文獻 [66] 中先前觀察到的值高出兩個數量級:向裂解狀態切換的速率可能低于每分鐘4×10??。除了呼吁更多的實驗研究外,這使得理論建模面臨更大的挑戰。這一野生型數據被用作文獻 [9,64] 中進一步修正模型的主要輸入。先前的數據也被討論以說明此類建模中存在的顯著指數敏感性,總結如下。
細胞中的CI和Cro蛋白分子被假設處于穩態平衡中。在任何特定時刻,結合到操縱子上的CI和Cro二聚體的數量并不總是相同的。這些數量是波動的,而平衡假設應能給出這些波動的幅度。關鍵輸入參數包括CI和Cro的二聚化常數,以及它們與三個操縱子位點(OR1、OR2 和 OR3)結合的吉布斯自由能 [69-75](詳見表I和表II的圖例以獲取更詳細的描述)。
沿用Ackers等人 [76] 和Aurell等人 [67] 的方法,我們通過三個數字(i, j, k)來編碼CI和/或Cro結合到OR的狀態,分別對應于OR3、OR2 和 OR1。如果對應的位點是空的,則狀態s的編碼為0;如果位點被CI二聚體占據,則編碼為1;如果位點被Cro二聚體占據,則編碼為2。在Shea和Ackers [48] 提出的巨正則系綜方法中,具有i(s)個CI二聚體和j(s)個Cro二聚體結合到OR的狀態s的概率可以表示為:
Table I. The 40 configurations corresponding to right operator (adapted from Ref’s.[74-76]). R2
stands for CI (λrepressor) dimer and C2for Cro dimer.
例如,如果CI占據OR1,Cro占據OR2和OR3,則有i(s) = 1,j(s) = 2,k(s) = 0,且pR(s) = pR(221)。RNA聚合酶(RNAp)可以占據OR1和OR2,或者OR2和OR3,但不能占據其他配置。總共有40種狀態由s表示(表I)。歸一化常數Z通過對所有s求和得到:
Z = Σs [CI]???? [Cro]???? [RNAp]???? exp(-?G(s)/RT)。
這里,[ ] 表示細菌中對應蛋白二聚體的濃度,?G(s) 是結合構型s的結合能量,R是氣體常數,T是溫度。
3.2 確定性模型
我們通過注意到蛋白質CI和Cro控制操縱子 [8,55,56],進一步簡化了pR(s)的表達式。如果未被CI或Cro占據,RNA聚合酶(RNAp)將以由RNAp結合能決定的概率與它們結合。然而,假設RNAp先結合到,然后阻止CI和Cro結合的情況被排除,因為只有CI和Cro控制調控行為。除了實驗觀察之外,如果與CI和Cro結合相關的時間尺度比RNAp結合的時間尺度短,則這一假設是合理的。除去一個整體常數(我們將其納入轉錄速率中),RNAp的結合不再相關。因此,我們將其從pR(s)的表達式中移除。狀態的總數減少到27個。這種簡化最早由Aurell和Sneppen [59] 使用。我們將省略結合概率pR的下標R。需要指出的是,Aurell等人 [67] 已對先前的實驗和理論結果進行了簡明的綜述,我們將遵循他們的慣例。
二聚體和單體的濃度由二聚體的形成與解離決定,這給出了二聚體濃度與蛋白質總濃度之間的關系:
自由能?G(s) 是通過體外研究確定的,也就是說,它們是在活細菌外部獲得的。活細菌內部的體內條件可能有所不同。測量的蛋白質-DNA親和力可能對緩沖溶液中的離子及其他因素非常敏感。這一觀察結果在我們比較理論結果與實驗數據時將非常重要。另一方面,這種變化的體內效應應該會被補償,例如,KCl濃度的變化可以通過腐胺 [77]、其他離子以及擁擠效應 [78] 來調節。我們注意到,Record等人 [78] 已經觀察到體內和體外分子參數之間可能存在顯著差異。Darling等人引用的數據是在200 mM KCl濃度下獲得的,這與體內條件相似。因此,盡管我們預計體內和體外數據之間會存在差異,但這種差異可能并不大,通常在體外值的20-30%范圍內。
描述圖2中基因調控的數學模型是一組耦合方程,用于表示細胞內CI和Cro數量隨時間的變化率 [57]:
3.3 正反饋與負反饋;體內與體外
在這個基因開關中,同時使用了正反饋和負反饋。對于CI(或Cro)來說,它對自己具有正反饋效應,而對Cro(或CI)的生產則具有負反饋效應[8]。顯然,這些反饋是系統性效應:如果將它們分解為孤立的部分,反饋效應就會消失。只有在適當的整合下,這些效應才會顯現出來。這種系統性效應在工程學中早已為人所熟知[83]。
在建立最小確定性模型時,另一個主要的隱含假設涉及時間尺度。我們假設二聚化過程相對于Cro和CI的生產而言是一個快速過程,因此可以將其視為代數約束條件。二聚化過程已經經歷了持續的實驗研究[84]和理論研究[85]。通過體外實驗得出結論[84],Cro的二聚化比CI的二聚化更慢。然而,Cro的二聚化時間約為幾分鐘的分數級[84],這遠小于我們在建模中使用的典型時間尺度(約20分鐘,參見表II)。因此,我們可以應用有用的準穩態近似[86]。因此,代數約束似乎是一個合理的假設,適用于[9,59,64,67]中使用的最小建模。其他細胞過程也被隱含地假設為快速過程。其所有殘余效應將被視為外在隨機效應的貢獻,并將在最小建模中以內在噪聲與外在噪聲的形式加以考慮,這一點將在下文討論。
我們進一步闡明最小確定性建模的意義。首先,這樣的模型應被視為系統“可能”的狀態,而不是“必須”的狀態。許多特征并未顯式包含在其中,例如非特異性結合[87]和環化[88,89]。非特異性結合已被證明并非至關重要,但環化可能非常重要,這一點我們將在后文再作討論。盡管如此,我們指出,通過假設最小確定性模型,我們暫時且策略性地認為它通過聚合周圍的分子過程,捕捉到了λ開關的所有本質特征。這樣做也暗示了對體內與體外差異的另一種理解:從體外測量中采用的所有參數在體內確實會取不同的值,因為細胞內部存在許多其他生物學過程,這些過程共同促成了這種差異。如果最小模型本質上是正確的,它應該能夠以定量的方式解釋實驗數據,并作出可進一步驗證的預測。我們將在下文展示,經過幾十年的理論努力,我們確實實現了這一目標。
4. 隨機動力學建模
4.1 最小定量模型
隨機性在生物學中無處不在。對于當前的建模來說,很容易激發對其的討論。如果CI和Cro的數量非常大(宏觀上),那么方程(1)將完全準確地描述動力學行為,因為數量的波動是量級,而修正項則是量級,當N非常大時,這種修正可以忽略不計。然而,CI和Cro的數量僅在數百范圍內。因此,波動不可忽略。實際的蛋白質生產過程受到許多偶然事件的影響,例如溶液中的CI或Cro找到一個空閑的操縱子位點所需的時間,或者RNA聚合酶分子找到并附著到可用啟動子所需的時間,這些都表明了更多的隨機來源。因此,作為包含有限N噪聲的網絡的最小模型,我們考慮以下由兩個獨立的標準高斯白噪聲源驅動的耦合隨機微分方程系統:
方程(8)和(9)構成了當前的最小定量模型。這里的符號<…>表示對噪聲的平均值。方程(9)定義了一個2×2的擴散矩陣D。噪聲強度可能包含來自生產和衰變速率的貢獻,假設每個速率都由一個單一的獨立反應主導,正如Aurell和Sneppen[59]所使用的那樣。這種噪聲可以被稱為“內在”噪聲。此外,還存在其他噪聲源,即“外在”噪聲[90-93]。我們處理的噪聲結合了內在和外在來源:所有噪聲都被假設為高斯白噪聲。這一假設的一致性應該通過實驗來驗證,這一點將在下文討論。然而,某些概率事件在當前建模背景下可能并不表現為高斯白噪聲,這可以通過單獨的生物學實驗來確定,例如下文將討論的pRM240突變[68]。
已經證明[61-63],存在一種唯一的分解方式,使得隨機微分方程(方程(8))可以被轉化為以下形式,即四個動力學元素結構:
其中,半正定對稱的2×2矩陣Λ定義了耗散(降解),反對稱的2×2矩陣Ω定義了橫向力,單值函數U定義了勢能景觀,噪聲向量x(t)和二維向量則分別為:
可以通過方程(13)和方程(14)用F = (FCI, FCro)? 和 D 來求解Λ和Ω。確實,這在形式上是可以做到的。一旦Λ和Ω已知,要求方程(10)能夠簡化為方程(8),則需要滿足(Λ + Ω)F = -?U(N),這一關系被用來求解U。一般來說,這種分解是一個復雜的數學和數值任務。進一步的簡化可以通過簡化摩擦矩陣來實現。通常情況下,擴散矩陣D在生物學上是未知的:沒有足夠的測量數據來明確確定噪聲。因此,我們可以將半正定對稱矩陣Λ視為需要通過實驗確定的參數。在我們的計算中,我們假設D是一個對角矩陣。根據方程(14),對于二維情況,Λ也是一個對角矩陣。實驗測量的recA-1溶源體切換到裂解狀態的比例被用來確定Λ的元素。
在這里,我們希望對這一數學過程給出一個直觀的解釋。方程(8)對應于一個虛構的無質量粒子在由兩種蛋白質數量NCI和NCro形成的二維空間中的動力學行為,其中既包含確定性力也包含隨機力。可以很容易驗證,一般情況下?×F(r) ≠ 0且?·F(r) ≠ 0。因此,由于存在與運動方向垂直的力以及摩擦力,F(r)不能簡單地表示為一個標量勢的梯度。在二維運動中最簡單的例子是,當同時存在橫向力和摩擦力時,一個帶電粒子在磁場和電場共同作用下的運動,這恰好符合方程(10)的形式。
從方程(10)出發,我們可以將半正定對稱矩陣Λ解釋為摩擦矩陣,將反對稱矩陣Ω解釋為某種“磁場”的結果。摩擦矩陣在物理學中代表耗散作用,這類似于生物學中的降解過程。標量函數U則起到了勢能函數的作用,它將決定噬菌體最終的穩態分布。當最終的分布函數由以下形式給出時,系統將達到全局平衡:
噬菌體在勢能景觀中看到兩個極小值和一個鞍點。這兩個極小值分別對應裂解態和溶源態。一旦噬菌體處于某個極小值,它轉移到另一個極小值的概率速率由以下形式的克雷默斯速率公式給出[94,95]:
其中,勢壘高度,是鞍點與初始極小值之間的勢能差,時間尺度(即嘗試頻率)由摩擦、勢能的曲率以及鞍點和局部極小值附近的橫向力值決定。我們在此指出,嘗試頻率通常是由方程(10)中的動力學量構成的復雜函數。在本文中,其形式將通過經驗方法確定。關于一般的數學討論,請讀者參閱文獻[95]。
4.2 隨機動力學結構分析
方程(10)通過其四個動力學組成部分——摩擦、驅動力的勢梯度、橫向力和隨機力——給出了基因調控網絡的動力學結構。這種動力學結構分類具有兩個主要目的:它本身為基因開關的主要特征提供了一個簡潔的描述,同時為比較不同的基因調控網絡(例如野生噬菌體與其突變體之間)提供了一個定量的衡量標準。基于方程(10)對實驗數據進行的這種分析將被暫時命名為動力學結構分析。
勢能可以被解釋為噬菌體發育的“景觀圖”。每一個表觀遺傳狀態由一個勢能極小值表示,其周圍的區域形成一個吸引盆地。由摩擦所代表的耗散作用賦予了噬菌體在勢能定義的景觀中的適應性:噬菌體總是傾向于接近附近吸引盆地的底部。極小值附近的勢能變化與摩擦共同決定了弛豫時間尺度:即在表觀遺傳狀態受到擾動后達到平衡所需的時間。一旦我們知道了極小值附近的摩擦和勢能,就可以很好地掌握弛豫時間τ = η/U″,其中η是摩擦強度,U″是勢能的二階導數,均在一維近似下沿相關軸計算。當U″為常數時,弛豫時間與勢能極小值附近的擾動幅度無關。
在此需要提出兩點說明:
1. 摩擦矩陣的意義與力學中的意義相同:如果沒有外部驅動力,系統會趨于停止在其附近的極小值位置。生物學中最接近的概念是“降解”:在給定條件下,總是存在一種自然的蛋白質狀態。
2. 結果表明,橫向力在當前的開關行為中并不是主導因素。然而,它的存在是振蕩生物學行為的必要條件,這一點本文將不再進一步討論。
勢能提供的另一個時間尺度是表觀遺傳狀態的壽命,它由克雷默斯速率公式(方程(16))通過勢壘高度給出。這一時間尺度衡量了在波動環境中表觀遺傳狀態的穩定性。在λ噬菌體的情況下,溶源態的壽命非常長,除非其操縱子位點發生突變。當噬菌體受到刺激時,分隔溶源態和裂解態的勢壘高度會降低。由于溶源態的壽命對勢壘高度呈指數依賴性,其壽命會顯著縮短,從而導致開關行為的發生。從另一個角度來看,隨機力賦予噬菌體在勢能景觀中搜索的能力,使其能夠穿越鞍點并驅動開關事件的發生。克雷默斯速率公式是對這種優化能力的定量衡量。
5. 理論與實驗的定量比較
5.1 確定體內參數
首先,我們需要確定理論模型中使用的自由能。到目前為止,所有關于λ噬菌體的結合能測量無一例外都是通過體外研究獲得的。體內條件與體外條件之間的差異可能包括緩沖溶液中的離子濃度以及基因組DNA的空間構型,例如環化[96-98]。表I中從體外到體內協同能的較大變化可能部分是由于環化效應,盡管當前模型中沒有直接考慮環化因素。我們注意到,在體內條件下,所有的操縱子都處于相同的環境中,包括離子條件和DNA構型。后者的原因是這些操縱子在基因組中彼此位置非常接近。如果基因組DNA發生彎曲,從而增加或減少DNA-蛋白質的結合,那么這些位置接近且較短的操縱子位點很可能經歷相同程度的變化。因此,我們假設除了體外DNA-蛋白質結合能之外,還分別對所有CI和Cro蛋白整體添加了結合能差異:
為了確定 ,我們需要比體外測量更多的實驗輸入。為了避免模型中不必要的不確定性,我們盡量包含最少數量的參數。兩個CI二聚體之間的協同結合被包括在內。兩個Cro二聚體之間的協同結合、CI和Cro二聚體之間的協同結合以及非特異性CI和Cro的結合則沒有包括。我們后續的計算驗證了CI的協同結合對于遺傳開關的特性是至關重要的,而我們忽略的那些結合對計算結果沒有顯著影響。
5.2. λ開關的隨機動力學結構分析
原問題(由方程(8)描述)可以被解釋為一組二維微分方程,用于描述一個粒子的運動。如果我們把蛋白質數量視作坐標,并將粒子在時間 t 的位置表示為,那么這種解釋是成立的。存在一個確定性力和一個隨機力作用于這樣的粒子。這個確定性力同時具有摩擦力、勢能力和橫向力的特性。我們之前討論的分解(方程(10))允許我們將這些成分分開。我們在這里分別討論它們。
野生型噬菌體λ及其一些突變體在勢能景觀中看到兩個最小值和一個鞍點(見圖5)。這兩個最小值分別對應于裂解態和溶源態(參見圖3)。勢能最小值的位置給出了裂解態和溶源態的平均蛋白質數量。有一個相對狹窄的勢能谷連接這兩個最小值。沿著這個谷的最高點是鞍點。由于高勢能區域不易到達,而低勢能區域形成一個谷,我們可以沿著谷可視化勢能,并在圖3和圖6中以一維圖的形式展示。
反對稱矩陣Ω可以用一個標量B沿z方向表示,即
。對于野生型噬菌體,橫向場B是通過數值求解方程(13)得到的。除了沿兩個軸的區域外,這個場通常很小。在兩個軸上,橫向B場沒有影響,因為運動是由陡峭的勢能引導到谷中的。一旦噬菌體從原點演化出來(此時CI和Cro的數量都很小),在后續的發展中,可以將橫向力從方程(10)中移除,而不改變噬菌體的動力學。在計算溶源態的弛豫時間和壽命時,由于上述原因,也可以忽略橫向力。
此外,Cro和CI的蛋白質數量分布也在參考文獻[9]中進行了計算。我們建議讀者參考該文獻以獲取更多細節,以及對其他量(如魯棒性和穩定性)的分析。
5.3. 開關效率
效率是一個重要特性,但迄今為止在文獻中受到的關注相對較少。我們在此對其進行較為詳細的討論。
對噬菌體 λ 遺傳開關穩健性的分析表明,其表觀遺傳狀態在參數變化下是穩定的,并且在發生重大突變時依然具有穩健性。那么,開關是如何發生的呢?從理論角度來看,噬菌體從溶原生長狀態被誘導到裂解生長狀態有兩個通道。實際上,噬菌體似乎采用了這兩種策略。為了清晰起見,我們先分別討論這兩個通道。
第一種誘導通道是提高 CI 蛋白數量的噪聲水平,同時保持其他條件不變。從數學角度來看,這意味著在公式(8)中增加 zCI,在公式(9)中增加 DCI,同時保持公式(8)和(9)中的其他項不變。通過分解過程,摩擦矩陣 Λ 也發生了變化。由此,勢能 U 也會發生變化。因此,在不同的噪聲水平下,噬菌體將在不同的勢能圖景中運動。這種噪聲水平的變化會產生顯著影響。它會使溶原狀態的勢阱變淺,從而改變勢能極小值點。作為一個很好的近似,溶原勢阱的勢壘高度與噪聲強度成反比。噪聲水平加倍將使勢壘高度減半。因此,噪聲水平的增加會顯著降低溶原狀態的壽命,如圖 10 所示。而裂解狀態的壽命則保持不變。這兩種潛在勢能圖景的變化結合在一起,使得噬菌體能夠高效地進入裂解生長狀態。
第二種通道通過公式(8)中的確定性項實現。對于確定性項,例如,引入 CI 單體裂解相當于將公式(8)中的 NCI 替換為 αNCI,這里 α 是表示裂解強度的因子(圖 11)。如果 α 小于 0.02,我們發現溶原狀態將不再穩定,即不再是一個勢能極小值。對如此小的 α 的解釋是,幾乎所有的 CI 單體都被裂解了。如果 α 較小,例如 0.1,意味著 90% 的 CI 單體被裂解,溶原狀態仍然是穩定的,其壽命幾乎沒有變化。顯然,僅通過 CI 的均勻裂解而不引入額外的 CI 水平噪聲,并不是一個高效的誘導方式。噬菌體可能使用了這兩個通道。第二個通道顯然是被使用了的,因為 RecA 蛋白會裂解 CI 單體。而第一通道也被使用的強烈證據來自以下觀察:在沒有外部刺激的情況下,recA+ 噬菌體的溶原狀態壽命明顯比 recA- 噬菌體短。這種在未能觀測到 RecA 蛋白激活的情況下溶原壽命的大幅縮短,可以通過 CI 噪聲水平加倍來解釋。圖 6 給出了開關過程的示意說明。
在 Shea 和 Ackers [48] 的早期研究中,并未考慮隨機效應。在他們的模型中,即使溶原態的勢能極小值較淺,噬菌體仍會繼續維持在溶原生長狀態。只有當溶原勢能極小值完全消失時,才會發生狀態切換。根據他們所使用的參數,當 20% 的 CI 單體被裂解時,會發生這種切換。正如 Aurell 等人 [67] 指出的那樣,這些早期研究中的遺傳開關建模結果并未體現出實驗觀察到的穩健性。在我們要求遺傳開關展現出觀察到的穩健性之后,溶原勢能極小值的消失被推進到了 CI 單體裂解僅 2% 的情形。
然而,實際上狀態切換在溶原勢能極小值完全消失之前就已經發生了,即當勢阱過于淺而無法限制系統的漲落時就會發生切換。如果有 10% 的 CI 單體被裂解,至少可以預期 DCI 會因 CI 單體數量減少而增加 10 倍。此時溶原態的勢壘降低至不到 1,從而變得過于淺薄,無法維持持續的溶原生長。
5.4. 與 Little 等人實驗的定量比較
我們將與 Little 等人 [66] 實驗測量相關的計算結果匯總在表 III 中,因為他們的數據是最新且系統的。在他們的實驗中,他們測量了每個溶原細胞釋放的游離噬菌體數量(分別針對 recA? 和 recA? 噬菌體),但并未將 recA? 的結果轉換為發生裂解狀態切換的溶原細胞比例。如果我們假設 recA? 和 recA? 噬菌體的爆發量(burst size)相似,那么我們對 RecA? 蛋白的計算結果與他們的實驗測量結果在數量上是一致的。
在表 III 中,假設了噬菌體 λ 基因開關的雙穩態性,并計算了裂解狀態下的蛋白質水平。當然,這在野生型中并非如此,因此提出了一個實驗性問題:是否可以通過實驗驗證所計算的 Cro 蛋白水平。其中一種實現雙穩態的方法可能是抑制裂解,從而獲得所謂的抗免疫表型(anti-immune phenotype)【104,105】。
如在第四節中關于當前隨機模型公式的討論所述,我們做了一個簡化假設:將所有偶然事件或概率事件都視為高斯白噪聲。這一假設會影響兩個可測試的生物學量:溶原狀態的壽命(公式16)以及溶原狀態下 CI 蛋白數目的分布形狀(公式15 和圖7)。同時測量這兩個量可以作為對高斯白噪聲假設的一個一致性檢驗。
例如,我們在本研究中采取最簡模型的方法時,將 recA? 對開關動態的影響視為高斯白噪聲的作用,從而簡化了計算。事實上,我們假設在 recA? 情況下總噪聲強度加倍。基于這一假設,我們計算了裂解切換速率,結果見表 III 最后一列。CI 蛋白在 recA? 背景下的分布應比 recA? 情況下寬一倍。以上兩個結果都有待進一步實驗驗證。
在當前的建模框架中,確實可能存在某些偶然事件無法用高斯白噪聲來處理。例如已有生物實驗指出【68】,pRM240 突變會顯著削弱啟動子功能,進而削弱生成 CI 的能力。該突變使得溶原狀態幾乎不再穩定,并被認為對野生型中觀測到的裂解切換至少貢獻了 99%。我們將這一輸入應用到了表 II 和表 III 中。
我們使用相同的最簡模型,對所有菌株的裂解切換速率進行了重新計算,保持開關速率函數形式不變,并采用已有實驗數據【66】。所得裂解切換速率為:野生型(λ?)為 2×10??;λOR121 為 2×10??;λOR323 為 7×10??;λOR3'23' 為 5×10??。可以看出,野生型的穩定性下降了兩個數量級以上。總的來說,野生型的噪聲強度增加了約 60%,導致 CI 分布在溶原狀態下更寬。而其他生物學量(如蛋白質水平)幾乎沒有明顯變化,唯一在分子參數上的總體顯著變化是體內協同能,從 –6.4 kcal/mol 變為 –6.7 kcal/mol。模型與實驗之間總體上達成了良好的數量一致性。
事實上,自然科學中的任何數學建模都需要經驗輸入來完全確定其數學結構。對于噬菌體 λ 的建模,已經有大量的分子數據可用于基本鎖定模型結構。剩余的參數自由度由野生型的數據(如切換頻率)來確定。上述模型對切換頻率的低敏感性,即分子參數微小的百分比變化即可引發頻率的兩個數量級變動,正是我們建模內部一致性的一個顯著體現。這表明開關過程對某些分子參數呈指數敏感性。
除了在理論上進一步發展超越當前最簡模型之外,很明顯在實驗方面還需要進一步工作來驗證當前模型:我們模型中關于精確的體內分子參數、蛋白數量的分布及其時間相關性,應被視為有待驗證的預測。
5.5. 動力學要素的實驗測定
我們為基因調控網絡引入了四個動力學量:摩擦力、勢能、橫向力和隨機力。其中摩擦力與隨機力的強度相關。對于基因開關而言,橫向力與動力學性質無關。因此,基因開關的兩個關鍵量是摩擦力和勢能。這些量可以通過帶有分子參數的更微觀模型計算得出。本研究在定量上的成功之處,在于考慮了體內與體外的差異,以及各種噪聲的貢獻。然而,這四個量也可以通過生物學手段直接測定。
目前有三類不同類型的實驗數據可以用于確定基因開關局部勢函數的動力學要素,即降解(在物理科學中對應摩擦)和勢壘高度(見圖7)。第一類是環繞每一個表觀遺傳狀態的蛋白質分布,在數學上可以表示為:
第三類實驗數據是表觀遺傳狀態的壽命,即從一個狀態切換到另一個狀態的速率的度量。噬菌體從一種表觀遺傳生長狀態轉變為另一種狀態的概率由Kramers速率公式給出,即我們的公式(16),
其中,?Ub 是勢壘高度,w? 是嘗試頻率。w? 由摩擦力和勢壘的曲率決定。勢能的曲率與勢壘的高度以及其在最小值附近的形狀有關。因此,?Ub 可以通過其表觀遺傳狀態的壽命來確定:?Ub = ln(w?) – ln(P)。
噬菌體 λ 的基因開關是一個復雜的動力學系統。為了進行數學建模,科學家們用了幾十年時間,通過巧妙的實驗研究和艱苦的工作收集所需的參數。對于更復雜的系統,資源和時間可能限制了對每個分子元素進行如此詳細研究的能力。因此,一種對細節要求較少但仍能捕捉主要特征的方法具有重要意義。上述動力學結構分析為建立這種現象學模型提供了指導,正如圖中所示。
我們強調,在動力學結構理論中引入的各種量——摩擦力、勢梯度、橫向力以及與摩擦相關的隨機力——在給定的描述層級上都是可測量的。這些量類似于熱力學中的溫度、壓力和自由能,可以通過微觀細節確定,也可以獨立于這些細節進行測量。一旦這些量之間的關系建立起來,如公式(10)所示,我們就可以在不依賴具體細節的情況下寫出網絡的有效運動方程。
5.6. 隨機性、穩健性、協同作用與效率
從噬菌體 λ 轉錄起始過程中噪聲的重要性這一認識出發 [58],隨機性在生物過程動力學建模中的重要性正日益受到重視 [106–108]。研究表明,在生物過程中同時存在內源性和外源性噪聲,并已在理論上得到分析 [90–93]。采用公式(17)所表達的參數化形式,是一種同時考慮這兩種噪聲影響的方法。
穩健性被認為是生物過程中的核心特征之一 [109–111],大量最新研究進一步確立了其重要性 [112–117]。結合隨機性,本文綜述的研究 [9,64] 建立了一個量化的穩健性判據——公式(16)。在公式(10)中出現的勢能景觀函數 U(N),源于隨機動力學,為穩健性提供了圖像化的表達。這些結果再次確認了噪聲的重要性。
最后,我們希望指出,從進化的角度來看,一個完全剛性的系統,即一種絕對穩健、毫無柔性的系統,是無法存活的 [118,119]。這種結構將無法通過嚴苛的進化過程。這一點可通過前述的開關效率例子來說明。噬菌體 λ 在受到刺激時能從溶原狀態切換至裂解狀態 [8],也體現了這種柔性。這一特性可以通過當前的最簡模型捕捉,盡管在這一方向上尚無詳盡的數學分析發表。因此,隨機性似乎在理解穩健性與柔性之間的關系中起到了關鍵紐帶作用。我們相信,從進化角度來看,這一特性確實是可以被理解的 [119]。
6 數學建模的視角
6.1. 最小量化模型的主要預測
我們已經展示了,得益于持續的理論與實驗努力,最小量化模型達到了與實驗生物數據的量化一致性。新的預測,例如蛋白質分布,已在文獻[9]中提出并討論。關于協同能量的預測,成為了理論和實驗工作成功的一個重要標志。
自1980年代以來,研究發現,即使允許體內外參數值存在多達30%的差異[51],使用已知的參數約束也很難對λ基因開關的穩定性進行建模[48,57]。研究發現,協同能量在其中起到了重要作用[120,121]。因此,有人假設,除了最小模型外,還需要其他效應。一種最有前景的效應就是更強的協同作用。事實上,除了理論需要外,實驗上也發現了這種附加效應——環路效應[89,97]。
四年前,現有四位作者開始對λ噬菌體進行數學研究。然而,盡管當時我們嘗試了所有已知的方法,仍無法解決穩定性難題。實際上,我們面臨的情況與文獻[57,67]中的報告類似。我們遇到的一個主要問題是,即使允許在體內外差異的名義下大幅度變化參數值,參數空間仍然太大,難以進行有效的研究。這一困難在文獻[51]中的回顧中部分得到了驗證,其中參數值的變化似乎不足以在最小量化模型中解釋實驗結果。出于這種挫敗感,三年前我們意識到,必須要有一個有效的穩定性量化標準。結果表明,源自物理學和生物學的景觀思想似乎正是一個合適的候選方案。在這種量化需求的推動下,快速發現了一種數學上一致的構建景觀函數的方法。通過這一新方法,探索更大的參數空間變得相對容易。于是,找到一個關鍵參數——協同能量,該值需要加倍才能達到期望的穩定性,表II中標注的協同能量值為-3.7 kcal/mol,這個值是文獻[51]中嘗試的值的大約兩倍。
有趣的是,這一值確實在獨立的生物實驗中被觀察到了[89]。在撰寫此綜述時,我們進一步注意到,這個較大的值在基于熱力學考慮的獨立理論研究中也被認為是可能的[88]。考慮到所有這些獨立的努力:理論研究[9,88]和實驗研究[89,97],成功的[64]和失敗的[51],本文作者認為,理論預測[64]與實驗值[89]之間關于協同能量的這種一致性可能并非偶然。這表明,最小量化模型確實可能捕捉到了該基因開關的核心生物特征,并首次作出了非平凡且已驗證的預測。
6.2. 與其他建模方法的關系
在生物建模和生物計算領域,已經有大量的文獻。本文無法全面評述各種方法,但我們希望通過以下兩種分類方式,從數學和科學結構的角度將我們的方法放入更廣泛的背景中。
從數學角度來看,建模可以根據其是否為離散的或連續的,是否為確定性或隨機性進行分類。確定性和離散的經典建模是布爾邏輯電路 [122]。Shea 和 Ackers [48] 以及其他人 [57,123,124] 的工作是確定性和連續建模的典范。隨機性和連續建模的例子包括 Arkin 等人 [58] 和 Aurell 與 Sneppen [59]。自然,也有結合了不同特征的方法。Tchuraev 和 Galimzyanov [125] 的連續與離散建模的混合便是一個很好的例子。根據這一分類,最簡單的方法是基于布爾邏輯電路的建模。它顯然是一個近似,但在許多情況下能很好地服務于特定的生物學目的。實際上,這種方法目前是生物學中主流的建模和呈現方法。最困難但也最詳細的建模是連續和隨機性的公式化方法。它的許多預測本質上是概率性的,與生物現象高度契合。我們目前的方法屬于這一類。然而,我們應該指出,沒有任何一種方法比其他方法絕對更好。建模方法的選擇必須適應所研究的生物學問題。
從科學結構角度來看,建模可以分為第一性原理建模和完全經驗建模。人們認為,化學反應和其他物理過程是各種生物過程背后的基礎。因此,基于物理-化學原理,應該能夠預測生物學功能。這種第一性原理的建模方法被 Shea 和 Ackers [48]、Reinitz 和 Vaisnys [57] 以及許多其他人 [58,59,123] 采用。我們的方法也屬于這一類。第一性原理建模的優點在于它展示了科學的統一性,并且可以從較低層次的科學描述中獲得額外的見解和信息。這種建模的明顯缺點是,除了需要指定所有微觀參數的困難外,高層過程通常會顯示出涌現現象。基于系統組件特性的預測變得非常困難。噬菌體 λ 基因開關的杰出穩定性難題 [51,59],以及為定量建模其行為所付出的巨大努力 [9,48,51,57-59,67],清晰地展示了這一情況。
與第一性原理建模相比,另一種極端方法是將所研究的系統視為獨立的,完全從經驗研究中推斷其特性。在這種方法中,統計分析方法占主導地位。這種建模的優點在于它建立了研究科學層的獨立角色。它與在每個科學層次上可以揭示獨立規律的觀點一致。憑借生物學的見解,這種方法已在許多生物學研究中成功應用。Waddington [126] 關于發育景觀的提議以及 Monod 和 Jacob [127] 關于基因調控機制的提議就是這種優秀的例子。實際上,特別是在分子生物學中,通常遇到的是介于這兩種極端之間的情況,正如布爾邏輯電路建模 [122] 和其他研究所示 [123-125,128]。有趣的是,即使在經驗建模的背景下,我們的方法也有直接和透明的連接,可以參見第5.5節中對經驗數據的討論,盡管它根植于第一性原理建模。這表明我們的方法也可以在這一極端中使用。應該進一步進行這一方向的研究。
統計分析還表明了數學建模中的一個重要問題:變量的數量及相關的“維度災難”問題。關于數據與適當建模方法的匹配,另一個問題是“實驗數據的簡約性”,這一問題在目前的實時建模中尤為突出。我們在此不討論這些問題。
為了總結當前新方法——隨機動力學結構分析的獨特特點,從數學上看,它是一種連續且隨機的公式化方法,包含四個動力學元素。從科學結構的角度來看,它等同于第一性原理建模。然而,它可以直接與經驗數據相關聯,從而建立其自主性。
6.3. 文獻采樣
首先,Ptashne [8] 關于噬菌體 λ 的書籍是必讀之作,其中可以找到2004年前實驗工作的一篇出色綜述。由于 λ 抑制子和 lac 操作子在當前分子和合成生物學研究中具有重要作用,Mulller-Hill [129] 的書籍也是必讀之作。關于噬菌體 λ 早期研究的良好總結可以參考文獻 [130]。更廣泛且近期的綜述可參考文獻 [131]。
關于從開關角度回顧的最新噬菌體 λ 研究,文獻 [132] 是一個很好的起點。在那里,研究人員識別出了五個與發育過程相關的開關。文獻 [67] 將穩定性難題進行了深刻的聚焦。環化研究在文獻 [88] 中進行了理論探討,在文獻 [89, 97] 中進行了實驗研究。從進化的角度來看,噬菌體的研究可以參考文獻 [133]。關于 Cro 的作用,更多研究可以在文獻 [84] 和 [85] 中找到。文獻 [134] 和 [135] 實驗中報告了更多有趣的動態行為。文獻 [136] 中理論上考慮了降解時間對穩定性的影響。關于基因開關的其他特征,最近在文獻 [137-142] 中得到了進一步探討。
7 噬菌體的第三個時代
由于噬菌體在地球生物圈中的巨大生物量,噬菌體的重要性已經在當前的生態學研究中得到了認可【47,143,144】,本節標題借用了文獻【144】中的內容。本章中理論努力的展示表明,噬菌體在后人類基因組時代的基礎生物學研究中也發揮著重要作用,實驗研究亦是如此【145】。
基因調控網絡的定量和詳細建模顯然才剛剛開始。存在超越本文回顧的最小定量模型的數值可能性。例如,即使對于噬菌體λ基因開關,當前的模型也是一種簡化。理想的情況是,能夠定量展示通過引入更多自由度(如左操作子)如何產生一些體內和體外差異,以及這些差異的定量變化。進一步的擴展將是對λ發育過程中的所有五個開關進行建模【132】,以獲得對整個過程的全面定量理解。深刻的生物學問題,例如為什么噬菌體選擇這樣的結構,或者是什么進化原則指導了這一選擇【66,128】,尚未得到充分討論。
盡管如此,我們確實希望指出,噬菌體λ基因開關的研究揭示了一種新的數學結構【9】,并且已經將生物學中根深蒂固的一個概念——景觀【126,146-148】——重新建立在堅實的數學和生物學基礎上。最近的定量噬菌體研究【9,49-51,58,59,66,67,74-76,132-142】將我們對系統生物學的理解提升到了另一個層次,補充了高通量和大規模分析。應該對其研究充滿樂觀,認為它將產生更多新的生物學理解,并且對生物學之外的領域產生影響,正如生物學已經啟發了普遍系統理論【149】和控制論【150】。考慮到其過去輝煌的成功(例如,可以數一數多少諾貝爾生理學和醫學獎以及化學獎得主出現在 http://www.asm.org/division/m/blurbs/secrets.html#top),我們有信心,更多的發現正等著我們。
原文鏈接:https://arxiv.org/abs/q-bio/0512007
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.