國內互聯網應用非常發達,日常生活的方方面面都可以在手機上完成,便捷程度可以說是世界領先,但是作為程序員,我們非常清楚,這個繁榮的互聯網大廈的根基并不穩定,因為它是建立在國外的芯片、操作系統、編譯器、數據庫、開發工具等基礎之上。
這幾年,某些國家主動挑起貿易和科技摩擦,試圖打壓中國的和平發展。互聯網大廈的根基,自然成為重點的打擊對象。
所以中國必須要實現自主可控,“信創“就是在這種背景下被提了出來。
從產業鏈角度看,“信創“包括四個部分:基礎硬件、基礎軟件、應用軟件、信息安全。其中,CPU、操作系統、數據庫、中間件是最重要的產業鏈環節。
信創的發展政策是2+8+N ,“2”是指黨政,是信創產業發展的首要領域,“8”是金融、電力、電信、石油、交通、教育、醫療、航空航天等關于國計民生的八大行業,也是信創產業發展的重點行業。
如果觀察下數據庫領域的話,黨政領域的數據庫國產替代率高達80%,基本處于替換的尾聲階段,其他領域還比較低。以金融業為例,銀行核心系統的國產數據庫替代率15%左右;證券和保險核心系統的國產數據庫替代率不超過20%。
01
為什么國產化替代這么難?
應用程序可以隨著技術的發展不斷變化,但是程序運行依賴的數據非常穩定。
尤其是金融業,國家網絡安全和金融監管部門對金融行業有著嚴格的合規性要求,
它的核心數據經過幾十年的沉淀,是非常寶貴的財富,數據庫的遷移一旦出錯,損失難以估量,所以沒有人敢輕易動它。
就拿使用廣泛的Oracle來說,要想平滑地替換它,必須要兼容它的SQL語法,存儲過程語法,用戶自定義函數,數據類型,安全加密….. 這還不算,還得考慮衍生工具和中間件。
也就是說,新數據庫必須得實現語法、語義、高級特性和生態的高度兼容,穩定性、性能、可靠性也經受住了真正的考驗,用戶才敢動手遷移,這是非常難的事情。
之前靠堆人力、堆機器的方法來實現替換,在今天完全不適用,強安全、穩保障、全兼容、零修改、高抗壓、高可用是金融行業的生命線,特別是在大壓力場景下,性能和可用性必須全面對標國際標桿。
另外一方面,現在大數據、云計算、AI+時代,出現了新需求、新場景、新模式,金融行業也需要做創新,對數據多樣性,數據處理的新鮮度和融合性也提出了更高的要求,想要做國產化替代,還得滿足金融業的新需求。
02
誰能實現核心場景1:1平替?
雖然國產化替代很難,但國內有一家企業,卻成功實現了核心場景的1:1平替,這就是崖山數據庫。
崖山數據庫提出了一個更經濟、更普適的規模化替代方案,替換過程中可以實現“三個不變,兩個對等,一個更優”。
“三個不變“指的是架構、應用、運維不變。在架構層面實現和國際標桿Oracle的完全對等,應用層面無需做額外改造,運維層面可直接復用原有數據庫產品的生態和技術。“兩個對等”即“性能和可用可靠性對等”;“一個更優”即“安全性更優”。
基于這樣的替代方案,相對于應用系統重構典型業務場景,崖山1:1平替方案可以實現更低的基礎設施成本和人力成本,提供更經濟、更普適的規模化替換路徑。
在金融行業,核心系統的數據庫都是共享集群,即單庫多實例的系統,用戶連接任意實例都可以訪問同一個數據庫,具備透明多寫、高可用、高性能等特性。共享集群技術因其開發難度高,一直被國外壟斷,也被稱為數據庫領域的“塔尖”技術。
崖山數據庫也攻破了這個核心技術,最近發布的共享集群V23.3更是進一步提升了高并發事務處理能力,集群規模和優化能力,集群4節點TPCC已經達520萬tpmC(每分鐘處理交易量),而且全國產環境下,TPCC測試性能已達到非國產環境下Oracle的同等水平!
03
為什么是崖山數據庫?
可能有些人會好奇,崖山為什么能在短短幾年里從零做出一款全自研的數據庫,還能突破共享集群這樣的塔尖技術?
答案很簡單:主要在于人,在于團隊。
崖山數據庫最大的競爭力就是有著一只不可復制的團隊,有非常優秀,天才橫溢的青年科學家,也聚集了中國非常難得的、堅持坐十年冷板凳的數據庫內核工匠。
樊文飛院士是崖山數據庫的帶頭人,也是數據庫領域歷史上僅有的兩個“大滿貫”學者之一。他提出的有界計算理論(bounded evaluation)和數據驅動的近似計算(data-driven approximation)理論橫掃計算機理論和系統大獎。
崖山團隊成員中有超過30位來自北大、清華等全球知名學府的博士研究生,以及超50位擁有十年以上數據庫內核開發經驗的專業人才。整個團隊達300余人規模,其中20%人才畢業于世界排名前100的名校,實力非常強悍。
崖山一直堅持全自研路線,踐行長期主義,一開始就選擇了最難的路:從第一行代碼開始寫起,完全自研。
深度掌握了數據庫的底層架構,就進入了“自由的王國”,可以“為所欲為”,既可以在數據庫中實現自己創新的理論,還可以壓榨出極致的性能。
比如事務處理,業界主要的事務處理有 MVCC(多版本并發控制)、OCC(又名樂觀鎖)和 PCC(又名悲觀鎖)。崖山數據庫則實現了樊文飛院士提出的并發事務調度方式,結合了 MVCC 和 OCC 的優勢,使得在高并發場景下,系統不受核數改變的影響,而且整體成本可控。
崖山團隊不僅實現了傳統數據庫的功能,還把先進的數據庫理論(例如有界計算、跨模融合、異步自適應并行處理AAP等)帶入了崖山數據庫當中,應對大數據和AI時代帶來的新挑戰,成功實現彎道超車。
04
總結
“三個不變、兩個對等、一個更優”,崖山數據庫面向金融核心實現了1:1平替,在保證平穩替換的前提下,實現更低的基礎設施成本和人力成本,進而實現業務價值創新。
崖山數據庫依靠原創的基礎理論,根技術的突破以及系統工程能力的持續積累,實現了“三位一體”全方位突破,這也是他們對標國際巨頭的最大底氣。
崖山團隊很有信心,他們在官網開放了V23全面版本的下載,主備共享集群、分布式能力完全毫無保留,沒有任何限制也沒有任何門檻,連注冊都不用,可以直接下載。你拿到的版本和在用戶場景使用的企業級版本沒有任何區別,表現出了十足的誠意。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.