十八世紀初,歐洲名城普魯士的哥尼斯堡邊上有一條河,河中有兩座小島,有七座橋把兩個島和兩岸連接。一個人怎么樣才能不重復地一次走完這七座橋,最后回到起點?
1736年,數(shù)學家歐拉提交了一篇名為《哥尼斯堡的七座橋》的論文,詳細討論了七橋問題的解決思路,被認為是關于圖論最早的研究。當時的歐拉一定不會想到,289年后的今天,知識圖譜、圖計算引擎、圖智能技術等和“圖”相關的概念正在攪動整個科技界。
在無數(shù)為此奮斗的身影里,張晨和吳菁是特殊的存在。他們是浙大竺可楨學院首屆畢業(yè)生,一對令人羨慕的神仙眷侶,海外學成歸來后在西子湖畔創(chuàng)辦了一家叫“創(chuàng)鄰”的圖數(shù)據(jù)庫公司,成為圖智能領域的技術引領者,其自主研發(fā)的Galaxybase圖平臺精準補齊了我國基礎軟件中圖數(shù)據(jù)庫的短板,產(chǎn)品技術能力已經(jīng)達到世界前列。
攝影 陳中秋 海報設計 李前芳
廣東最好的高中是哪個?
曾經(jīng)很長一段時間,張晨和吳菁時不時會因為廣東第一高中是華師大附中還是深圳中學展開家庭討論,他倆都認為自己的母校是最好的,誰也說服不了誰。
25年前,張晨和吳菁分別從這兩所在全國都有名的高中保送至浙江大學,并且成為2000級浙大第一屆竺可楨混合班的同班同學。命運之神用紅線將他們的未來緊緊捆綁,開啟了一同求學、一同創(chuàng)業(yè)的緣分。
直到現(xiàn)在,吳菁依然記得她和張晨在20年前的一場針對計算機未來發(fā)展的爭論,當時張晨說今后所有的計算都將在遠端,由遠端的多臺機器去協(xié)同給機器進行服務,其實就是現(xiàn)在被證明了的“云計算”概念。當時吳菁還不相信:“誰會把那么重要的數(shù)據(jù)放在遠端,數(shù)據(jù)安全的問題誰來考慮?”
從本科時期起,張晨就對分布式并行計算很有興趣,認為計算多節(jié)點協(xié)同是未來的趨勢。本碩畢業(yè)后在加拿大滑鐵盧大學讀博期間,張晨也是從事基于Hadoop(分布式系統(tǒng)基礎架構)的科研,這和他本科畢業(yè)設計分布式并行方向一致,他也成為全球第一批做大數(shù)據(jù)平臺科研的博士之一。
浙大之后,吳菁讀了荷蘭萊頓大學的碩士,她選擇的是一個計算機和商科的交叉學科,后來讀麥吉爾大學管理信息系統(tǒng)博士時,主要研究的是社交網(wǎng)絡,博士課題是關于企業(yè)決策人在社交網(wǎng)絡里面的位置對企業(yè)的弱信號處理能力(敏捷響應環(huán)境變化)的影響研究。
現(xiàn)在看來,兩人的求學生涯雖有不同,但最終走向的都是關于“關系”的研究,和目前夫妻倆正在做的圖數(shù)據(jù)庫緊密相關。
從加拿大毅然回杭創(chuàng)業(yè)
學生生涯結束后,張晨成為美國運通公司的大數(shù)據(jù)科學家。有一天他接到一通電話:“對方說讓我延續(xù)夢想,我還以為是騙子。”其實是他的博士論文成果,被硅谷一家名叫Splice Machine的公司進行了產(chǎn)品化,成了他們的核心底層技術。
隨后,張晨也進入那家公司研究分布式數(shù)據(jù)庫,并在工作積累中有了創(chuàng)業(yè)的契機。“在服務大型企業(yè)客戶的過程中,我發(fā)現(xiàn)業(yè)務中開始出現(xiàn)二三十個多表關聯(lián)的需求,需要做海量的數(shù)據(jù)大規(guī)模關聯(lián)查詢,很難用現(xiàn)有的數(shù)據(jù)庫技術解決。”
2015年,張晨和吳菁經(jīng)過深思熟慮后決定在加拿大創(chuàng)業(yè)。“市場上大客戶有了更復雜的數(shù)據(jù)關聯(lián)需求;專業(yè)上,我擅長的是做分布式并行計算,吳菁擅長的是大規(guī)模網(wǎng)絡分析,我懂數(shù)據(jù)存儲技術,她懂數(shù)據(jù)建模分析,非常互補。”就這樣,Graph Intelligence正式成立。兩人抱著簡單的初心,想用一種可以高效聯(lián)通數(shù)據(jù)的技術,釋放數(shù)據(jù)資產(chǎn)的價值,賦能各行各業(yè)。
創(chuàng)業(yè)以來,張晨負責投資、公司戰(zhàn)略等,吳菁負責組織管理建設,兩人是最默契的搭檔,也是最懂彼此的人。
2015年底,張晨回國參加浙江大學竺可楨學院的校友會,意外邂逅了在杭州創(chuàng)業(yè)的師兄,兩人聊起國內(nèi)有海量的數(shù)據(jù)和豐富的數(shù)據(jù)關聯(lián)場景,政府的人才項目也鼓勵海歸回國創(chuàng)業(yè)。
當時Graph Intelligence也正面臨市場選擇,有專家表示未來中國或者印度會成為大數(shù)據(jù)的重要市場。內(nèi)外因素促使張晨決定回國創(chuàng)業(yè),吳菁也很高興:“回杭州我是非常開心的,這里有我們的母校、很多朋友,我特別喜歡這座城市。”
公司起名叫“創(chuàng)鄰”,取自英文create link,寓意“創(chuàng)造連接”。張晨認為,數(shù)據(jù)關聯(lián)已成為當下大數(shù)據(jù)時代紅利,如何打通數(shù)據(jù)孤島、為數(shù)據(jù)搭橋,是現(xiàn)今企業(yè)面臨的共同問題,也是圖技術存在的本質(zhì)價值和意義。
怎么找到關于“我”的全部信息?
什么是圖?這里的“圖”并不是圖片的意思,而是將客觀世界的人、事、物抽象成“點”,將之間的關系抽象成“邊”。任何可以用“關系”定義的客觀事物,都可以用圖模型有效表達。
張晨有一個更為通俗的解釋:“想象一下,如果一個房間里攤滿了幾百份文件,你想找出和我有關的全部信息,如何用最高效的方式實現(xiàn)?”他假設每一個信息就是一個水晶球,但凡與 “我”相關的信息就用水晶線連接起來。
“當你牽動‘我’這個水晶球就可以一連串地得到各個文件中所有關于我的數(shù)據(jù)。”張晨說,圖數(shù)據(jù)庫就是編織這張水晶球和水晶線組成的信息網(wǎng)絡的工具,圍繞一個主體,把所有相關的海量信息高效地組織起來,改變了我們存儲和處理數(shù)據(jù)的方式。
大家都知道“蝴蝶效應”,就是在海量的數(shù)據(jù)和信息中,去捕捉看似毫無關聯(lián)但實際環(huán)環(huán)相扣的聯(lián)系,從數(shù)據(jù)處理架構的角度來看,如果沒有圖技術的幫助是極難實現(xiàn)的。
那么,圖數(shù)據(jù)庫又是什么?
我們知道,數(shù)據(jù)存儲除了存儲本身,更是為了解決復雜查詢以及深度計算的數(shù)據(jù)問題,圖數(shù)據(jù)庫就具備了符合人類大腦思維習慣的高維表達能力——所想(見)即所得。
以汽車制造為例,一輛汽車需要上萬個零部件組裝,背后則是成百上千家供應商,完整的供應鏈遍布全國甚至全球,如何高效管理和協(xié)同就成了一個大問題。
“比如供應鏈涉及眾多關聯(lián)關系,供應商之間的上下游關系、零部件之間的組裝關系、生產(chǎn)流程中的依賴關系、物料在倉庫間的流轉(zhuǎn)關系等等,這些關系在被捕捉、組織成為圖結構后,就可以形成動態(tài)、全局、可視化供應鏈網(wǎng)絡圖譜,進而支持企業(yè)做出更實時、更智能化的決策。”張晨介紹。
再比如,創(chuàng)鄰和銀行的合作,為成千上萬張信用卡建立“圖數(shù)據(jù)庫”,從里面發(fā)現(xiàn)盜刷團伙的蛛絲馬跡。
也就是說,圖數(shù)據(jù)庫具備完善的關聯(lián)關系挖掘能力,支持海量供應鏈數(shù)據(jù)實時入庫,毫秒/秒級返回多跳間接關聯(lián)對象的查詢結果,輸出數(shù)據(jù)驅(qū)動的實時洞察,并且反饋到生產(chǎn)線上,加速企業(yè)進行智能化生產(chǎn)調(diào)度和管理。
今年年初橫空出世的DeepSeek讓很多人養(yǎng)成了有問題就去問一問的習慣,但相同一個問題DeepSeek可能會給出不同的答案,并且它就像一個“黑盒”,這個答案如何被推導得出的具體細節(jié)是無從追溯的,這也讓對錯誤答案的即時修改變得不可能,給大模型在追求確定性、準確性的企業(yè)中落地造成了很大的困難。
相比之下,圖技術更像是一個“白盒”,通過將企業(yè)數(shù)據(jù)組織成知識圖譜、資產(chǎn)圖譜,用圖數(shù)據(jù)庫我們就能查到確定、可追溯推理依據(jù)的答案。
成為互聯(lián)網(wǎng)大廠的競爭對手
經(jīng)過近十年的發(fā)展,創(chuàng)鄰科技已擁有多項具備自主知識產(chǎn)權的核心技術,成為我國在圖數(shù)據(jù)存儲、處理及應用領域佼佼者,創(chuàng)鄰科技的成功,也驗證了兩位創(chuàng)始人的初心。
張晨笑稱:“一路卷過來,競爭對手都成螞蟻、華為等大廠了。”經(jīng)過近十年的積累,公司服務的客戶也都是如農(nóng)業(yè)銀行、民生銀行、交行卡中心、公安、國家電網(wǎng)等頭部單位。
在吳菁眼里,圖數(shù)據(jù)庫技術還是一個青年,正處于一個成長上升期,是未來趨勢技術和所有數(shù)據(jù)庫品類中增長最快的一類。“市場的想象空間巨大,因為各行各業(yè)都需要做實時智能的商業(yè)決策,都需要高效關聯(lián)的數(shù)據(jù),這就是圖數(shù)據(jù)庫的未來。”
與此同時,很多人對圖、圖計算、圖數(shù)據(jù)庫等概念并不清楚。“我們總覺得有一種責任感,推進這個技術被更多的人了解和認識,需要一個懂行的人站出來做科普。”
“創(chuàng)業(yè)就是創(chuàng)自己,要在時代趨勢下選擇做困難且正確的事。”張晨說,公司第一款產(chǎn)品的第一版代碼是自己一個個敲出來的,而后他又帶領團隊一個字一個字敲出了一本科普書籍《圖數(shù)據(jù)庫:理論與實踐》。
這本書深入淺出地介紹了圖數(shù)據(jù)庫的底層技術原理、圖算法、圖編程與金融、政府、制造等行業(yè)的應用實操,得到了中國工程院陳純院士、加拿大工程院劉學院士、香港科技大學陳雷教授、騰訊云數(shù)據(jù)庫總經(jīng)理王義成等近30位學術領袖與業(yè)界大咖的鼎力推薦。
書里還免費提供源代碼,以便讀者動手實踐,一經(jīng)發(fā)售就榮登京東“數(shù)據(jù)庫圖書榜”熱賣榜第二名,出版不到三個月便二次印刷,近日還再版了繁體中文版,以便臺灣、香港、澳門及其他海外華人地區(qū)的讀者深度了解圖技術。
“這樣的科普不一定即刻會對公司和業(yè)務產(chǎn)生直接的效應,但如果整個行業(yè)繁榮了,作為行業(yè)里技術和產(chǎn)品的中堅力量,企業(yè)一定會間接受益。”從去年9月開始,吳菁開設了個人賬號,抱著試試水的態(tài)度,分享一些圖技術應用和企業(yè)管理的心得體會。
最近,夫妻倆的視頻賬號“吳菁&張晨”上線,第一期講述了《海歸博士夫妻回杭創(chuàng)業(yè)》的故事,獲得了數(shù)萬播放,600多個點贊,超1000次的轉(zhuǎn)發(fā),底下很多人評論他倆為圖數(shù)據(jù)領域的神仙眷侶。
喬布斯曾說過:Creativity lies in the ability to connect the dots,意思是說創(chuàng)新源于把零散信息連接整合的能力,張晨和吳菁也堅信圖技術是未來數(shù)據(jù)資產(chǎn)化中不可或缺的模塊,是數(shù)字化企業(yè)創(chuàng)新的新引擎。
文 | 劉永麗
VIEW MORE
@一舉包攬全球前三,杭州成了開源大模型之城?>>
@AI智能體“實在人” >>
@我們用吉普力的畫風重新演繹“來自東方的力量” >>
@Deep家族再添一員>>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.