十八世紀(jì)初,歐洲名城普魯士的哥尼斯堡邊上有一條河,河中有兩座小島,有七座橋把兩個(gè)島和兩岸連接。一個(gè)人怎么樣才能不重復(fù)地一次走完這七座橋,最后回到起點(diǎn)?
1736年,數(shù)學(xué)家歐拉提交了一篇名為《哥尼斯堡的七座橋》的論文,詳細(xì)討論了七橋問題的解決思路,被認(rèn)為是關(guān)于圖論最早的研究。當(dāng)時(shí)的歐拉一定不會想到,289年后的今天,知識圖譜、圖計(jì)算引擎、圖智能技術(shù)等和“圖”相關(guān)的概念正在攪動整個(gè)科技界。
在無數(shù)為此奮斗的身影里,張晨和吳菁是特殊的存在。他們是浙大竺可楨學(xué)院首屆畢業(yè)生,一對令人羨慕的神仙眷侶,海外學(xué)成歸來后在西子湖畔創(chuàng)辦了一家叫“創(chuàng)鄰”的圖數(shù)據(jù)庫公司,成為圖智能領(lǐng)域的技術(shù)引領(lǐng)者,其自主研發(fā)的Galaxybase圖平臺精準(zhǔn)補(bǔ)齊了我國基礎(chǔ)軟件中圖數(shù)據(jù)庫的短板,產(chǎn)品技術(shù)能力已經(jīng)達(dá)到世界前列。
攝影 陳中秋 海報(bào)設(shè)計(jì) 李前芳
廣東最好的高中是哪個(gè)?
曾經(jīng)很長一段時(shí)間,張晨和吳菁時(shí)不時(shí)會因?yàn)閺V東第一高中是華師大附中還是深圳中學(xué)展開家庭討論,他倆都認(rèn)為自己的母校是最好的,誰也說服不了誰。
25年前,張晨和吳菁分別從這兩所在全國都有名的高中保送至浙江大學(xué),并且成為2000級浙大第一屆竺可楨混合班的同班同學(xué)。命運(yùn)之神用紅線將他們的未來緊緊捆綁,開啟了一同求學(xué)、一同創(chuàng)業(yè)的緣分。
直到現(xiàn)在,吳菁依然記得她和張晨在20年前的一場針對計(jì)算機(jī)未來發(fā)展的爭論,當(dāng)時(shí)張晨說今后所有的計(jì)算都將在遠(yuǎn)端,由遠(yuǎn)端的多臺機(jī)器去協(xié)同給機(jī)器進(jìn)行服務(wù),其實(shí)就是現(xiàn)在被證明了的“云計(jì)算”概念。當(dāng)時(shí)吳菁還不相信:“誰會把那么重要的數(shù)據(jù)放在遠(yuǎn)端,數(shù)據(jù)安全的問題誰來考慮?”
從本科時(shí)期起,張晨就對分布式并行計(jì)算很有興趣,認(rèn)為計(jì)算多節(jié)點(diǎn)協(xié)同是未來的趨勢。本碩畢業(yè)后在加拿大滑鐵盧大學(xué)讀博期間,張晨也是從事基于Hadoop(分布式系統(tǒng)基礎(chǔ)架構(gòu))的科研,這和他本科畢業(yè)設(shè)計(jì)分布式并行方向一致,他也成為全球第一批做大數(shù)據(jù)平臺科研的博士之一。
浙大之后,吳菁讀了荷蘭萊頓大學(xué)的碩士,她選擇的是一個(gè)計(jì)算機(jī)和商科的交叉學(xué)科,后來讀麥吉爾大學(xué)管理信息系統(tǒng)博士時(shí),主要研究的是社交網(wǎng)絡(luò),博士課題是關(guān)于企業(yè)決策人在社交網(wǎng)絡(luò)里面的位置對企業(yè)的弱信號處理能力(敏捷響應(yīng)環(huán)境變化)的影響研究。
現(xiàn)在看來,兩人的求學(xué)生涯雖有不同,但最終走向的都是關(guān)于“關(guān)系”的研究,和目前夫妻倆正在做的圖數(shù)據(jù)庫緊密相關(guān)。
從加拿大毅然回杭創(chuàng)業(yè)
學(xué)生生涯結(jié)束后,張晨成為美國運(yùn)通公司的大數(shù)據(jù)科學(xué)家。有一天他接到一通電話:“對方說讓我延續(xù)夢想,我還以為是騙子。”其實(shí)是他的博士論文成果,被硅谷一家名叫Splice Machine的公司進(jìn)行了產(chǎn)品化,成了他們的核心底層技術(shù)。
隨后,張晨也進(jìn)入那家公司研究分布式數(shù)據(jù)庫,并在工作積累中有了創(chuàng)業(yè)的契機(jī)。“在服務(wù)大型企業(yè)客戶的過程中,我發(fā)現(xiàn)業(yè)務(wù)中開始出現(xiàn)二三十個(gè)多表關(guān)聯(lián)的需求,需要做海量的數(shù)據(jù)大規(guī)模關(guān)聯(lián)查詢,很難用現(xiàn)有的數(shù)據(jù)庫技術(shù)解決。”
2015年,張晨和吳菁經(jīng)過深思熟慮后決定在加拿大創(chuàng)業(yè)。“市場上大客戶有了更復(fù)雜的數(shù)據(jù)關(guān)聯(lián)需求;專業(yè)上,我擅長的是做分布式并行計(jì)算,吳菁擅長的是大規(guī)模網(wǎng)絡(luò)分析,我懂?dāng)?shù)據(jù)存儲技術(shù),她懂?dāng)?shù)據(jù)建模分析,非常互補(bǔ)。”就這樣,Graph Intelligence正式成立。兩人抱著簡單的初心,想用一種可以高效聯(lián)通數(shù)據(jù)的技術(shù),釋放數(shù)據(jù)資產(chǎn)的價(jià)值,賦能各行各業(yè)。
創(chuàng)業(yè)以來,張晨負(fù)責(zé)投資、公司戰(zhàn)略等,吳菁負(fù)責(zé)組織管理建設(shè),兩人是最默契的搭檔,也是最懂彼此的人。
2015年底,張晨回國參加浙江大學(xué)竺可楨學(xué)院的校友會,意外邂逅了在杭州創(chuàng)業(yè)的師兄,兩人聊起國內(nèi)有海量的數(shù)據(jù)和豐富的數(shù)據(jù)關(guān)聯(lián)場景,政府的人才項(xiàng)目也鼓勵海歸回國創(chuàng)業(yè)。
當(dāng)時(shí)Graph Intelligence也正面臨市場選擇,有專家表示未來中國或者印度會成為大數(shù)據(jù)的重要市場。內(nèi)外因素促使張晨決定回國創(chuàng)業(yè),吳菁也很高興:“回杭州我是非常開心的,這里有我們的母校、很多朋友,我特別喜歡這座城市。”
公司起名叫“創(chuàng)鄰”,取自英文create link,寓意“創(chuàng)造連接”。張晨認(rèn)為,數(shù)據(jù)關(guān)聯(lián)已成為當(dāng)下大數(shù)據(jù)時(shí)代紅利,如何打通數(shù)據(jù)孤島、為數(shù)據(jù)搭橋,是現(xiàn)今企業(yè)面臨的共同問題,也是圖技術(shù)存在的本質(zhì)價(jià)值和意義。
怎么找到關(guān)于“我”的全部信息?
什么是圖?這里的“圖”并不是圖片的意思,而是將客觀世界的人、事、物抽象成“點(diǎn)”,將之間的關(guān)系抽象成“邊”。任何可以用“關(guān)系”定義的客觀事物,都可以用圖模型有效表達(dá)。
張晨有一個(gè)更為通俗的解釋:“想象一下,如果一個(gè)房間里攤滿了幾百份文件,你想找出和我有關(guān)的全部信息,如何用最高效的方式實(shí)現(xiàn)?”他假設(shè)每一個(gè)信息就是一個(gè)水晶球,但凡與 “我”相關(guān)的信息就用水晶線連接起來。
“當(dāng)你牽動‘我’這個(gè)水晶球就可以一連串地得到各個(gè)文件中所有關(guān)于我的數(shù)據(jù)。”張晨說,圖數(shù)據(jù)庫就是編織這張水晶球和水晶線組成的信息網(wǎng)絡(luò)的工具,圍繞一個(gè)主體,把所有相關(guān)的海量信息高效地組織起來,改變了我們存儲和處理數(shù)據(jù)的方式。
大家都知道“蝴蝶效應(yīng)”,就是在海量的數(shù)據(jù)和信息中,去捕捉看似毫無關(guān)聯(lián)但實(shí)際環(huán)環(huán)相扣的聯(lián)系,從數(shù)據(jù)處理架構(gòu)的角度來看,如果沒有圖技術(shù)的幫助是極難實(shí)現(xiàn)的。
那么,圖數(shù)據(jù)庫又是什么?
我們知道,數(shù)據(jù)存儲除了存儲本身,更是為了解決復(fù)雜查詢以及深度計(jì)算的數(shù)據(jù)問題,圖數(shù)據(jù)庫就具備了符合人類大腦思維習(xí)慣的高維表達(dá)能力——所想(見)即所得。
以汽車制造為例,一輛汽車需要上萬個(gè)零部件組裝,背后則是成百上千家供應(yīng)商,完整的供應(yīng)鏈遍布全國甚至全球,如何高效管理和協(xié)同就成了一個(gè)大問題。
“比如供應(yīng)鏈涉及眾多關(guān)聯(lián)關(guān)系,供應(yīng)商之間的上下游關(guān)系、零部件之間的組裝關(guān)系、生產(chǎn)流程中的依賴關(guān)系、物料在倉庫間的流轉(zhuǎn)關(guān)系等等,這些關(guān)系在被捕捉、組織成為圖結(jié)構(gòu)后,就可以形成動態(tài)、全局、可視化供應(yīng)鏈網(wǎng)絡(luò)圖譜,進(jìn)而支持企業(yè)做出更實(shí)時(shí)、更智能化的決策。”張晨介紹。
再比如,創(chuàng)鄰和銀行的合作,為成千上萬張信用卡建立“圖數(shù)據(jù)庫”,從里面發(fā)現(xiàn)盜刷團(tuán)伙的蛛絲馬跡。
也就是說,圖數(shù)據(jù)庫具備完善的關(guān)聯(lián)關(guān)系挖掘能力,支持海量供應(yīng)鏈數(shù)據(jù)實(shí)時(shí)入庫,毫秒/秒級返回多跳間接關(guān)聯(lián)對象的查詢結(jié)果,輸出數(shù)據(jù)驅(qū)動的實(shí)時(shí)洞察,并且反饋到生產(chǎn)線上,加速企業(yè)進(jìn)行智能化生產(chǎn)調(diào)度和管理。
今年年初橫空出世的DeepSeek讓很多人養(yǎng)成了有問題就去問一問的習(xí)慣,但相同一個(gè)問題DeepSeek可能會給出不同的答案,并且它就像一個(gè)“黑盒”,這個(gè)答案如何被推導(dǎo)得出的具體細(xì)節(jié)是無從追溯的,這也讓對錯(cuò)誤答案的即時(shí)修改變得不可能,給大模型在追求確定性、準(zhǔn)確性的企業(yè)中落地造成了很大的困難。
相比之下,圖技術(shù)更像是一個(gè)“白盒”,通過將企業(yè)數(shù)據(jù)組織成知識圖譜、資產(chǎn)圖譜,用圖數(shù)據(jù)庫我們就能查到確定、可追溯推理依據(jù)的答案。
成為互聯(lián)網(wǎng)大廠的競爭對手
經(jīng)過近十年的發(fā)展,創(chuàng)鄰科技已擁有多項(xiàng)具備自主知識產(chǎn)權(quán)的核心技術(shù),成為我國在圖數(shù)據(jù)存儲、處理及應(yīng)用領(lǐng)域佼佼者,創(chuàng)鄰科技的成功,也驗(yàn)證了兩位創(chuàng)始人的初心。
張晨笑稱:“一路卷過來,競爭對手都成螞蟻、華為等大廠了。”經(jīng)過近十年的積累,公司服務(wù)的客戶也都是如農(nóng)業(yè)銀行、民生銀行、交行卡中心、公安、國家電網(wǎng)等頭部單位。
在吳菁眼里,圖數(shù)據(jù)庫技術(shù)還是一個(gè)青年,正處于一個(gè)成長上升期,是未來趨勢技術(shù)和所有數(shù)據(jù)庫品類中增長最快的一類。“市場的想象空間巨大,因?yàn)楦餍懈鳂I(yè)都需要做實(shí)時(shí)智能的商業(yè)決策,都需要高效關(guān)聯(lián)的數(shù)據(jù),這就是圖數(shù)據(jù)庫的未來。”
與此同時(shí),很多人對圖、圖計(jì)算、圖數(shù)據(jù)庫等概念并不清楚。“我們總覺得有一種責(zé)任感,推進(jìn)這個(gè)技術(shù)被更多的人了解和認(rèn)識,需要一個(gè)懂行的人站出來做科普。”
“創(chuàng)業(yè)就是創(chuàng)自己,要在時(shí)代趨勢下選擇做困難且正確的事。”張晨說,公司第一款產(chǎn)品的第一版代碼是自己一個(gè)個(gè)敲出來的,而后他又帶領(lǐng)團(tuán)隊(duì)一個(gè)字一個(gè)字敲出了一本科普書籍《圖數(shù)據(jù)庫:理論與實(shí)踐》。
這本書深入淺出地介紹了圖數(shù)據(jù)庫的底層技術(shù)原理、圖算法、圖編程與金融、政府、制造等行業(yè)的應(yīng)用實(shí)操,得到了中國工程院陳純院士、加拿大工程院劉學(xué)院士、香港科技大學(xué)陳雷教授、騰訊云數(shù)據(jù)庫總經(jīng)理王義成等近30位學(xué)術(shù)領(lǐng)袖與業(yè)界大咖的鼎力推薦。
書里還免費(fèi)提供源代碼,以便讀者動手實(shí)踐,一經(jīng)發(fā)售就榮登京東“數(shù)據(jù)庫圖書榜”熱賣榜第二名,出版不到三個(gè)月便二次印刷,近日還再版了繁體中文版,以便臺灣、香港、澳門及其他海外華人地區(qū)的讀者深度了解圖技術(shù)。
“這樣的科普不一定即刻會對公司和業(yè)務(wù)產(chǎn)生直接的效應(yīng),但如果整個(gè)行業(yè)繁榮了,作為行業(yè)里技術(shù)和產(chǎn)品的中堅(jiān)力量,企業(yè)一定會間接受益。”從去年9月開始,吳菁開設(shè)了個(gè)人賬號,抱著試試水的態(tài)度,分享一些圖技術(shù)應(yīng)用和企業(yè)管理的心得體會。
最近,夫妻倆的視頻賬號“吳菁&張晨”上線,第一期講述了《海歸博士夫妻回杭創(chuàng)業(yè)》的故事,獲得了數(shù)萬播放,600多個(gè)點(diǎn)贊,超1000次的轉(zhuǎn)發(fā),底下很多人評論他倆為圖數(shù)據(jù)領(lǐng)域的神仙眷侶。
喬布斯曾說過:Creativity lies in the ability to connect the dots,意思是說創(chuàng)新源于把零散信息連接整合的能力,張晨和吳菁也堅(jiān)信圖技術(shù)是未來數(shù)據(jù)資產(chǎn)化中不可或缺的模塊,是數(shù)字化企業(yè)創(chuàng)新的新引擎。
文 | 劉永麗
VIEW MORE
@一舉包攬全球前三,杭州成了開源大模型之城?>>
@AI智能體“實(shí)在人” >>
@我們用吉普力的畫風(fēng)重新演繹“來自東方的力量” >>
@Deep家族再添一員>>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.