當(dāng)大模型的競賽延續(xù)到2025年,原本就已經(jīng)顯露出融資遇冷趨勢的國內(nèi)AI六小虎,又被DeepSeek引發(fā)出一輪價值重估的新挑戰(zhàn)。
但在上述壓力之下,“清華幫”靈魂人物唐杰帶領(lǐng)的智譜,第一個站出來打破了外界的部分質(zhì)疑,靠的則是近期完成了一輪10億元人民幣新融資。
值得一提的亮點是,投資陣營中出現(xiàn)了杭州城投產(chǎn)業(yè)基金、上城資本的身影,而杭州恰恰是DeepSeek的“據(jù)點”。
脫胎于清華教授唐杰帶領(lǐng)研發(fā)的Aminer項目,智譜從一開始就有濃厚的“科研味”,也是“清華幫”的典型代表。
成立于2019年的智譜,匯集了一幫清華“大牛”,CEO張鵬本碩博均畢業(yè)于清華,董事長劉德兵、總裁王紹蘭同為清華校友。
一成立,智譜就拿下中科創(chuàng)星的天使輪投資;次年,智譜A輪融資過億元;2022年,智譜再次拿下B輪數(shù)億元融資;2023年,智譜再宣布獲得25億元融資,美團、螞蟻、阿里、騰訊、小米等一眾知名企業(yè)也參與其中。去年底,智譜再30億元融資,估值達到200億元。
僅僅是因為“清華背景”嗎?或者說,“清華背景”到底意味著什么?
圖源:智譜官網(wǎng)
在GPT-3橫空出世,智譜要下是否要做千億大模型的決策時,清楚地知道失敗有可能把公司送進墳?zāi)?。唐杰在決策會上表態(tài)稱,如果成功了,“那至少證明中國的大模型公司,技術(shù)能力也能達到世界級水平”。
而智譜走了當(dāng)時還不甚成熟的GLM(通用語言模型)路徑時,中國沒有自己的預(yù)訓(xùn)練模型框架,要“打破西方的路徑壟斷”。
為何一家AI創(chuàng)業(yè)公司做重要決策時,定調(diào)如此宏大?
當(dāng)我們梳理智譜“靈魂人物”唐杰的來時路時,發(fā)現(xiàn)一切還要從咖啡說起。
A
如果你什么都不知道,看到唐杰,可能很難將之與清華教授、人工智能專家聯(lián)系起來。
1977年出生,唐杰今年也不過48歲,看起來要更年輕一些——戴副眼鏡,斯文但不柔弱,說話的時候總是掛著笑。
畢竟,喜歡“鐵人三項”運動的人哪里柔弱得了?全程鐵人三項226公里,包含游泳3.8公里、自行車騎行180公里、跑步42.2公里。就算是短距離的比賽,也得跑游騎幾十公里。在唐杰的家里,擺著不止一枚鐵人三項獎牌。
比拼耐力、專注力,也比拼跨維度的能力,正是唐杰擅長的。
圖注:唐杰在辦公室
圖源:北京大學(xué)王選計算機研究所
自從碩士時期由自動化轉(zhuǎn)至計算機專業(yè),唐杰就在這條路上沒回頭,最終進入清華大學(xué)讀博,從事語義Web和數(shù)據(jù)挖掘等相關(guān)研究。
2006年,世界在發(fā)生巨變,互聯(lián)網(wǎng)來勢洶洶,加校友的Facebook、人人都可以傳視頻的YouTube、“世界廣場”Twitter都站穩(wěn)了腳跟,國內(nèi)博客文化興起,起點中文網(wǎng)已經(jīng)掀起網(wǎng)文熱潮,周鴻祎創(chuàng)立了奇虎,沖擊金山毒霸、瑞星殺毒等收費殺毒軟件。
唐杰在這一年站在了人生的岔路口前。博士畢業(yè)了,大多數(shù)同學(xué)都出國深造或者去大的互聯(lián)網(wǎng)公司了。要出國嗎?要“下?!眴幔?/strong>
最終,唐杰選擇留在國內(nèi)、留在清華。
博士還沒畢業(yè)的時候,參加學(xué)校的一次活動,唐杰了解到了北大計算機文字信息處理專家王選。
而留在中國做研究的選擇,也許正是受了這位前輩的影響:“王選老師的漢字激光照排是獨創(chuàng)的中國人自己的技術(shù),他在我國七八十年代軟件、硬件條件都不如國外的情況下,一步跨越國外40年的科研積累,直接攻下了漢字激光照排這個世界難題,令我印象深刻,也備受鼓舞。”
那一年的2月,王選與世長辭。而唐杰留任清華,并且很快就開始做后來非常成功的Aminer,一個具有完全自主知識產(chǎn)權(quán)的科技情報挖掘系統(tǒng)。和Google Scholar最大的區(qū)別是,Aminer不自己建Profile,而是在自動獲取上做了很多算法。
博士畢業(yè)的一年時間,唐杰給自己定的目標(biāo)是除了審論文外不發(fā)文章,全部精力投入到這個系統(tǒng)里。
剛開始,唐杰拉來兩個同門,所有程序都只是在一臺電腦和自己的筆記本上運行的demo,跑了幾百天,抓了第一批200萬個數(shù)據(jù),還好清華的網(wǎng)絡(luò)比較快。當(dāng)時連美工都沒有,產(chǎn)品第一個版本的網(wǎng)站界面是唐杰自己畫的。
其后的若干年,唐杰一直帶隊不斷完善Aminer,團隊也不斷擴大。最終感到在學(xué)校里維持一個大團隊太痛苦,得到系里和學(xué)校的支持,Aminer成功產(chǎn)業(yè)化。
2020年,唐杰帶領(lǐng)的Aminer團隊因2008年發(fā)表的論文《ArnetMiner: extraction and mining of academic social networks》,獲得了ACM SIGKDD 2020時間檢驗應(yīng)用科學(xué)獎。彼時唐杰已經(jīng)發(fā)表論文200余篇,擁有專利20余項。Aminer吸引了220個國家/地區(qū)1000多萬獨立IP訪問。
而Aminer,也成為了智譜AI的前身。
做Aminer的十?dāng)?shù)年間,唐杰和其團隊吃了不少苦。剛開始唐杰手頭只有2萬元錢,是博士論文被評為優(yōu)秀的獎金,沒有機器,沒有計算資源,也沒有人。后來逐漸有了資源可以調(diào)用,又經(jīng)歷了多番試錯。
唐杰后來回憶,那個時候以學(xué)術(shù)研究為主,可以在項目上用一些算法做研究。效果大大提升了,就發(fā)paper,用的人少,就撤下來。這種“沿途下蛋”的哲學(xué),后來也在智譜AI自然而然地得到了延續(xù)。
等到Aminer規(guī)?;?,唐杰又面臨復(fù)雜的挑戰(zhàn),人員開銷、服務(wù)器開銷都特別大,科研經(jīng)費和自掏腰包已經(jīng)無法滿足。在包括微軟等的合作進來后,情況才好一些。從學(xué)術(shù)研究到將Aminer變成一個產(chǎn)品,唐杰邊試邊學(xué)。
做研究苦,做研究并且產(chǎn)業(yè)化更難。
在旁人眼中,唐杰是不折不扣的“工作狂”,多年來每天凌晨2點起床,大多數(shù)時間泡在實驗室中,幾無中斷。十幾年中領(lǐng)域研究熱點潮漲潮落,他的研究中心始終是Aminer系統(tǒng)。
“系統(tǒng)研發(fā)是要耐得住寂寞的”,而“專注”是唐杰被問及做研究什么最重要時常提到的詞。
唐杰曾經(jīng)撰寫過一篇文章《用“咖啡”的精神做學(xué)問》,這也成為了他的名言。那是他在香港科技大學(xué)做短期訪問期間悟到的理,喝咖啡固然上癮,可為什么非得戒呢?“上癮”是人生的精彩所在,如果做研究能像喝咖啡一樣上癮,又何愁研究走不好呢?
唐杰的得意門生、后來創(chuàng)辦月之暗面的楊植麟,也深受“咖啡主義”的影響。
B
如果只說“專注”,解釋不了唐杰為何成為AI領(lǐng)域創(chuàng)業(yè)“清華幫”的靈魂人物之一。
OpenAI的創(chuàng)始故事已經(jīng)廣為人知:2015年,谷歌以約6億美元的價格收購DeepMind,幾個月后,由奧特曼、馬斯克、布洛克曼等人的主導(dǎo)下,OpenAI成立了——誓要對抗谷歌,讓AGI造福人類。
2018年,距離ChatGPT讓OpenAI家喻戶曉還有4年,北京最有活力的人工智能學(xué)術(shù)圈已經(jīng)受到了來自大洋彼岸的震動。還是谷歌,其語言小組冠名的一篇論文提出了知名的預(yù)訓(xùn)練語言模型BERT,引發(fā)了NLP(自然語言處理)領(lǐng)域的變革。
一個月后,智源研究所在北京成立,前微軟亞洲研究院創(chuàng)始人之一、剛從金山CEO位置上退休的張宏江主導(dǎo)了這一切。從一開始,智源就被定位為一所民間、非營利、新型科研機構(gòu)。既然要科研創(chuàng)新,就要跳脫出傳統(tǒng)的權(quán)力體系,讓真正的理想主義升騰。
智源也成為了AI創(chuàng)業(yè)的“黃埔軍?!?。研究員就在清華東南門外。成立次年,智源推出“智源學(xué)者計劃”,唐杰成為了智源學(xué)者。
2019年,Aminer單獨拆分出來,成立新公司智譜AI。唐杰作為“靈魂人物”、創(chuàng)始人之一出任首席顧問,一直與唐杰合作的同門師兄弟張鵬成為了CTO,后來出任CEO。
而一場巨變就在眼前,唐杰很快就會挑起重任。
2020年,OpenAI發(fā)布了GPT-3,萬張顯卡的資源投入,Scaling Law顯現(xiàn)。其參數(shù)規(guī)模高達 1750 億,不僅能做語言生成,而且對語言的理解能力也有了很大的提升。
大模型時代,突然開啟了。
剛開始,大家感覺到一種絕望。2020年之前,很多模型在國際上獲得了關(guān)注,但遠不能與GPT-3相比?!拔覀円郧白疃嘀荒茉谝慌_V100的8張卡上做實驗?!焙髞韯?chuàng)辦面壁智能的劉知遠曾回憶,“如果不馬上跟進,差距就會越來越大?!?/p>
很快,智源啟動了“百人大模型計劃”,項目取用清華校園和智源研究所所在的“五道口”的諧音,被命名為“悟道”,唐杰任負(fù)責(zé)人。
這是耗資巨大的“拓荒”項目,唐杰敢?guī)ш犚呀?jīng)是魄力的展現(xiàn)。2021年初,悟道1.0大模型登場,唐杰調(diào)用外部資源,3個月后,悟道2.0亮相——1.75萬億參數(shù)量,超出GPT-3近10倍,創(chuàng)造當(dāng)時的全球紀(jì)錄。
這件事的意義不言而喻,而其中的風(fēng)險可想而知。爭議也隨之出現(xiàn),認(rèn)為太“燒錢”。帶隊的唐杰,是需要頂住壓力完成中國在大模型領(lǐng)域的拓荒的。
張宏江在接受《極客公園》采訪時曾說,在悟道2.0發(fā)布之后,當(dāng)智源當(dāng)時的兩位院長黃鐵軍和唐杰以及其他智源學(xué)者都說這件事值得堅持時,他才真正堅信大模型這個方向。
圖源:智源研究院
悟道模型的發(fā)布,進一步推動了AI“清華幫”的壯大。黃民烈創(chuàng)立聆心智能(后被智譜收購)、孫茂松的博士生豈凡超創(chuàng)立了深言科技,劉知遠創(chuàng)立了面壁智能,而同樣師從孫茂松的朱軍建立了生數(shù)科技。
最被人所知的,還是曾師從唐杰的楊植麟,在2023年創(chuàng)辦了月之暗面。楊植麟也曾多次提到從唐杰那里學(xué)到的理念,在長文《我所理解的大學(xué)生活》中就提到:“(唐杰)一直跟我強調(diào)的一件事就是,賺多少錢不是最重要的,重要的是能不能把東西做到世界第一。我不能同意更多。”
“科研就像登山,一定要登到頂峰,不登頂就是失敗。”要做就做最好的,唐杰的行事風(fēng)格也許從留在國內(nèi)、留在清華就已經(jīng)注定。
在另一邊,智譜AI也延續(xù)了這樣的風(fēng)格——就是要做大模型,而且目標(biāo)是登頂。
C
智譜AI也曾同樣面臨抉擇:要不要追OpenAI?
GPT-3發(fā)布的日子,2020年6月11日,正是智譜的1周歲生日。
15個月之后,2021年底,智譜開了一場關(guān)乎公司生死的決策會。除了CEO張鵬、工程師外,“靈魂人物”唐杰、董事長劉德兵等也都參加了。
《人物》曾描寫那次決策會的場面:工程師默不作聲,以示反抗。千萬人民幣的投入,舉全公司之力、至少八九個月,這樣的風(fēng)險太大。
說白了,一旦失敗,智譜有可能就不復(fù)存在了。
唐杰在會上表態(tài),表的是“登頂”的決心,如果成功了:“那至少證明中國的大模型公司,技術(shù)能力也能達到世界級水平?!?/strong>
很難說這是一個商業(yè)公司的“理性”發(fā)言,也許只有在高??蒲斜尘?、始終抱有理想主義的企業(yè)才會聽到創(chuàng)始人這樣的發(fā)言。更關(guān)鍵的是,在這一點上,公司高層之間頗有默契,張鵬、劉德兵也都支持追。最終,決策下得很平靜。
決策會9個月后、GPT-3發(fā)布26個月后,智譜AI聯(lián)合清華大學(xué)打造出了GLM-130B,參數(shù)規(guī)模1300億。
追趕并沒有結(jié)束,很快OpenAI的ChatGPT就推出了,而智譜在4個月后再次推出對標(biāo)模型ChatGLM。次日,OpenAI又發(fā)布了GPT-4。不到一年,GLM-4也推出了。這一次,GLM對GPT的追趕從26個月縮短到10個月。
而智譜最終用自己提出的全新的GLM(通用語言模型)路徑,而非最主流的GPT、BERT、T5,其原因也顯得頗為宏大:為了打破西方的路徑壟斷。此前,中國沒有自己的預(yù)訓(xùn)練模型框架。
甚至,唐杰在2024年第二屆北京人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展大會上說:“我們非常希望在這個時代解密所有OpenAI做的東西。”
“一定要登頂,不登頂就是失敗。”雖然產(chǎn)品線對標(biāo)OpenAI,但僅僅做中國的OpenAI并不能算登頂。
最終要達到的,還是AGI(通用型人工智能)。依托智譜的科研背景和早早設(shè)定的高目標(biāo),這幾乎是水到渠成。張鵬在行業(yè)內(nèi)有一句名言:“25億元的融資根本不夠,不管融多少、掙多少錢,都是通向AGI這條路上的盤纏。”
“選方向,要看未來,不要盲目跟風(fēng)?!碧平苷J(rèn)為選擇是努力的前提。
2019年智譜成立時,定下了實現(xiàn)AGI的愿景,并將AGI的發(fā)展分為五個階段:L1預(yù)訓(xùn)練大模型、L2對齊與推理、L3自我學(xué)習(xí)、L4自我認(rèn)知、L5意識智能。5年后,2024年7月,OpenAI也提出AGI五階段框架,分別是L1對話式機器人、L2推理者、L3智能體、L4創(chuàng)新者、L5組織者。
2025年1月,由DeepSeek R1掀起了全球推理模型的討論,正在智譜的AGI五階段預(yù)測中。在前不久的巴黎AI峰會上,唐杰表示:“我們目前正處在L2和L3的交匯處?!?/p>
據(jù)硅星人,智譜正在訓(xùn)練下一代“沉思”模型,而且將2025年定義為開源年,接下來也會發(fā)布和開源各系列全新大模型。對于智譜來說,這更像是一種對最初路線的再確認(rèn)。
登頂?shù)臎Q心也許未必能最終保證登頂?shù)某晒?,智譜和一眾“清華幫”“浙大幫”“交大幫”也許還有很長的路要走、很多挑戰(zhàn)需要跨越。如何持續(xù)落地,如何應(yīng)對“燒錢”難題,如何更好地商業(yè)化,這都是需要唐杰一一回答的問題。
但唐杰這群人所具有的理想主義精神、決心,以及從科研經(jīng)驗中生長出來的眼光,將長久地為跨越挑戰(zhàn)提供動力,也將繼續(xù)吸引人才與資金。熱錢涌向“高校幫”,但不僅僅為“高校光環(huán)”。
在悟道2.0發(fā)布之后,有人問唐杰為什么他們能在這么短的時間內(nèi)拿出這么多成果,唐杰笑著給出了一個簡單但耐人尋味的回答:“因為我們早就開始做了呀?!?/p>
不論前路如何,也許都該祝福唐杰們,祝福咖啡主義的風(fēng)持續(xù)吹向中國人工智能。
參考資料:
1、時代財經(jīng):《三個清華校友,爭搶大模型一哥》
2、人物:《追OpenAI的人》
3、36氪:《對話智譜AI CEO張鵬:我們不做中國的ChatGPT|36氪專訪》
4、第一新聲:《20年蟄伏,低調(diào)成就一位大模型領(lǐng)袖》
5、機器之聲:《專訪唐杰:萬億參數(shù)大模型只是一個開始》
6、京報網(wǎng):《爭奪“AI領(lǐng)跑者”,北京靠什么》
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.