當大模型的競賽延續到2025年,原本就已經顯露出融資遇冷趨勢的國內AI六小虎,又被DeepSeek引發出一輪價值重估的新挑戰。
但在上述壓力之下,“清華幫”靈魂人物唐杰帶領的智譜,第一個站出來打破了外界的部分質疑,靠的則是近期完成了一輪10億元人民幣新融資。
值得一提的亮點是,投資陣營中出現了杭州城投產業基金、上城資本的身影,而杭州恰恰是DeepSeek的“據點”。
脫胎于清華教授唐杰帶領研發的Aminer項目,智譜從一開始就有濃厚的“科研味”,也是“清華幫”的典型代表。
成立于2019年的智譜,匯集了一幫清華“大牛”,CEO張鵬本碩博均畢業于清華,董事長劉德兵、總裁王紹蘭同為清華校友。
一成立,智譜就拿下中科創星的天使輪投資;次年,智譜A輪融資過億元;2022年,智譜再次拿下B輪數億元融資;2023年,智譜再宣布獲得25億元融資,美團、螞蟻、阿里、騰訊、小米等一眾知名企業也參與其中。去年底,智譜再30億元融資,估值達到200億元。
僅僅是因為“清華背景”嗎?或者說,“清華背景”到底意味著什么?
圖源:智譜官網
在GPT-3橫空出世,智譜要下是否要做千億大模型的決策時,清楚地知道失敗有可能把公司送進墳墓。唐杰在決策會上表態稱,如果成功了,“那至少證明中國的大模型公司,技術能力也能達到世界級水平”。
而智譜走了當時還不甚成熟的GLM(通用語言模型)路徑時,中國沒有自己的預訓練模型框架,要“打破西方的路徑壟斷”。
為何一家AI創業公司做重要決策時,定調如此宏大?
當我們梳理智譜“靈魂人物”唐杰的來時路時,發現一切還要從咖啡說起。
如果你什么都不知道,看到唐杰,可能很難將之與清華教授、人工智能專家聯系起來。
1977年出生,唐杰今年也不過48歲,看起來要更年輕一些——戴副眼鏡,斯文但不柔弱,說話的時候總是掛著笑。
畢竟,喜歡“鐵人三項”運動的人哪里柔弱得了?全程鐵人三項226公里,包含游泳3.8公里、自行車騎行180公里、跑步42.2公里。就算是短距離的比賽,也得跑游騎幾十公里。在唐杰的家里,擺著不止一枚鐵人三項獎牌。
比拼耐力、專注力,也比拼跨維度的能力,正是唐杰擅長的。
圖注:唐杰在辦公室
圖源:北京大學王選計算機研究所
自從碩士時期由自動化轉至計算機專業,唐杰就在這條路上沒回頭,最終進入清華大學讀博,從事語義Web和數據挖掘等相關研究。
2006年,世界在發生巨變,互聯網來勢洶洶,加校友的Facebook、人人都可以傳視頻的YouTube、“世界廣場”Twitter都站穩了腳跟,國內博客文化興起,起點中文網已經掀起網文熱潮,周鴻祎創立了奇虎,沖擊金山毒霸、瑞星殺毒等收費殺毒軟件。
唐杰在這一年站在了人生的岔路口前。博士畢業了,大多數同學都出國深造或者去大的互聯網公司了。要出國嗎?要“下海”嗎?
最終,唐杰選擇留在國內、留在清華。
博士還沒畢業的時候,參加學校的一次活動,唐杰了解到了北大計算機文字信息處理專家王選。
而留在中國做研究的選擇,也許正是受了這位前輩的影響:“王選老師的漢字激光照排是獨創的中國人自己的技術,他在我國七八十年代軟件、硬件條件都不如國外的情況下,一步跨越國外40年的科研積累,直接攻下了漢字激光照排這個世界難題,令我印象深刻,也備受鼓舞。”
那一年的2月,王選與世長辭。而唐杰留任清華,并且很快就開始做后來非常成功的Aminer,一個具有完全自主知識產權的科技情報挖掘系統。和Google Scholar最大的區別是,Aminer不自己建Profile,而是在自動獲取上做了很多算法。
博士畢業的一年時間,唐杰給自己定的目標是除了審論文外不發文章,全部精力投入到這個系統里。
剛開始,唐杰拉來兩個同門,所有程序都只是在一臺電腦和自己的筆記本上運行的demo,跑了幾百天,抓了第一批200萬個數據,還好清華的網絡比較快。當時連美工都沒有,產品第一個版本的網站界面是唐杰自己畫的。
其后的若干年,唐杰一直帶隊不斷完善Aminer,團隊也不斷擴大。最終感到在學校里維持一個大團隊太痛苦,得到系里和學校的支持,Aminer成功產業化。
2020年,唐杰帶領的Aminer團隊因2008年發表的論文《ArnetMiner: extraction and mining of academic social networks》,獲得了ACM SIGKDD 2020時間檢驗應用科學獎。彼時唐杰已經發表論文200余篇,擁有專利20余項。Aminer吸引了220個國家/地區1000多萬獨立IP訪問。
而Aminer,也成為了智譜AI的前身。
做Aminer的十數年間,唐杰和其團隊吃了不少苦。剛開始唐杰手頭只有2萬元錢,是博士論文被評為優秀的獎金,沒有機器,沒有計算資源,也沒有人。后來逐漸有了資源可以調用,又經歷了多番試錯。
唐杰后來回憶,那個時候以學術研究為主,可以在項目上用一些算法做研究。效果大大提升了,就發paper,用的人少,就撤下來。這種“沿途下蛋”的哲學,后來也在智譜AI自然而然地得到了延續。
等到Aminer規模化之后,唐杰又面臨復雜的挑戰,人員開銷、服務器開銷都特別大,科研經費和自掏腰包已經無法滿足。在包括微軟等的合作進來后,情況才好一些。從學術研究到將Aminer變成一個產品,唐杰邊試邊學。
做研究苦,做研究并且產業化更難。
在旁人眼中,唐杰是不折不扣的“工作狂”,多年來每天凌晨2點起床,大多數時間泡在實驗室中,幾無中斷。十幾年中領域研究熱點潮漲潮落,他的研究中心始終是Aminer系統。
“系統研發是要耐得住寂寞的”,而“專注”是唐杰被問及做研究什么最重要時常提到的詞。
唐杰曾經撰寫過一篇文章《用“咖啡”的精神做學問》,這也成為了他的名言。那是他在香港科技大學做短期訪問期間悟到的理,喝咖啡固然上癮,可為什么非得戒呢?“上癮”是人生的精彩所在,如果做研究能像喝咖啡一樣上癮,又何愁研究走不好呢?
唐杰的得意門生、后來創辦月之暗面的楊植麟,也深受“咖啡主義”的影響。
如果只說“專注”,解釋不了唐杰為何成為AI領域創業“清華幫”的靈魂人物之一。
OpenAI的創始故事已經廣為人知:2015年,谷歌以約6億美元的價格收購DeepMind,幾個月后,由奧特曼、馬斯克、布洛克曼等人的主導下,OpenAI成立了——誓要對抗谷歌,讓AGI造福人類。
2018年,距離ChatGPT讓OpenAI家喻戶曉還有4年,北京最有活力的人工智能學術圈已經受到了來自大洋彼岸的震動。還是谷歌,其語言小組冠名的一篇論文提出了知名的預訓練語言模型BERT,引發了NLP(自然語言處理)領域的變革。
一個月后,智源研究所在北京成立,前微軟亞洲研究院創始人之一、剛從金山CEO位置上退休的張宏江主導了這一切。從一開始,智源就被定位為一所民間、非營利、新型科研機構。既然要科研創新,就要跳脫出傳統的權力體系,讓真正的理想主義升騰。
智源也成為了AI創業的“黃埔軍校”。研究員就在清華東南門外。成立次年,智源推出“智源學者計劃”,唐杰成為了智源學者。
2019年,Aminer單獨拆分出來,成立新公司智譜AI。唐杰作為“靈魂人物”、創始人之一出任首席顧問,一直與唐杰合作的同門師兄弟張鵬成為了CTO,后來出任CEO。
而一場巨變就在眼前,唐杰很快就會挑起重任。
2020年,OpenAI發布了GPT-3,萬張顯卡的資源投入,Scaling Law顯現。其參數規模高達 1750 億,不僅能做語言生成,而且對語言的理解能力也有了很大的提升。
大模型時代,突然開啟了。
剛開始,大家感覺到一種絕望。2020年之前,很多模型在國際上獲得了關注,但遠不能與GPT-3相比。“我們以前最多只能在一臺V100的8張卡上做實驗。”后來創辦面壁智能的劉知遠曾回憶,“如果不馬上跟進,差距就會越來越大。”
很快,智源啟動了“百人大模型計劃”,項目取用清華校園和智源研究所所在的“五道口”的諧音,被命名為“悟道”,唐杰任負責人。
這是耗資巨大的“拓荒”項目,唐杰敢帶隊已經是魄力的展現。2021年初,悟道1.0大模型登場,唐杰調用外部資源,3個月后,悟道2.0亮相——1.75萬億參數量,超出GPT-3近10倍,創造當時的全球紀錄。
這件事的意義不言而喻,而其中的風險可想而知。爭議也隨之出現,認為太“燒錢”。帶隊的唐杰,是需要頂住壓力完成中國在大模型領域的拓荒的。
張宏江在接受《極客公園》采訪時曾說,在悟道2.0發布之后,當智源當時的兩位院長黃鐵軍和唐杰以及其他智源學者都說這件事值得堅持時,他才真正堅信大模型這個方向。
圖源:智源研究院
悟道模型的發布,進一步推動了AI“清華幫”的壯大。黃民烈創立聆心智能(后被智譜收購)、孫茂松的博士生豈凡超創立了深言科技,劉知遠創立了面壁智能,而同樣師從孫茂松的朱軍建立了生數科技。
最被人所知的,還是曾師從唐杰的楊植麟,在2023年創辦了月之暗面。楊植麟也曾多次提到從唐杰那里學到的理念,在長文《我所理解的大學生活》中就提到:“(唐杰)一直跟我強調的一件事就是,賺多少錢不是最重要的,重要的是能不能把東西做到世界第一。我不能同意更多。”
“科研就像登山,一定要登到頂峰,不登頂就是失敗。”要做就做最好的,唐杰的行事風格也許從留在國內、留在清華就已經注定。
在另一邊,智譜AI也延續了這樣的風格——就是要做大模型,而且目標是登頂。
智譜AI也曾同樣面臨抉擇:要不要追OpenAI?
GPT-3發布的日子,2020年6月11日,正是智譜的1周歲生日。
15個月之后,2021年底,智譜開了一場關乎公司生死的決策會。除了CEO張鵬、工程師外,“靈魂人物”唐杰、董事長劉德兵等也都參加了。
《人物》曾描寫那次決策會的場面:工程師默不作聲,以示反抗。千萬人民幣的投入,舉全公司之力、至少八九個月,這樣的風險太大。
說白了,一旦失敗,智譜有可能就不復存在了。
唐杰在會上表態,表的是“登頂”的決心,如果成功了:“那至少證明中國的大模型公司,技術能力也能達到世界級水平。”
很難說這是一個商業公司的“理性”發言,也許只有在高校科研背景、始終抱有理想主義的企業才會聽到創始人這樣的發言。更關鍵的是,在這一點上,公司高層之間頗有默契,張鵬、劉德兵也都支持追。最終,決策下得很平靜。
決策會9個月后、GPT-3發布26個月后,智譜AI聯合清華大學打造出了GLM-130B,參數規模1300億。
追趕并沒有結束,很快OpenAI的ChatGPT就推出了,而智譜在4個月后再次推出對標模型ChatGLM。次日,OpenAI又發布了GPT-4。不到一年,GLM-4也推出了。這一次,GLM對GPT的追趕從26個月縮短到10個月。
而智譜最終用自己提出的全新的GLM(通用語言模型)路徑,而非最主流的GPT、BERT、T5,其原因也顯得頗為宏大:為了打破西方的路徑壟斷。此前,中國沒有自己的預訓練模型框架。
甚至,唐杰在2024年第二屆北京人工智能產業創新發展大會上說:“我們非常希望在這個時代解密所有OpenAI做的東西。”
“一定要登頂,不登頂就是失敗。”雖然產品線對標OpenAI,但僅僅做中國的OpenAI并不能算登頂。
最終要達到的,還是AGI(通用型人工智能)。依托智譜的科研背景和早早設定的高目標,這幾乎是水到渠成。張鵬在行業內有一句名言:“25億元的融資根本不夠,不管融多少、掙多少錢,都是通向AGI這條路上的盤纏。”
“選方向,要看未來,不要盲目跟風。”唐杰認為選擇是努力的前提。
2019年智譜成立時,定下了實現AGI的愿景,并將AGI的發展分為五個階段:L1預訓練大模型、L2對齊與推理、L3自我學習、L4自我認知、L5意識智能。5年后,2024年7月,OpenAI也提出AGI五階段框架,分別是L1對話式機器人、L2推理者、L3智能體、L4創新者、L5組織者。
2025年1月,由DeepSeek R1掀起了全球推理模型的討論,正在智譜的AGI五階段預測中。在前不久的巴黎AI峰會上,唐杰表示:“我們目前正處在L2和L3的交匯處。”
據硅星人,智譜正在訓練下一代“沉思”模型,而且將2025年定義為開源年,接下來也會發布和開源各系列全新大模型。對于智譜來說,這更像是一種對最初路線的再確認。
登頂的決心也許未必能最終保證登頂的成功,智譜和一眾“清華幫”“浙大幫”“交大幫”也許還有很長的路要走、很多挑戰需要跨越。如何持續落地,如何應對“燒錢”難題,如何更好地商業化,這都是需要唐杰一一回答的問題。
但唐杰這群人所具有的理想主義精神、決心,以及從科研經驗中生長出來的眼光,將長久地為跨越挑戰提供動力,也將繼續吸引人才與資金。熱錢涌向“高校幫”,但不僅僅為“高校光環”。
在悟道2.0發布之后,有人問唐杰為什么他們能在這么短的時間內拿出這么多成果,唐杰笑著給出了一個簡單但耐人尋味的回答:“因為我們早就開始做了呀。”
不論前路如何,也許都該祝福唐杰們,祝福咖啡主義的風持續吹向中國人工智能。
參考資料:
1、時代財經:《三個清華校友,爭搶大模型一哥》
2、人物:《追OpenAI的人》
3、36氪:《對話智譜AI CEO張鵬:我們不做中國的ChatGPT|36氪專訪》
4、第一新聲:《20年蟄伏,低調成就一位大模型領袖》
5、機器之聲:《專訪唐杰:萬億參數大模型只是一個開始》
6、京報網:《爭奪“AI領跑者”,北京靠什么》
歡迎在評論區留言~
如需開白請加小編微信:dongfangmark
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.