人類要通往AGI,該走哪條路?
即便是在采用開源、為AI推理帶來一條新路徑的DeepSeek爆火后,對于這一問題,答案仍然是多樣的。
2024年末,全球新一輪AI熱潮到來之前,《中國企業報》與蔻町智能CTO陳秋武有了一次深度對話。
對話里,陳秋武反復提及技術在AI革命中不可撼動的位置,“如果通往AGI的道路有很多條,那Coding是最適合的一條。如果只有一條路徑,那Coding就是唯一的一條。”
這位曾供職于微軟、百度等前沿互聯網公司的資深算法工程師,在2024年初投身AI Coding的創業浪潮。與曾在投資領域有豐富經驗的合伙人宿文,搭建起一支30余人的團隊,從自研模型開始,最終實現“人人都有個性化應用”的愿景。
比起涵蓋全人類的宏大愿景,這家取名為蔻町智能(AIGCode)顯得“小”得多。北京量子銀座大廈,在一眾創業公司里,只有一小塊簡陋的logo牌作為公司標識。沒有專屬的會議室,也沒有傳統互聯網公司標志性的茶水間,團隊成員“接踵”辦公,隨時可以開啟技術對話。
在陳秋武看來,這是不同于大廠,屬于初創公司獨有的技術氛圍。狂飆兩年半后,大模型分水嶺已現,一部分留在牌桌上的大模型公司開始轉向應用端,而他和團隊則代表了一小部分技術派,堅持摸索出性能更優的模型。
這是一條非共識道路,尤其是在“開源盛世”的當下。陳秋武認為,要創造增量價值,僅靠現有的資源拼湊是遠遠不夠的。在更長遠的周期里,擁有0-1的創新技術突破能力才是一家大模型公司最為核心的競爭力。
當然,選擇走小眾路線的另一重原因是,無論是在市場,還是行業,大模型行業需要一個新故事。原本以“六小虎”為主的大模型賽道,無論在資金或商業模式上,新入局者都難現驚喜。
自研模型是為尋求增量
《中國企業報》:今年,DeepSeek帶頭開啟了開源潮,大模型也進入“開源盛世”,自研底座模型的必要性在哪兒?
陳秋武:現在的大模型無非兩條路,要么“暴力出奇跡”,把高質量的樣本堆砌,要么拼算力。
大模型已經發展了兩年,從整個發展進程來看,它的發展還在嬰兒階段,尚未到成熟期,難以完成商業應用閉環的構建。
具體商業可用性一直沒被解決,商業閉環所需要的可用性是沒有達到的。
為什么我們要反向去做模型的原因是模型側提供技術水位不夠,就像萊特兄弟的飛機最高6米,最長舉例260米,無法商用一樣。
一方面,高質量的樣本目前產生速度完全跟不上算力的增長速度;另一方面就是困擾大模型行業很久的算力瓶頸問題。
不做模型很難解決增量問題。現在很多能拿資源湊起來的產品,在我看來都是沒有增量價值的。
我們核心邏輯是,模型三因素(網絡結構、樣本、算力)既然算力增長不了,高質量樣本增長慢,那就通過網絡結構提升學習效率,把技術模型做扎實,確保最終的產品效果是能夠為用戶帶來真正意義上的增量價值。
《中國企業報》:你把現階段模型發展定義為嬰兒階段,這一階段的模型有哪些問題?
陳秋武:這一階段,行業里的分化現象很明顯。最大規模的資金投資、人才密度、資源跟探索積累的力量,但因為技術上暫不能支撐落地,所以兩年的時間里面并沒有一個非常成熟的產品形態。
大模型光靠堆砌資本是遠遠不夠的,不做預訓練,很難做出好的產品。比如以Transformer 為架構的模型會出現對高難度、長尾、大量專業的樣本,只是記住了概率位置,但其知識難以被模型學到。
如果把模型訓練類比爬一座高度600米的山,沒做過預訓練的人在60米的時候會覺得吃力,就上不去了。再往上,到半山的時候,會涉及到技能、算法優化等高壁壘的事情,沒有專業知識積累的那部分人和團隊就會掉隊。
AI代碼編輯器Cursor多年未火但隨著Claude3.5走紅就證明了模型效果基座能力的好壞,決定了應用能力。
《中國企業報》:同樣是在Coding賽道,你們跟Cursor的定位一樣嗎?
陳秋武:我們不像Cursor純做產品,也不像OpenAI一樣純做模型,我們有點像是把發動機或者核心的技術預訓練、生成式軟件架構到產品應用,全鏈路打通的公司。
《中國企業報》:可能在你們仍在訓練模型的階段,已經有公司開始在應用層發力,并且實現了商業化。
陳秋武:各家都想商業化。國內在模型供給能力不行的公司,會想去做應用,用套殼的方式就讓大家看到,賺一波快錢,套殼沒有任何技術壁壘的,能短暫在紅海里馬上變現。
2023年,GitHub Copilot有3億美元的收入,緊接著Cursor等企業陸續火了,硅谷的融資也都是以億美元為單位,大家就覺得看到了一些商機。但實際上,Cursor也是歷經模型迭代之后,用戶才買單的,說明現在的應用是對模型側基座能力的傳導。
個性化軟件需求待釋放
《中國企業報》:通常來看,代碼更多是程序員的賽道,為什么要瞄準非技術背景、不會編程的用戶群?
陳秋武:每一個人都有個性化應用的需求,但當一個程序員還是有門檻的。
我們經過調研發現,大量的用戶個性化需求沒有在通用應用上得到滿足,現有的軟件供給能力難以覆蓋整體多樣化的需求。
即便現在有定制化服務,除了成本高昂、效率不高之外,這類服務還很難精準滿足個性化的需求。
這一塊還有比較大的市場空間,大模型或許能夠釋放這其中一部分的供給效率。每一個具備明確軟件需求的用戶都能是“產品經理”。從技術的必然趨勢來看,最終絕大部分的服務都可以被軟件化。
Websim之所以火,一部分原因就是它展示了personal app的可能性,不過它是做前端部分,我們是把數據庫、后端交互邏輯、架構、模型效果等全鏈路基本上打通了。
《中國企業報》:既做模型,又做產品,對于一家創業公司來說,這能同時實現嗎?
陳秋武:我們會有自己的節奏,預訓練的基座能力效果變好了,馬上把它傳遞到產品效果,這跟其他像“六小虎”之類的大模型公司的follower角度會有所不同,專家解耦的大模型新網絡架構為這個鏈路轉化效率極大提升提供的完全不同解決方案。
本質上,我們是希望去定義Next Thing,明確我們整個大模型時代的下一步需要什么,才能在拆分清晰的未來賽道里,更快人一步。
目前這個領域相對比較新,我們也在不斷的思考和探索。我們認為當前大模型賽道,在cursor、websim這些當紅公司出來之后,L2 賽道已經是紅海,作為初創公司,競爭優勢不明顯。與其花時間、精力挑戰別人,還不如去嘗試大家都沒有挑戰過的L3。
通用應用的個性化需求是長期被壓抑的情況下,一旦軟件服務供給能力跟上,這部分需求是能夠井噴的,是藍海。
第一階段是GPU算力對應的token成本,第二階段是典型原子功能完善后僅剩的業務翻譯token成本。我們希望提供一款產品,可以讓所有代碼的生成邊際成本幾乎為零,讓個性化應用的市場打開。讓每個個體都能自己實現創建個性化應用,甚至用后即焚。
我們繞開IDE生態,直接在外部端到端地做交付,但是目前模型能力不夠,所以得做模型。我們也跟 LLama(3.1-405B)、Mixtral(8x22B)、 DeepSeek(V2)、 Qwen(2.5 72B)幾款全球主流的模型做過對比,在參數量相差 10 倍以上的情況下,AIGCode 7B 的小模型在全球公認的七大核心任務上取得了四項第一的成績。
《中國企業報》:當“Personal App is the End”的愿景實現后,對于整個軟件行業來說意味著什么?尤其是程序員群體。
陳秋武:會改變現有的軟件生產模式。智能編程最終會把一部分沒有核心差異化技術能力的程序員替代掉,或者說,把程序員在很大一部分場景里替代掉。
我覺得代碼應該端到端地去做生成,為用戶把使用門檻大幅度降低,讓大家變成能夠提需求,就實現效果的人,每個人都可以是產品經理。
《中國企業報》:你在微軟、騰訊這些大廠都有過豐富的工作經歷,大廠最近在大模型領域也是加足馬力,這種情況下,創業公司要走出來會變得更難嗎?
陳秋武:初創公司和大廠比起來,要更靈活。獨特的創新力,就是創業公司的突圍路徑之一。
大廠的人才密度、資金的確優于創業公司,但大模型時代處于幼童期,并不需要堆人才資源。從歷史進程來看,變革式創新的時候往往由一兩個人決定的,人才的密度讓位于創新力才是核心技術突破的進步。
大廠工作流程上有其局限性。比如,遇到問題時,經常會著急地推動和迅速糾正,長此以往,團隊自驅優化的核心動能就會受到剝奪,對于一支技術團隊的創新力而言,自驅力是創新力的關鍵因素。而其決策的結果,往往最具備創新能力的人,是很難與掌握決策權的保持高度一致的,往往背道而馳。
超級智能體是終局
《中國企業報》:互聯網時代誕生了很多家至今都很巨頭的公司,大模型時代所產生的巨頭規模會遠超互聯網階段嗎?
陳秋武:我預判是更大的。核心原因在從閉環上的生產要素來看,大模型更多、更豐富而且更重要。
互聯網時代做的是供求關系的鏈接,比如導航、搜索、推薦,用戶獲取內容的成本急劇下降,內容流轉、供求鏈接的效率得到提升。
但是大模型時代有一個特點,比如圖像、視頻、文本等內容,大模型快速生成是沒問題的,只是現階段可能質量上會有參差。
但一旦代碼、文本、視頻到圖像到軟件服務都能生成滿足商業化質量需求的時候,能串連起內容側或者服務側的供給,且接近零成本,而傳統的供給方式是人工供給的。這背后的生產力體量,完全不是一個量級。
《中國企業報》:你覺得,目前在通往AGI的道路上,大家的方向是一致的嗎?
陳秋武:AGI的核心表達是大模型能不能類人,它是用另一種方式定義提升我們的智商水平。
現在有一些模型更接近“文科生”,我認為是現在很多大模型的學習機制出了問題,以“文科生”產品為例,會發現有些越細節越專業的問題大模型回答得很不好,缺了人智商水平很重要的歸納、推演、總結,并且沉淀成型的方法論。
還有些觀點認為大模型天然就不適合數理化,但我認為是學習機制的問題,如果學習機制沒問題的話,只要樣本形式稍微做一些變化就可以很好的系統學到這些知識。
《中國企業報》:很好的歸納推演總結能力,還需要把期待值給到ChatGPT5嗎?
陳秋武:我原來從定義上給AGI智商水平設計了五層邏輯,第一層就是最簡單的記憶能力;第二層是對知識點的理解、組織能力;第三層是分析能力以及對不同類型邏輯的理解能力;第四層是理解不同體系的能力,比如理解一套軟件、一個系統接口、一門學科等。更深的層次就是像人一樣,在學到東西之后,自我革新并形成一套自己的邏輯方法論,建立自學習機制。
目前第二層都沒有得到很好的解決,第三層的推理能力進展方面也不是特別理想。OpenAI的o1就沒有核心突破。
所以我對ChatGPT5的突破性蠻悲觀的。如果預訓練是“學”的能力, o1只帶來了“用”方面的小部分微創新,核心的邏輯就是提高回答頻次,中間只要設置合理的校驗機制,下一步的決策空間就變小了。這能叫“推理”?為什么再推一次就不對了呢?因為它不是推理,還是概率,選中概率大的難度變小了,自然正確率就上去了。
ChatGPT5一定會比之前的都要好,但好的有限,因為技術上“學”的效率機制與“用”的真推理這兩個核心難題都沒看到有被解決的苗頭。
《中國企業報》:你怎么評價DeepSeek?
陳秋武:DeepSeek是真正在做事情的團隊,是技術流,基建能力強。但我們認為,模型的網絡架構而非基建方面的技術創新,我相信我們走的更超前一些,作為基模,他們只做了代碼補全,我們跟他們的產品定位形態不一樣,不在一個賽道上,當然在基模上,我們是競對。
《中國企業報》:在你的設想里,大模型時代的 Killer App未來形態可能是什么樣的?
陳秋武:AI Coding的終局是為了生成任意應用。Killer App形態與端有關,它不是以APP的形式存在的,而是以足夠聰明的超級智能體存在,或者說下個時代,通用APP的入口,會變成超級智能,之前moonshot、豆包、混元等的投流大部分打水漂就能看出。典型的不懂大模型時代入口遷移效應和邏輯的時代眼淚。
Killer App最終會在什么載體上存在暫時沒辦法準確勾勒,但它的底層一定是有超級智能的支持,這是未來每一家在奔赴在AGI道路上的公司最內核的東西。
《中國企業報》:怎么定義大模型時代的下一個十年?
陳秋武:互聯網上一個十年,主要是供需鏈接平臺及跑馬圈地,大家追求短平快地超速發展。但現在野蠻生長的時代不再,下一個十年,任何一家公司要尋求增量,就需要有突破技術壁壘的核心能力,并打通技術、產品、商業全鏈路的閉環。
作者:邱慧
監制:張劍
編輯:李南
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.