為什么說大語言模型(LLM)正在顛覆技術(shù)普及的“老規(guī)矩”?
著名 AI 大牛、前特斯拉 AI 總監(jiān)、OpenAI 創(chuàng)始成員之一的安德烈·卡帕西(Andrej Karpathy)剛剛就此寫了一篇文章—《權(quán)力回歸大眾:大語言模型如何顛覆技術(shù)擴(kuò)散的傳統(tǒng)模式》
文章的核心觀點(diǎn)
卡帕西敏銳地觀察到一個(gè)反常現(xiàn)象:像電力、計(jì)算機(jī)、互聯(lián)網(wǎng)這些顛覆性技術(shù),過去總是“自上而下”普及的——先是政府、軍隊(duì),然后是大公司,最后才輪到普通消費(fèi)者。但 LLM(以 ChatGPT 為典型代表)完全反過來了!普通人成了最早、最大規(guī)模的受益者,其影響在個(gè)人層面是爆炸性的、顛覆性的,而在企業(yè)和政府層面反而顯得更慢、更溫和。這在技術(shù)史上是極其罕見甚至前所未有的。
為什么會(huì)這樣?卡帕西給出了他的分析:
“萬金油” vs. “專家團(tuán)”:LLM 強(qiáng)在“啥都懂一點(diǎn)”,是個(gè)知識(shí)廣但不深的“通才”。這對(duì)個(gè)人來說是巨大的賦能,因?yàn)槲覀兤胀ㄈ瞬豢赡軜訕泳ǎ琇LM 讓我們突然能在很多以前不敢想的領(lǐng)域(編程、法律、研究、創(chuàng)作)達(dá)到“還行”的水平。但對(duì)于本就擁有各種專家的企業(yè)來說,LLM 帶來的更多是效率提升,而非能力上的根本突破
“簡單粗暴” vs. “精耕細(xì)作”:個(gè)人使用 LLM 門檻低、限制少、容錯(cuò)率高,可以“跟著感覺走”。但企業(yè)應(yīng)用場景復(fù)雜得多,涉及系統(tǒng)集成、安全合規(guī)、品牌形象、法律風(fēng)險(xiǎn)等,對(duì)準(zhǔn)確性和可靠性要求極高,不能容忍 LLM 的“胡說八道”,應(yīng)用起來自然束手束腳。
“靈活小船” vs. “笨重大船”:大機(jī)構(gòu)固有的文化、流程、官僚主義和內(nèi)部政治,都讓它在面對(duì)這種“既強(qiáng)大又可能犯錯(cuò)”的新技術(shù)時(shí),轉(zhuǎn)身更慢,采納更謹(jǐn)慎
以下是全文翻譯(口語化的翻譯)
權(quán)力回歸大眾:大語言模型如何顛覆技術(shù)擴(kuò)散的傳統(tǒng)模式
安德烈·卡帕西
那些能改變世界的技術(shù),一般都是從上往下傳的:先是政府或者軍隊(duì)搞出來,然后傳到大公司,最后才輪到咱們普通人用——你想想電、加密技術(shù)、電腦、飛機(jī)、互聯(lián)網(wǎng)、GPS,是不是都這路子?這感覺也挺自然的,畢竟新出的牛掰技術(shù),一開始肯定又少又貴,還得是懂行的專家才能玩得轉(zhuǎn)
所以啊,LLM這波操作就顯得特別不一樣,簡直神了——它們給咱普通老百姓帶來的好處多得不成比例,反倒是在大公司和政府部門里,動(dòng)靜小得多,也慢半拍。ChatGPT可是火得最快的App,每周有4億人用它寫東西、敲代碼、搞翻譯、當(dāng)家教、做總結(jié)、挖資料、頭腦風(fēng)暴啥的。這可不是以前那些工具的小打小小鬧升級(jí),這是直接把咱個(gè)人的能力值拉高了好幾個(gè)檔次,而且是全方位的。關(guān)鍵是用起來門檻低到不行——模型便宜(甚至白給)、速度快、誰都能上網(wǎng)用(甚至自己電腦上就能跑),還能用你最習(xí)慣的說話方式跟你聊,管你什么語氣、黑話還是表情包,都能懂。這簡直了!反正據(jù)我所知,普通人從來沒體驗(yàn)過這么猛、這么快的技術(shù)福利
那為啥在大公司和政府那邊,這好處就沒那么明顯呢?我覺得吧,首先,LLM能干的活兒很特別——它啥都懂一點(diǎn),但啥都不算頂尖專家,就是個(gè)“萬金油”選手。可一個(gè)公司或機(jī)構(gòu)的看家本領(lǐng),恰恰是能把各種領(lǐng)域的專家(工程師、研究員、分析師、律師、營銷大佬等等)聚在一起,集中火力干大事。LLM頂多是讓這些專家自己干活更順手點(diǎn)(比如,幫忙起草個(gè)合同初稿、生成點(diǎn)基礎(chǔ)代碼),對(duì)整個(gè)組織來說,也就是在本來就能干的事上效率高了那么一丟丟。但對(duì)咱個(gè)人來說就不一樣了,咱一般也就精通一兩個(gè)領(lǐng)域,LLM這種啥都懂點(diǎn)的“萬金油”能力,就能讓我們干成以前想都不敢想的事。現(xiàn)在普通人也能搗鼓著寫App了,能看懂法律文件了,能搞明白那些高深的論文了,能做數(shù)據(jù)分析了,能自己做圖文視頻搞宣傳了。干這些,都能達(dá)到個(gè)差不不多的水平,還不用額外再請(qǐng)專家
其次,公司和政府要處理的事兒復(fù)雜多了,協(xié)調(diào)起來也麻煩得多,想想:各種系統(tǒng)對(duì)接、老舊系統(tǒng)拖后腿、公司的形象和說話風(fēng)格要求、死嚴(yán)的安全規(guī)定、隱私保護(hù)、國際化問題、法律法規(guī)合規(guī)、還有各種風(fēng)險(xiǎn)。變量太多、限制太多、要考慮的太多,犯錯(cuò)的空間也小得多。想把這些一股腦塞進(jìn)LLM的對(duì)話框里?沒那么容易。你可不能隨便“跟著感覺走”寫代碼,萬一它給你“胡說八道”一次,你可能工作就沒了。第三點(diǎn),就是大機(jī)構(gòu)都有的那種“惰性”,大家都懂的:企業(yè)文化、老規(guī)矩、一有風(fēng)吹草動(dòng)就開始的內(nèi)部“搶地盤”、溝通成本高、給一大幫人搞培訓(xùn)也難,還有那老掉牙的官僚作風(fēng)。想讓它們快速接受一個(gè)新出的、啥都能干點(diǎn)但又不精、還老出錯(cuò)的工具?那阻力可大了去了。我不是說LLM對(duì)公司政府沒影響,但至少眼下,從全社會(huì)來看,它們給普通人生活帶來的改變,比給那些大機(jī)構(gòu)帶來的改變要大得多得多。瑪麗、吉姆、喬這些普通人才是最大的受益者,而不是谷歌或者美國政府
往后看,LLM能不能繼續(xù)普及,還得看它們能不能變得更厲害、能力更全面。這個(gè)“好處怎么分”的問題就特別有意思了,關(guān)鍵看花多少錢能買到多大程度的性能提升。現(xiàn)在呢,最頂尖的LLM性能,大家都能用上,還挺便宜。到了一定程度,你再砸錢也買不到明顯更好的性能、可靠性或自主性了。錢買不來更好的ChatGPT。比爾·蓋茨跟你我一樣,用的也是GPT-4o。但這能一直這樣嗎?訓(xùn)練時(shí)砸錢(更多參數(shù)、更多數(shù)據(jù))、用的時(shí)候花時(shí)間(更多計(jì)算時(shí)間)、或者搞“模型組團(tuán)”(用一堆模型一起上),這些都會(huì)讓花錢能買到的性能差距變大。另一方面,“模型蒸餾”(把大模型的能耐教給小模型,讓小模型也變得很強(qiáng))又在努力縮小這個(gè)差距。當(dāng)然了,要是哪天錢真能買到比現(xiàn)在好得多的ChatGPT,那情況就不一樣了。大公司就能用它們的錢砸出更強(qiáng)的智能。在“個(gè)人”這個(gè)圈子里,有錢人可能又會(huì)把普通人甩開。他們的孩子用GPT-8-pro-max-high輔導(dǎo)功課,你的孩子只能用GPT-6 mini
但至少在現(xiàn)在這個(gè)時(shí)間點(diǎn),咱們正處在技術(shù)史上一個(gè)獨(dú)一無二、前所未有的時(shí)刻。你去翻翻以前的科幻小說,很少有人能猜到AI革命會(huì)是這么個(gè)搞法。大家以為的都是政府秘密搞個(gè)超級(jí)大腦,被將軍們控制著,哪想到會(huì)是ChatGPT這樣,幾乎一夜之間冒出來,還免費(fèi),人人手機(jī)上都能用。還記得威廉·吉布森那句名言“未來已來,只是分布不均”嗎?嘿,沒想到吧——未來來了,而且這次分布得驚人地均勻!力量屬于人民! 反正我個(gè)人是超愛這一點(diǎn)的
參考:
https://x.com/karpathy/status/1909308143156240538
?星標(biāo)AI寒武紀(jì),好內(nèi)容不錯(cuò)過?
用你的贊和在看告訴我~
求贊
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.