5G這里我不多作評(píng)論。實(shí)際上,在約十年前5G還沒(méi)落地,標(biāo)準(zhǔn)還沒(méi)制定完畢的時(shí)期,當(dāng)時(shí)我在一家既有通信業(yè)務(wù)也有AI業(yè)務(wù)(深度學(xué)習(xí)應(yīng)用)的公司做研發(fā),恰好同時(shí)經(jīng)歷了5G投資爆發(fā)的前期和深度學(xué)習(xí)應(yīng)用爆發(fā)的前期。業(yè)內(nèi)(移動(dòng)通信技術(shù)業(yè)內(nèi))都已經(jīng)很非常明晰,由于其通信原理性的限制,5G的應(yīng)用場(chǎng)景和落地的實(shí)際性能體驗(yàn),相對(duì)4G必然非常有限。這一點(diǎn)在業(yè)內(nèi)基本不存在爭(zhēng)議,不過(guò)這些信息不可能在大眾平臺(tái)廣泛傳播,其中原因大家自行想象和理解。由于其它非技術(shù)因素,國(guó)內(nèi)5G方面的基建投入顯著超出移動(dòng)通信技術(shù)行業(yè)人員的預(yù)估,即便如此,其體驗(yàn)并沒(méi)有意料之外的相對(duì)4G的提升。
跟5G不同,在當(dāng)前這個(gè)大模型(LLM)狂熱的時(shí)代,不僅僅是AI技術(shù)背景人員的“業(yè)內(nèi)”,還是 跟AI完全不相關(guān)的人員的“業(yè)外”,我個(gè)人認(rèn)為都存在普遍性的高估。當(dāng)然,在這種普遍性的高估和狂熱的情況下,說(shuō)一點(diǎn)關(guān)于LLM被人廣泛忽略的缺陷是難免要挨罵的,關(guān)于這一點(diǎn)我已做好心里準(zhǔn)備并且體驗(yàn)過(guò)多次。
當(dāng)前大模型在大眾領(lǐng)域的熱度大爆發(fā)(以文字和圖像內(nèi)容生產(chǎn)為典型應(yīng)用),跟十年前的深度學(xué)習(xí)在大眾領(lǐng)域熱度大爆發(fā)(以人臉識(shí)別/美顏/自動(dòng)駕駛為典型應(yīng)用),在熱度上沒(méi)有太大差別。不同的是,十年前國(guó)內(nèi)的創(chuàng)投市場(chǎng)還十分火熱,大家的資金還非常充裕,伴隨著對(duì)追蹤不上技術(shù)發(fā)展的緊張的,是似乎用不完的投資資金。而如今,投資資金規(guī)模已大不如前,伴隨著這種對(duì)追蹤不上技術(shù)發(fā)展的緊張的,是深刻的力不從心感。
從我個(gè)人在AI行業(yè)不到20年的短暫學(xué)習(xí)和工作經(jīng)歷來(lái)看,類似的周期性潮起潮落就已經(jīng)經(jīng)歷過(guò)不少于4次,支持向量機(jī)(SVM), 概率圖模型(PGM), 深度學(xué)習(xí)(DL)和目前深度學(xué)習(xí)的繼續(xù)發(fā)展下的大語(yǔ)言模型, 多模態(tài)信息仍然被轉(zhuǎn)換為語(yǔ)義進(jìn)行處理)各領(lǐng)風(fēng)騷幾年,行業(yè)熱點(diǎn)不斷變換. 很多從業(yè)者也不得不主動(dòng)或者被動(dòng)的跟隨。
但在這些不斷發(fā)展之中,作為從業(yè)者/研發(fā)者和應(yīng)用落地者,業(yè)內(nèi)在1984年提出的一些基礎(chǔ)問(wèn)題得到了很好的解決了嗎?
我們捫心自問(wèn),不難得出一個(gè)顯然的結(jié)論:并沒(méi)有。而且本次的爆發(fā)跟1984年之前的那一輪爆發(fā),在社會(huì)上的影響似乎也沒(méi)有本質(zhì)區(qū)別。一樣的社會(huì)性緊張、一級(jí)市場(chǎng)緊張 以及 從業(yè)者的緊張。實(shí)際上,1984年前那一輪緊張還觸發(fā)和塑造了我們今天視之為理所當(dāng)然的科幻小說(shuō)/電影的主題形態(tài)(賽博朋克等)。
從原理性角度粗加理解,這種“不解決”也是理所當(dāng)然的。大模型的“幻覺(jué)”(Hallucination)問(wèn)題,并非是 “幻覺(jué)”字面上這么簡(jiǎn)單,它實(shí)際上是內(nèi)生的,不可避免的,在當(dāng)前技術(shù)路線下永遠(yuǎn)存在且不可忽視的。連接主義統(tǒng)計(jì)機(jī)器學(xué)習(xí)中這類擬合條件概率分布的基礎(chǔ)做法,對(duì)于非線性的現(xiàn)實(shí)世界具有天然的無(wú)力感。
而人類的智能相比于連接主義統(tǒng)計(jì)機(jī)器學(xué)習(xí)AI來(lái)說(shuō),更擅長(zhǎng)處理這些現(xiàn)實(shí)世界普遍存在的非線性問(wèn)題,而不是統(tǒng)計(jì)性的概率分布擬合和計(jì)算。前者需要很少的樣本甚至零樣本,也同時(shí)需要對(duì)“概念”、“規(guī)則”的“理解”,從而產(chǎn)生“邏輯”。后者則需要大量的樣本進(jìn)行訓(xùn)練,但缺乏內(nèi)生性的“概念”和“規(guī)則”,從而不會(huì)產(chǎn)生“邏輯”。神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性函數(shù)擬合能力,但我們也都明確的知道,即使是在數(shù)據(jù)量非常大且數(shù)據(jù)無(wú)噪聲的時(shí)候,神經(jīng)網(wǎng)絡(luò)擬合任何非線性函數(shù)的誤差都不是0,這一點(diǎn)跟存粹的使用非線性函數(shù)進(jìn)行前向推理(邏輯推理)是不一致的。在進(jìn)行符號(hào)邏輯推理時(shí)候,我們還必須面對(duì)如何將符號(hào)對(duì)象 跟 非線性函數(shù)中的語(yǔ)義對(duì)象對(duì)應(yīng)起來(lái)的問(wèn)題。在大語(yǔ)言模型中,我們使用vocab的embedding疊加position embedding進(jìn)行語(yǔ)義對(duì)象的學(xué)習(xí)和對(duì)應(yīng)。顯然,這個(gè)對(duì)應(yīng)關(guān)系的學(xué)習(xí)的結(jié)果也不會(huì)100%的準(zhǔn)確。目前的大模型方案,是試圖使用全世界的可得樣本去解決,但這種技術(shù)路徑顯然不是“解決”,而是“緩解”(Mitigate)。
這些內(nèi)生性問(wèn)題,一直制約著AI的應(yīng)用范圍的擴(kuò)張。在應(yīng)用中,如果對(duì)準(zhǔn)確性、可靠性有很高的要求(比如需要承擔(dān)法律責(zé)任,對(duì)于錯(cuò)誤需要承擔(dān)包括客服解釋、損失賠償?shù)冉?jīng)濟(jì)成本),則應(yīng)用擴(kuò)張的零邊際成本(Zero Marginal Cost)不可能達(dá)到,也就是不可避免的高人工維護(hù)成本。
同時(shí),連接主義統(tǒng)計(jì)機(jī)器學(xué)習(xí)AI不可能通過(guò)自身產(chǎn)生的數(shù)據(jù)樣本來(lái)提升性能。這在當(dāng)前大模型技術(shù)發(fā)展路徑下也限制了其性能提升的邊際速率。在這種意義下,Transformer 解決的模型和訓(xùn)練數(shù)據(jù)的Scale Up問(wèn)題,在現(xiàn)實(shí)的引力下已經(jīng)發(fā)展到了極限。我們甚至可以武斷的說(shuō),在當(dāng)前還沒(méi)有很好解決的問(wèn)題,多半不可能通過(guò)大模型更好的解決了。
當(dāng)前,很多人已經(jīng)認(rèn)為AGI幾年之內(nèi)就能產(chǎn)生了。AGI真就這么簡(jiǎn)單達(dá)到嗎?這個(gè)問(wèn)題目前似乎變成了怎么定義AGI的問(wèn)題。作為前人腦研究者以及現(xiàn)AI從業(yè)者,我對(duì)人類智能有信心,對(duì)連接主義統(tǒng)計(jì)機(jī)器學(xué)習(xí)AI不可能接近人類智能也有信心。潮起又潮落,每個(gè)弄潮的人追求的不一樣,很多人追求的只是在潮水中獲取自己的利益而已,在這種利益驅(qū)動(dòng)下,隨大流說(shuō)一些違背自己認(rèn)知和良心的話也是可以理解的。引用“The dark ages of AI: a panel discussion at AAAI-84”中的一句話結(jié)束吧:
The real problem is that what reporters see as real issues in the world are very different from what the AI community sees as real issues.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.