不可否認(rèn),本輪生成式AI浪潮,同樣出現(xiàn)了預(yù)期過(guò)高的“泡沫”狀態(tài),但由于生成式AI的重資產(chǎn)投入特性,一些徒有其表的“偽創(chuàng)新”將會(huì)被毫不留情地清洗。大浪淘沙之后,以百度為代表的一批真正有技術(shù)實(shí)力、創(chuàng)新精神的公司將會(huì)脫穎而出,為社會(huì)帶來(lái)真正的價(jià)值。
“這個(gè)世界不應(yīng)該被吞噬,而應(yīng)該被創(chuàng)造。AI時(shí)代,應(yīng)用創(chuàng)造世界。”
雙十一購(gòu)物節(jié)收官的第二天,也就是11月12日,2024百度世界大會(huì)在上海世博中心開(kāi)幕。相較以往,本次世界大會(huì)的豐富程度不遑多讓。李彥宏在短短1個(gè)多小時(shí)的時(shí)間里,將百度過(guò)去一年的技術(shù)演進(jìn)悉數(shù)呈現(xiàn)。
在過(guò)去24個(gè)月的時(shí)間里,生成式AI的進(jìn)化速度,超出了大多數(shù)人的想象。其中最顯著的代表性變化,則是模型的幻覺(jué)被極大消除——不僅是文字層面,在圖片生成上,一如百度新推出的檢索增強(qiáng)的文生圖技術(shù) iRAG,將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,就可以生成各種超真實(shí)的圖片。
另一方面,是模型規(guī)模控制日漸嫻熟,調(diào)優(yōu)技術(shù)的日益演進(jìn)使然。不過(guò)更重要的點(diǎn)在于,相較以往面對(duì)基礎(chǔ)大模型的簡(jiǎn)單“套殼”,如今已經(jīng)有AI搜索、智能體等更成熟的應(yīng)用加持,其技術(shù)力、可信度都實(shí)現(xiàn)了質(zhì)的提升。
在世界大會(huì)上,李彥宏指出,過(guò)去這24個(gè)月,大模型基本消除了幻覺(jué),它回答問(wèn)題的準(zhǔn)確性大大地提升了——這讓AI從“一本正經(jīng)的胡說(shuō)八道”,變得可用、可被信賴。
不可否認(rèn),本輪生成式AI浪潮,同樣出現(xiàn)了預(yù)期過(guò)高的“泡沫”狀態(tài),但由于生成式AI的重資產(chǎn)投入特性,一些徒有其表的“偽創(chuàng)新”將會(huì)被毫不留情地清洗。大浪淘沙之后,以百度為代表的一批真正有技術(shù)實(shí)力、創(chuàng)新精神的公司將會(huì)脫穎而出,為社會(huì)帶來(lái)真正的價(jià)值。
生成式AI的“去泡沫時(shí)代”
如果將時(shí)間軸拉長(zhǎng),AI從誕生開(kāi)始至今,歷經(jīng)的“泡沫”和“去泡沫”時(shí)代,難以數(shù)說(shuō)。
在這次生成式AI浪潮中,又卷模型又卷應(yīng)用的創(chuàng)業(yè)方,成本不僅涵蓋了人力、運(yùn)營(yíng),還有算力、模型等昂貴的硬件成本,都需要自行融資承擔(dān)。這導(dǎo)致無(wú)論是出資方還是創(chuàng)業(yè)方,其承受的壓力比移動(dòng)互聯(lián)網(wǎng)時(shí)代的創(chuàng)業(yè)更大,出清速度也會(huì)更快。
正如李彥宏所言,泡沫過(guò)后,一些無(wú)法滿足市場(chǎng)需求的偽創(chuàng)新將會(huì)被清洗掉,在這之后,有1%的企業(yè)將脫穎而出,繼續(xù)成長(zhǎng),為社會(huì)創(chuàng)造巨大價(jià)值。現(xiàn)在,我們只是在經(jīng)歷這個(gè)階段,這個(gè)行業(yè)比去年更冷靜,也更健康。
這段話并非空穴來(lái)風(fēng),一方面,基于通用大模型稍加修改即上線的“AI產(chǎn)品”,在GPT出世的前一年如雨后春筍,但到現(xiàn)在已經(jīng)十不存一;另一方面,真正“活下來(lái)”,并不斷迭代形態(tài)的原生AI應(yīng)用,正以超出預(yù)期的速度發(fā)展并壯大。
以百度為例,文庫(kù)業(yè)務(wù)和智能體等業(yè)務(wù)的重構(gòu)與跨越,是李彥宏重點(diǎn)提出的發(fā)展目標(biāo)。
如今回過(guò)頭來(lái),我們不難發(fā)現(xiàn),李彥宏年初畫(huà)下的“大餅”,如今多數(shù)已成現(xiàn)實(shí)。
譬如公司類的智能體,它相當(dāng)于AI時(shí)代的企業(yè)官網(wǎng),原有的公司介紹、產(chǎn)品圖片、參數(shù)展示等必要信息一應(yīng)俱全,還能針對(duì)用戶特征和需求進(jìn)行智能推薦,替代人工進(jìn)行及時(shí)響應(yīng)和主動(dòng)服務(wù),幫助客戶更全面立體地了解產(chǎn)品。
如今,在百度APP搜索“比亞迪”,就能直接喚起它的官方智能體。除了默認(rèn)的公司介紹,還能基于自身需求輸入各類相關(guān)問(wèn)題,而非以往的“定向問(wèn)答”。智能體的直接效果則是比亞迪的官方智能體上線后,銷(xiāo)售線索的轉(zhuǎn)化率完成了翻番,提升了119%。
再如工具類的智能體,典型者如百度文庫(kù)和網(wǎng)盤(pán)聯(lián)合開(kāi)發(fā)的工具類智能體——“自由畫(huà)布”。
據(jù)了解,它不僅支持包括文檔、圖片、音視頻等多格式文件的自由輸入,還能對(duì)上述多格式文件進(jìn)行AI總結(jié),重點(diǎn)框記,據(jù)此完成新內(nèi)容的AI創(chuàng)作,播客的制作同樣也不在話下。需要注意的是,生成的文件,已經(jīng)不再是單一媒體格式,模態(tài)已經(jīng)多樣化。
此時(shí),與網(wǎng)盤(pán)的聯(lián)動(dòng)價(jià)值開(kāi)始體現(xiàn)——僅僅通過(guò)一個(gè)鏈接,就可以通過(guò)一個(gè)鏈接,直接實(shí)現(xiàn)分享、查看、二次編輯等操作,還能一鍵存儲(chǔ)至百度網(wǎng)盤(pán)。
對(duì)于范圍更大,更下沉的普通C端用戶,則到了端到端行業(yè)智能體的發(fā)力點(diǎn)。但這類專業(yè)智能體,僅靠百度一家,同樣孤掌難鳴。因此,百度邀請(qǐng)了英偉達(dá)作為技術(shù)合作伙伴,以“智能體創(chuàng)新大賽”的形式,創(chuàng)造出更多有價(jià)值的智能體應(yīng)用,并為千行百業(yè)的用戶使用和分享——截至目前,文心智能體平臺(tái)已經(jīng)吸引了多達(dá)15萬(wàn)家企業(yè)和80多萬(wàn)名開(kāi)發(fā)者參與。
新生態(tài) 新驅(qū)動(dòng)
據(jù)弗若斯特沙利文發(fā)布的報(bào)告《2024年全球AI生態(tài)全景概覽》,在全球AI生態(tài)全景中,百度與谷歌、OpenAI位于AI-Native Giant 同一象限。
當(dāng)然,這不是簡(jiǎn)單的“排座次”——當(dāng)一家AI公司,其模型、應(yīng)用、生態(tài)等層面,已經(jīng)形成自我造血的“自循環(huán)”,方能在其中占據(jù)一席之地。
OpenAI作為AI原生巨頭,自是有一席之地,但就在幾天前,他也不得不坦言,“總體上,產(chǎn)品是我的弱點(diǎn)”。
而要實(shí)現(xiàn)商業(yè)化,基于可用模型的應(yīng)用層,則是必由之路,AI廠商“卷應(yīng)用”的時(shí)代,已然到來(lái)。
根據(jù)李彥宏在世界大會(huì)現(xiàn)場(chǎng)的分享,他曾在半年前,與高管們討論大模型“成了”的標(biāo)準(zhǔn),“我當(dāng)時(shí)說(shuō),如果我們的調(diào)用量日均的API調(diào)用量,大模型API調(diào)用量,一年之內(nèi)如果漲10倍,也就是從2億漲到20億,一年時(shí)間漲10倍,我認(rèn)為就成了,就說(shuō)明大家是真需要。 ”
而在半年時(shí)間里,文心大模型的日均API調(diào)用量增長(zhǎng)7.5倍,目前已經(jīng)超過(guò)15億次,距離李彥宏20億的目標(biāo),已經(jīng)非常接近。
一方面,這是基于文心大模型的先發(fā)優(yōu)勢(shì),在最早時(shí)間獲取了最大數(shù)量的“種子用戶”使然;另一方面,其在近兩年時(shí)間里的進(jìn)化速度,同樣有目共睹。
其中一個(gè)顯著變化是,基于神經(jīng)網(wǎng)絡(luò)技術(shù)路線的大模型,其固有的“幻覺(jué)”缺陷,已經(jīng)很大程度上被克服,具體的體現(xiàn)則是回答問(wèn)題的準(zhǔn)確性大幅提升。
眾所周知,基于模型內(nèi)部的“黑盒”屬性,其具體的推理過(guò)程和模型決策過(guò)程,至今仍然難以一窺全貌。它的技術(shù)根源在于,AI技術(shù)的本質(zhì)在于對(duì)語(yǔ)言的概率模型預(yù)測(cè),通過(guò)龐大的訓(xùn)練數(shù)據(jù)對(duì)下一個(gè)token進(jìn)行推測(cè)。當(dāng)這種生成機(jī)制不足以捕捉復(fù)雜的上下文關(guān)系時(shí),模型就可能毫無(wú)根據(jù)地生成顯著偏離事實(shí)的信息。
百度祭出的解決方案,則是“RAG”技術(shù),它包括兩個(gè)主要階段:檢索上下文相關(guān)信息和使用檢索到的知識(shí)指導(dǎo)生成過(guò)程。這個(gè)過(guò)程使得大模型能夠更準(zhǔn)確地回答用戶的問(wèn)題。
截至目前,文字層面的RAG應(yīng)用已經(jīng)臻于成熟。日均15億次的API調(diào)用量,一方面是用戶“用腳投票”,佐證文心一言的可用,好用;另一方面,源源不斷的調(diào)用,所產(chǎn)生的新數(shù)據(jù),也可用于文心一言的進(jìn)一步調(diào)優(yōu),使其準(zhǔn)確性更上一層樓。
不過(guò),文生圖環(huán)節(jié),是相比文生文不遑多讓的“幻覺(jué)”重災(zāi)區(qū),用戶對(duì)于提示詞的不熟練是一方面,生成效果“過(guò)于古神”又是另一方面。比較顯著的一個(gè)例子,則是七八個(gè)手指的手掌,和四層樓的天壇。
今年初百度決定解決圖形生成的幻象問(wèn)題,自研的IRAG技術(shù),即是集中的成果體現(xiàn)。它結(jié)合了檢索和生成的技術(shù)方法,可以有效提升生成內(nèi)容的可靠性和準(zhǔn)確性,且對(duì)各種指令的理解,精準(zhǔn)度更高。
還是以天壇為樣本,如果在文心一言4.0turbo里輸入“在雪山里的天壇”,如今能“立等可取”的結(jié)果,不僅是三層樓的,存在于現(xiàn)實(shí)世界里的“真實(shí)天壇”,其后的雪山場(chǎng)景,也可以根據(jù)用戶的各種商業(yè)與非商業(yè)的需求,生成自己想要的效果,已經(jīng)無(wú)限接近商用場(chǎng)景。
至此,百度也為圖生文應(yīng)用打開(kāi)了商業(yè)化的大門(mén),讓生成結(jié)果有了真正的用武之地。
AI與三駕馬車(chē)
無(wú)論是雨后春筍般涌現(xiàn)的原生AI智能體,抑或是“RAG”加持的文生文、文生圖應(yīng)用,諸如此類的智能產(chǎn)業(yè)生態(tài),其穩(wěn)定運(yùn)行必須要有穩(wěn)定的算力提供和針對(duì)模型的精調(diào)服務(wù),就百度而言,其智能云服務(wù)則是主要依托。
作為國(guó)內(nèi)最大的連鎖餐飲集團(tuán)之一,百勝與百度的合作頗具代表性。早期合作階段,百度先幫助百勝完成了新增門(mén)店選址工作,數(shù)量達(dá)到數(shù)千家;
深入到客服領(lǐng)域,針對(duì)龐大且復(fù)雜的客訴需求,百度提供了大模型加持的客服產(chǎn)品,解決了此前百勝因?yàn)殡y以識(shí)別客戶真實(shí)意圖,沒(méi)法關(guān)聯(lián)上下文的問(wèn)題。
截至目前,客服應(yīng)用和解決方案已經(jīng)覆蓋了百勝全線業(yè)務(wù),大模型調(diào)用量也升至百萬(wàn)級(jí),其“問(wèn)題解決率”上升到了90%,但這只是一個(gè)開(kāi)始,隨著千帆平臺(tái)、文心Speed模型、基礎(chǔ)云算力服務(wù)等能力的提供,百勝已經(jīng)擁有了初步且完善的大模型底座能力,后續(xù)的AIGC應(yīng)用開(kāi)發(fā)計(jì)劃,已經(jīng)不再是空中樓閣。
自動(dòng)駕駛同樣也是大模型重構(gòu)的重點(diǎn)環(huán)節(jié)。一方面,Apollo自動(dòng)駕駛開(kāi)放平臺(tái)10.0即將發(fā)布,將搭載百度最新的自動(dòng)駕駛大模型ADFM,大模型“上車(chē)”的意義,某種程度上與重構(gòu)其它業(yè)務(wù)的邏輯一致,在于提升自動(dòng)駕駛開(kāi)放平臺(tái)的安全性、智能化和易用性。
所謂安全性,是指其自動(dòng)駕駛的安全性要做到人類駕駛員的10倍以上。截至2024年6月,百度自動(dòng)駕駛實(shí)際道路測(cè)試與示范里程超過(guò)1億公里,從未發(fā)生過(guò)重大傷亡事故;為每輛無(wú)人車(chē)及乘客購(gòu)買(mǎi)了保額為500萬(wàn)的保險(xiǎn),過(guò)去兩年的數(shù)據(jù)顯示,實(shí)際車(chē)輛出險(xiǎn)率僅為人類司機(jī)的1/14。這也在客觀上,為其創(chuàng)造了進(jìn)軍全球的條件。
在世界大會(huì),李彥宏用“AI applications are creating the world”作為了整場(chǎng)演講的結(jié)語(yǔ)(AI 應(yīng)用正在創(chuàng)造這個(gè)世界),他之所以有如此底氣,很大程度在于,通過(guò)近兩年時(shí)間的全面重構(gòu),百度原有的產(chǎn)品矩陣,借助更集中的用戶生態(tài)和用戶數(shù)據(jù),得到了再進(jìn)一步的可能性。
這不是所謂的“百尺竿頭,更進(jìn)一步”,而是在生成式AI的“軍備競(jìng)賽”上,無(wú)論是卷應(yīng)用還是卷生態(tài),每在技術(shù)和應(yīng)用上前進(jìn)一步,意味著整體效率的提升,其身位與后來(lái)者,將會(huì)拉得更遠(yuǎn),而在馬太效應(yīng)極為明顯的AI行業(yè),則是“全部帶走”和“一無(wú)所有”的差別。
很顯然,想用AI創(chuàng)造一個(gè)世界的李彥宏,和他的百度,在進(jìn)步或平庸的選擇題上,并沒(méi)有過(guò)任何遲疑。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.