百度創始人、CEO李彥宏
4月25日消息,鈦媒體AGI獲悉,今天上午武漢舉行的百度Create開發者大會上,百度創始人、董事長兼CEO李彥宏正式發布文心大模型4.5 Turbo和文心大模型X1 Turbo。
李彥宏認為,當下以DeepSeek為代表的部分模型仍然存在模態單一、幻覺高、速度慢和價格貴等問題,而百度發布這兩款新模型,正是為了解決這些問題。
李彥宏在演講中表示,DeepSeek橫空出世,MCP(模型上下文協議)逐漸被接受為行業標準,代碼智能體和通用智能體等多智能體協作產品被廣泛關注,越來越多的人加入到開發者的隊伍。過去一年,開源中國社區增加了150萬個開發者,但同時,不少開發者充滿了焦慮,模型迭代這么快,模型能力也越來越強,那么開發者基于大模型開發出來的應用,會不會很快就過時,就沒有價值了——這種擔心不無道理。
“大模型的世界風云變幻,幾乎每周都有發布,天天有更新。去年第四季度有49個大模型更新發布,今年一季度就有55個,最多的時候一周發8個模型。一邊,大模型的廠商卷生卷死,另外一邊對于開發者來說又無所適從,不敢放心大膽的做應用,為什么?因為擔心自己做的應用被模型迭代給快速覆蓋掉,這樣就相當于是白費了功夫。”李彥宏稱。
李彥宏認為,當前對于開發者來說是一把雙刃劍。一方面,開發者確實需要理解技術發展的趨勢,避開大模型自身發展的延長線;另一方面,日益強大的模型能力其實給開發者帶來了更多選擇,需要找對場景、選對基礎模型。
李彥宏強調,AI應用才是真正創造價值的。沒有AI應用,什么模型、什么芯片其實都沒有價值。
這是李彥宏對于 AI 技術行業的最新言論。
早前,李彥宏曾表示,中國的大模型太多。國內有200多個大模型其實都沒有什么使用量。他還曾指出,百模大戰是對社會資源的極大浪費,更多資源應該放在超級應用。同時,包括百度在內的大公司內部反應太慢、生產力落后。
2024年7月,李彥宏直言開源模型就是“智商稅”。“當你理性地去想,大模型能夠帶來什么價值,以什么樣的成本帶來價值的時候,就會發現,你永遠應該選擇閉源模型。今天無論是ChatGPT、還是文心一言等閉源模型,一定比開源模型更強大,推理成本更低。”
2024年4月百度Create大會上,李彥宏再度表示,同等效果下,成本明顯更低,所以開源 AI 模型會越來越落后。隨著今年中國開源AI大模型DeepSeek-V3/R1風靡全球之后,李彥宏的這句話再被熱議。
李彥宏曾強調,大模型的算力推理其實很貴。所以說開源大模型的價值在教學科研這些領域,要想搞清楚大模型的工作原理是什么,如果不知道源代碼什么的肯定是有劣勢的,但是真正在商業領域,當你追求的是效率、效果,追求的是最低的成本時,開源模型是沒有優勢的。
李彥宏表示,DeepSeek不是萬能的,比如它只能處理文本,還不能夠理解聲音、圖片、視頻等多模態內容,而百度智能云的很多客戶都需要這種多模理解和生成的能力;同時再比如,它的幻覺率比較高,在很多場合你不能夠放心使用,如果在電商直播當中幻覺出“買一送一”的優惠,那么商家就要賠慘了;此外,中國市場上絕大多數大模型API的調用的價格都比DeepSeek滿級版要低,而且反應速度也更快。
如今,李彥宏發布全新文心大模型4.5 Turbo和文心大模型X1 Turbo。對比文心4.5,Turbo版速度更快、價格下降80%,每百萬tokens的輸入價格僅為0.8元,輸出價格3.2元,僅為DeepSeek-V3的40%;而文心大模型X1 Turbo價格,僅為DeepSeek R1調用價格的25%,輸入價格1元/百萬tokens,輸出價格4元/百萬tokens。
此外,百度還公布基于昆侖芯三代P800的中國首個點亮的全自研的3萬卡集群,李彥宏稱其同時承載多個滿血版DeepSeek這樣千億參數大模型進行全量訓練,也可以支持1000個客戶做百億參數大模型精調。
“現在可以說,在中國開發應用,我們有底氣。”李彥宏在演講結尾表示,堅信應用創造未來,開發者創造未來。
(本文首發于鈦媒體App,作者|林志佳)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.