中美大模型爭霸進入新周期!
昨日,美媒路透社爆料百度將在3月中下旬發布文心大模型4.5。
今天凌晨,OpenAI發布最新模型GPT-4.5。這款史上最貴模型讓不少用戶“望洋興嘆”。
緊接著在今天下午,百度重磅官宣:3月16日發布文心大模型4.5,具備原生多模態、深度思考等能力,并計劃于6月正式開源!
繼DeepSeek-R1后,百度文心大模型4.5備受國內大模型圈的期待,這期間,中美大模型競爭攻守之勢已然發生轉變。
OpenAI的這次發布略顯倉促,OpenAI前員工安德烈·卡帕西提前體驗了GPT-4.5。他認為,GPT-4.5主要提升在于非推理密集型任務上的改進,這些任務多與情商有關,而在數學、代碼等領域,GPT-4.5并不擁有最強的能力。
GPT-4.5被倉促推出的背后,來自中國大模型競爭加劇的壓力可能是重要原因。
今年春節期間DeepSeek憑借低成本、高性能的開源大模型爆火,引發大模型行業震動。國內大模型領域的重要力量,百度也宣布開源、免費。OpenAI CEO山姆·奧特曼直呼,在開源AI軟件方面“OpenAI站在歷史的錯誤一邊”,焦慮感溢于言表。
以DeepSeek、百度文心為代表的中國大模型廠商,通過優化成本、提高效果,吹響了全面超越美國大模型的號角。
接連開源、免費,百度開放動作不斷
根據百度官方介紹,即將于3月16日發布的文心大模型4.5是百度最強的下一代大模型,在基礎模型能力上有大幅提升,且具備原生多模態、深度思考等能力。更重要的是,這款最強大模型計劃于6月30日正式開源。
自春節以來,百度大模型策略可謂全面轉向開放,接連宣布免費、開源。
百度智能云早在2月3日春節假期就宣布開放,DeepSeek-R1及DeepSeek-V3兩款效果領先的大模型已上架至千帆ModelBuilder平臺,隨即,百度智能云正式推出千帆DeepSeek一體機,同時百度百舸基于昆侖芯P800,發布部署 “滿血版DeepSeek R1+聯網搜索” 服務。
大模型產品端,2月13日,文心一言在官網宣布將于4月1日0時起全面免費,所有PC端和App端用戶均可體驗文心系列最新模型,以及超長文檔處理、專業檢索增強、高級AI繪畫、多語種對話等功能。
同時,文心大模型深度搜索功能于2月13日上線,具備更強大的思考規劃和工具調用能力,可為用戶提供專家級內容回復,并處理多場景任務,實現多模態輸入與輸出。這一功能在4月1日起也將免費供文心一言用戶使用。
2月16日晚間,百度搜索宣布將全面接入DeepSeek和文心大模型最新的深度搜索功能,同日,百度文心智能體平臺宣布接入DeepSeek。
2月18日,在百度2024年Q4及全年財報電話會上,百度創始人、董事長兼首席執行官李彥宏透露,文心大模型4.5將開源,開源4.5系列的決策源自于對技術領先地位的堅定信心,開源將進一步促進文心大模型的廣泛應用,并在更多場景中擴大其影響力。
百度這一系列組合拳打下來,直接將大模型行業拉進入“免費+開源”的新階段,無疑將助推大模型應用爆發,也讓自己在這場以“應用落地”為主題的大模型的第二場競賽中占據主動權。
成本更低、效果更好
國產大模型趕超美國提速
事實上,如同李彥宏所言,開源,是對技術領先的堅定信心。這種領先,將在成本更低、效果更好兩方面擊穿美國大模型的優勢。
OpenAI今天剛剛發布的GPT-4.5,是其史上參數規模最大的模型,其計算量是上一代的10倍。也是最貴的模型,GPT-4.5的API價格為每百萬Tokens 75美元,相較GPT-4o上漲30倍。
性能上,盡管GPT4.5更具情商,但是GPT-4.5不具備推理能力,也不能完全替代GPT-4o。其創始人Sam Altman表示,GPT-4.5沒有“碾壓基準測試”。評估AI模型解決現實世界軟件問題的能力的基準測試SWE-Bench Verified中,GPT-4.5能力超過GPT-4o,但是低于o1、o3-mini。
整體看來,GPT-4.5表現差強人意,高昂的費用也讓用戶直呼“用不起”。
國內大模型訓練路線則完全不同。
DeepSeek就以低成本、高性能出圈。百度也一直在強調低成本的重要性。
在24年初的財報電話會上,李彥宏曾經透露,自發布以來,百度不斷降低文心大模型的推理成本,已降低至一年前的1%。
不久前,李彥宏在迪拜AI峰會上表示,隨著文心大模型的迭代升級,其訓練和推理成本正在迅速下降。根據摩爾定律,每18個月,性能就會翻倍而價格減半。大型語言模型,12個月內推理成本基本上可以降低90%以上成本。
百度自研芯片昆侖芯能夠在更少的計算資源下運行大規模模型這使得大模型的推理和訓練所需的計算量減少,從而直接降低算力成本。近日,百度智能云成功點亮昆侖芯三代萬卡集群,這也是國內首個正式點亮的自研萬卡集群。大規模集群通過任務并行調度、彈性算力管理等方式,提高計算資源利用率,避免算力閑置,提高單任務的計算效率,降低整體算力成本。
效果方面,DeepSeek-R1的深度推理讓人驚艷,即將于3月16日發布的文心大模型4.5不僅在基礎模型能力上有大幅提升,且具備原生多模態、深度思考等能力。
百度深耕大模型多年,文心大模型的RAG能力是目前國內最強的,去年百度推出了自研的iRAG等技術,大幅降低圖片生成領域的幻覺。比如近期文心一言上線的“深度搜索”功能就在RAG能力上表現突出,尤其在專業領域問答幻覺率低。
上述這些表現,讓我們可以合理預期文心大模型4.5在幻覺方面將降低到新水平。
一直以來,李彥宏都強調大模型的應用,基礎模型只有在大規模解決現實問題時,才具備真實價值。因此,百度文心大模型持續追求更低成本、更好效果,不斷降低大模型的應用普及落地門檻,要讓人人都用得起,人人都用得上。
在這場以“應用落地”為主題的大模型第二場競賽中,DeepSeek、百度等頭部玩家率先開啟了開源開放低成本新玩法,OpenAI也被迫加速了模型發布和開源的腳步,中美大模型間的較量仍將持續,但形勢相比2年前,已經大不一樣了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.