去年春天,Meta發布的Llama3大語言模型曾贏得開發者和獨立評測者的一致好評。然而時隔近一年,備受期待的繼任者Llama4卻遲遲未能發布。
據知情人士透露,在至少兩次推遲后,Meta計劃在本月晚些時候發布這一備受期待的AI模型——但這并非板上釘釘,仍有可能再度延期。
發布延遲背后:技術性能未達預期
據兩位了解情況的人士稱,發布推遲的關鍵原因之一,是該模型在開發過程中的技術基準測試表現未能完全達到Meta的內部預期,尤其在推理和數學任務方面存在短板。
此外,Meta內部也對其模型在模擬人類語音對話方面無法與OpenAI的頂尖水平相媲美。
技術轉向與商業化新探索:擁抱MoE與LlamaX計劃
為了提升Llama4的競爭力,Meta計劃在技術路線上做出重要調整。
媒體援引兩位知情人士消息稱,至少有一個版本的Llama4預計將采用“混合專家”(MixtureofExperts,MoE)架構,而非Llama系列此前一直堅持的“密集”(Dense)模型。
MoE方法通過將模型劃分為多個專注于特定任務的“專家”子網絡,在處理用戶請求時僅激活相關部分,從而有望在提升性能的同時提高運行效率。DeepSeek及其他多家領先的模型開發者均已采用此技術路線。
值得注意的是,Meta內部圍繞是否從Dense轉向MoE的決策,曾經歷了一場長達一年多的激烈技術辯論。最終選擇擁抱MoE,無疑也受到了DeepSeek等競爭對手成功實踐的部分影響。
在商業化層面,Meta正在積極籌劃新策略,以期更有效地將Llama推向企業市場。
媒體援引三位知情人士消息稱,公司內部正在深入討論Meta提供自營API的模式。不過,目前還不清楚該API將依托Meta自有數據中心還是租用云服務商服務器運行。
通過提供自營API,Meta或能效仿OpenAI的模式,向客戶提供諸如模型早期訪問權限、定制化技術支持等增值服務。
這些討論是Meta內部代號為"Llama X"項目的一部分,該項目源自首席戰略官David Wehner的團隊。通過Llama X,Meta還希望招聘工程師、營銷人員和銷售人員來擴大Llama的企業應用范圍。
組織重組與產品困境
為了加快發展步伐,Meta今年2月對其生成式AI團隊的技術領導層進行了調整。該團隊任命了當時的Messenger負責人Loredana Crisan領導AI產品的產品管理,并更換了工程負責人Ryan Cairns和Ning Li。隨后,Meta又任命前混合現實技術副總裁Amir Frenkel為該團隊的工程負責人。
AI部門負責人Ahmad Al-Dahle在內部表示,這些變化將使團隊"更快、更有效地行動"并幫助"作為一個團隊工作"。值得注意的是,Meta的生成式AI團隊在過去一年半從約500人急劇擴張到超過1700人,即使CEO扎克伯格近年來一直在壓縮公司成本和人員。
然而,產品方面的進展并不順利。Meta已致力于將其智能眼鏡應用Meta View轉變為Meta AI的獨立應用,希望通過這樣的應用更好地展示Meta AI的能力。但近幾周,該應用在處理分析性、復雜任務方面表現不佳,特別是在審閱大量文檔和撰寫微妙文本方面存在困難。
Meta還考慮改變以往的做法,先通過Meta AI發布Llama 4,然后再作為開源軟件發布,這與過去同時發布的策略形成對比。這樣的變化可能會提升Meta AI的使用數據,但也可能疏遠那些贊賞公司開源方式的研究人員和開發者。不過,尚不清楚Meta是否會推進這一計劃。
高額投入、不確定回報
對Meta來說,AI領域的投入巨大。公司正在為開發和運行其模型建設數據中心,今年資本支出計劃高達650億美元。更驚人的是,Meta還在討論一個可能耗資2000億美元的數據中心項目。
迄今為止,Meta在AI方面的成果喜憂參半。消費者AI方面,Meta AI助手截至今年1月擁有超過7億月活用戶,但其中部分使用被認為是非主動的,公司也尚未推出早在去年春季就有討論的付費版本。同時,Meta去年還裁撤了一組模仿名人和網紅的聊天機器人。在云計算服務商向客戶銷售Llama方面,該模型未能獲得顯著吸引力。
盡管面臨這些挑戰,據一位接近公司的人士透露,Meta依然相信Llama 4將成為行業領先模型。
盡管挑戰重重,一位接近Meta的人士透露,公司內部依然堅信Llama4將會是一款行業領先的模型。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.