本文系基于公開資料撰寫,僅作為信息交流之用,不構成任何投資建議
在過去兩年的大模型熱戰中,無論是垂直創業的AI六小龍,還是全押AI的互聯網大廠,中國的參與者都在不約而同地在尋找大模型商業邏輯的閉環:
在動輒百億的資本開支面前,大模型作為某種意義上的基礎設施,其規模效應需要盡早浮現,其商業化路徑需要盡早清晰化。
而在12月18日字節火山引擎冬季FORCE原動力大會,關于AI應用該如何商業化的答案,火山引擎給出了非常確定性的答案:
從技術層面,火山引擎成功的拓展了模型邊界,實現多模態發展;而從商業變現層面,火山引擎則是通過平價,實現了AI普惠。
01
更強的模型,來自火山引擎的視覺智能
今天的大模型,或者說,作為服務的大模型(MaaS),是AI時代的底座。
經歷了參數爆炸,算法堆積,算法優化這三個必經階段之后,Force大會上的字節展現出了“更強模型”的能力。
我們不妨從數字角度,來理解這次的豆包大模型的全面升級:
此次推出的通用模型pro,相較5月15日發布版本,綜合任務處理能力較5月份提升32%,在推理上提升13%,在指令遵循上提升9%,在代碼上提升58%,在數學上提升43%,在專業知識領域能力提升54%,能力已全面對齊GPT-4o;
音樂模型從生成60秒的簡單結構,升級到生成3分鐘的完整作品;
文生圖模型2.1版本,更是在業界首次實現精準生成漢字和一句話P圖的產品化能力。
發布豆包·3D生成模型,支持文生3D、圖生3D及多模態生成,以及復雜物品、物品組合大規模場景生成,支持多模態3D資產編輯。
更值得重點關注的是,在開幕式上率先正式發布的豆包視覺理解模型,將能夠為企業提供極具性價比的多模態大模型解決方案。
很顯然,在一個信息80%來自于視覺的世界里,視覺理解將極大的拓展大模型的能力邊界,同時也將降低人們與大模型交互門檻,為大模型解鎖更豐富的應用場景。
根據火山引擎總裁譚待介紹,豆包視覺理解模型不僅能精準識別視覺內容,還具備出色的理解和推理能力,可根據圖像信息進行復雜的邏輯計算,完成分析圖表、處理代碼、解答學科問題等任務;此外,該模型有著細膩的視覺描述和創作能力。
此前,豆包視覺理解模型已經接入豆包App和PC端產品。明年1月,豆包視頻生成大模型還將正式發布,在視覺這個最重要的模態上面,字節產品擁有不小優勢。
02
火山引擎的AI普惠理念,是科技發展的必然走向
今天的大模型競爭,讓我常常想起70年前,美國原子能委員會主席的劉易斯·施特勞斯,在1954年全國科學作家協會的演講中,他一錘定音的提到“Too cheap to meter”(太過廉價而無需計量),這一短語從此一炮走紅:
“我們可以期望:我們的子孫后代將在家中享受(too cheap to meter)廉價到無需計量的電能;世界上周期性的地區性大饑荒將被視為歷史事件;我們將毫不費力地在海上、海底和空中旅行,危險極小,速度極快;隨著人類逐漸了解導致衰老的原因,子孫的壽命將比我們長得多?!?/p>
在領導核能開發和管理的施特勞斯眼中,技術豐饒主義不再是一種假設,而是一種堅定樂觀主義的鐵律。
這一點在互聯網和AI主導的比特世界成為了現實:今天的流量邊際成本幾乎為零,在互聯網領域實現了科技物種大爆發,無窮多的參差多態由此誕生。
從社交網絡,到短視頻平臺,再到社交電商和AI大模型,一切壟斷都被無情打破,技術爆發每天都在上演。
而全球數以十億計的科技開發者和數以千萬計的互聯網用戶,都在這場物種大爆發中,得到了前所未有的豐饒體驗。
科技進步必然帶來廉價和普惠,而AI的普惠時代,從本次字節發布會中的定價邏輯中也可窺得一二:
在此次發布會中,能力已經跟GPT-4o對齊的豆包通用模型pro,價格只有前者的1/8。
而最新重磅推出的豆包視覺理解模型,會把圖像編碼轉換為tokens,千tokens輸入價格僅為0.003元,也就是3厘;換算一下大概是一元錢就可處理284張720P的圖片,這一價格比國內外同行便宜85%。
低價并不是想挑起行業在供給側的價格戰,而遵循的是火山引擎技術進步帶來AI普惠愿景:
豆包大模型的普惠,不是簡單的不計成本價格戰,而是通過更強的技術優化,降低使用成本,讓更多用戶都能用得起多模態模型的同時,豆包大模型本身仍然能保持合理毛利。
我們不妨用火山引擎總裁譚待自己的朋友圈來說明這個問題:豆包大模型能力強和價格低的背面,仍然能夠獲得合理的毛利,是技術能力,工程能力,軟硬件結合能力的綜合體現。
一如當年的互聯網的繁榮,靠的絕不是小院高墻式的價格歧視,而是基于開源的AI普惠邏輯:只有建立在AI普惠基礎上物種大爆發,才會帶來全行業的更健康高速的增長。
03
更低門檻,技術普惠的開啟
更強的模型,搭配更低的使用價格,讓使用者、開發者、B端企業的使用門檻都被大大降低了。與企業生產力相關的B端場景,豆包大模型也獲得了眾多企業客戶青睞。
今天,豆包大模型已經與八成主流汽車品牌合作,并接入到多家手機、PC等智能終端,覆蓋終端設備約3億臺,來自智能終端的豆包大模型調用量在半年時間內增長100倍。
最近3個月,豆包大模型在信息處理場景的調用量增長了39倍,客服與銷售場景增長16倍,硬件終端場景增長13倍,AI工具場景增長9倍,學習教育等場景也有大幅增長。
此外,本次發布會火山引擎升級了火山方舟、扣子和HiAgent 三款平臺產品,幫助企業構建好自身的 AI能力中心,高效開發 AI 應用;其中,火山方舟發布了大模型記憶方案,并推出prefix cache 和 session cache API,降低延遲和成本。
火山方舟還帶來全域 AI 搜索,具備場景化搜索推薦一體化、企業私域信息整合等服務。
04
科技就是一個普惠史
縱觀人類科技發展史,就是一個用更低的價格做出更好的產品、完成最大程度普惠的過程。
如芯片上晶體管密度在摩爾定律的指導下快速提升,但單位晶體管的制造成本卻以更快的速度下降,這也才有了后來所有人都能用得起的電視、電腦、手機以及互聯網。
在近幾年,馬斯克更是將特斯拉汽車的價格,從最初的166萬,降到100萬以內,再降到50萬以內,現在是30萬以內,未來計劃推更平價的版本。這種策略才使得優質好價新能源汽車得以在全球快速普及。
一如當年的互聯網時代,平臺和用戶,形成了相互促進的雙邊“網絡效應”,最后大幅降低了實體經濟的交易成本,并催生出欣欣向榮的新經濟業態,讓全球至今仍在受益。
AI在大發展兩年之后,摸索出方法的頭部企業,也開始進入生態構建階段。
如果我們站在生態角度,就更能理解火山引擎字面的真實含義:火山意味著爆發,AI在B端和C端應用的層出不窮;但爆發需要有強力的引擎,也就是極強的經濟性,只有將模型使用成本降下來,才能發揮出引擎的作用。
以這次發布的豆包視覺理解模型為例,在普惠的基礎上,該模型彩可以更好的在眾多日常生活場景中大顯身手:
?電商場景,用豆包視覺理解模型構建出多模態的 AI搜索和推薦,幫助用戶輕松實現拍照找同款,而且基于已經購買的商品,可以去進一步的推薦適合的穿搭,客戶體驗全面升級;在電商營銷側,還可以幫助商家充分描述商品細節,高效發布種草廣告。
?教育場景,豆包視覺理解模型不僅可以讓傳統的拍照搜題更加智能,還可以進一步對孩子的作業進行批改和針對性的輔導,優化作文、科普知識,提高兒童教育效率。
?旅游場景,幫助游客看外文菜單、講解照片中建筑的背景知識等等。
不僅僅是以上場景,豆包視覺理解模型在發布之前,已經協同數百家企業進行了測試。由于普惠性,未來視覺大模型的應用,必將涉及金融、醫療、教育、建筑、體育、物流等諸多行業。
05
結語
AI大模型的核心底層價值之一,仍然是基于信息將人在場景中進行連接。
今天火山引擎推動的高性能、低成本模型,讓每一位開發者和每一家企業都能用得起。而創新的力量,往往來自很多看似并不起眼的小團隊。當越來越多有想法、有沖勁的創業者投身AI大潮中,大模型或許很快就會走進每個人的生活。
轉載開白 | 商務合作 | 內容交流
請添加微信:jinduan008
添加微信請備注姓名公司與來意
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.