在業(yè)界,有個(gè)著名的“不可能三角”
甲方乙方都懂的
想要又便宜又快又好的
那就只能做夢了
巧了,今天又看到一個(gè)
【大模型的不可能三角】
嘿嘿,風(fēng)光無限的大模型
也逃不過三角形魔咒呀
成本指的是企業(yè)大模型落地的整體費(fèi)用,包括大模型的訓(xùn)練成本、推理成本以及部署、運(yùn)維和升級成本等。
企業(yè)有時(shí)僅關(guān)注有形成本:例如GPU購置費(fèi)用、消耗的電費(fèi),或從第三方服務(wù)商購買模型服務(wù)的費(fèi)用;而會忽略無形成本:包括為實(shí)現(xiàn)大模型服務(wù)而配置的人力成本,以及大模型在部署、訓(xùn)練或調(diào)試階段消耗的時(shí)間成本等。
核算成本時(shí),需要考量總持有成本,特別是不要忽略無形成本。按成本從高到低,一般為深度研發(fā)大模型、微調(diào)、RAG、提示詞工程、直接調(diào)用。
效果指的是大模型生成內(nèi)容的質(zhì)量,包括內(nèi)容的準(zhǔn)確性,是否存在幻覺問題,或是否會生成不合適的內(nèi)容。
大模型效果可以基于“3H”原則進(jìn)行評價(jià):1)Helpful:內(nèi)容可用有幫助,不要廢話連篇、泛泛而談;2)Harmless:內(nèi)容合規(guī)無害處,符合倫理規(guī)范和監(jiān)管要求;3)Honest:內(nèi)容正確無幻覺,不要一本正經(jīng)地胡說八道,甚至給出錯(cuò)誤信息。
通常來說,大模型的參數(shù)規(guī)模越大,生成效果越好。因此,當(dāng)業(yè)務(wù)需求對生成內(nèi)容質(zhì)量要求嚴(yán)苛?xí)r,應(yīng)盡量選擇參數(shù)規(guī)模更大的模型。
此外,目前市場上主流商業(yè)化模型的效果,大多優(yōu)于同期同參數(shù)規(guī)模的開源模型。
性能指的是大模型服務(wù)的速度,包括大模型的訓(xùn)練速度,推理時(shí)的響應(yīng)速度、生成速度等。
一般而言,大模型的參數(shù)規(guī)模越大,則需要的訓(xùn)練時(shí)間越長,即訓(xùn)練速度越慢,而其進(jìn)行推理服務(wù)時(shí)的需求響應(yīng)速度和內(nèi)容生成速度也越慢。
因此,大模型的效果和性能不可兼得,當(dāng)成本固定時(shí),大模型的選擇主要是在效果和性能之間進(jìn)行平衡和取舍。對于性能要求較高而對效果有一定容忍度的場景,可以選擇參數(shù)規(guī)模相對較小的大模型。
來源:GenAI技術(shù)落地白皮書
當(dāng)然,這個(gè)三角很好
讓癡迷大模型的甲方們認(rèn)清現(xiàn)實(shí)
更加理性的去選擇大模型落地路徑
在成本、效果、性能間進(jìn)行權(quán)衡和取舍
這三角不是我杜撰出來的
來自于我今天剛剛讀到的一份報(bào)告
《GenAI技術(shù)落地白皮書》
新鮮出爐,干貨不少
這份白皮書是阿里云研究院出品的
但幾乎沒有夾帶任何“私貨”
更沒有吹自家的通義大模型多NB
而是站在客觀立場,從企業(yè)視角出發(fā)
講述大模型在企業(yè)落地的關(guān)鍵點(diǎn)
包括“選-育-用”三段論
基本上,做好這三步
企業(yè)的大模型,就算沒白上
比如:在選擇階段
如何評估各種技術(shù)路線
如何權(quán)衡不可能三角
比如:在培育階段
如何利用提示詞工程、RAG、微調(diào)
來進(jìn)行大模型工程化適配
每種方式的優(yōu)劣和成本如何考量
比如:在使用階段
企業(yè)的基礎(chǔ)設(shè)施該如何建設(shè)
業(yè)務(wù)流程如何升級
GenAI時(shí)代的DevOps如何運(yùn)轉(zhuǎn)
大模型的安全與合規(guī)問題如何保障
總之,這份白皮書,站在企業(yè)視角
從大模型選擇、適配、優(yōu)化、業(yè)務(wù)整合
再到基礎(chǔ)設(shè)施搭建、開發(fā)運(yùn)維、模型安全
覆蓋了整個(gè)生命周期
給出了很多真知灼見
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.