99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

2025,AI Agents技術(shù)棧解讀出爐!

0
分享至

來源:PaperAgent

2025新年伊始, 今年 將是 “Agentic系統(tǒng)之年 ”, “2025將會出現(xiàn)真正Agent ” ,時不我待, 請簽收 屬于你的 AI Agents技術(shù)棧 綜述 。

理解AI Agents生態(tài)

盡管我們看到了大量關(guān)于Agent棧和市場的分類圖,但我們往往不同意它們的分類方式,發(fā)現(xiàn)它們很少反映開發(fā)者實際使用的。 在過去幾個月中,隨著在內(nèi)存、工具使用、安全執(zhí)行和部署方面的進(jìn)步,Agent軟件生態(tài)系統(tǒng)有了顯著的發(fā)展,因此,能夠真正落地的“Agent技術(shù)棧(agent stack)”應(yīng)該是怎樣尼?

AI Agents技術(shù)棧,被組織成三個關(guān)鍵層:Agent托管/服務(wù)、Agent框架,以及LLM模型和存儲。

從LLM到LLM Agent

在2022年和2023年,我們看到了LLM框架和SDK的興起,比如LangChain(2022年10月發(fā)布)和LlamaIndex(2022年11月發(fā)布)。同時,我們也看到了幾個“標(biāo)準(zhǔn)”平臺的建立,這些平臺通過API消費LLMs以及自部署LLM推理(vLLM和Ollama)。

在2024年,我們看到了對AI“Agent”的興趣急劇轉(zhuǎn)變,更廣泛地說,是對復(fù)合系統(tǒng)的興趣。盡管“Agent”這個術(shù)語在AI中已經(jīng)存在了幾十年(特別是在強(qiáng)化學(xué)習(xí)中),但在后ChatGPT時代,“Agent”已經(jīng)成為一個松散定義的術(shù)語,通常指的是被賦予輸出動作(工具調(diào)用)并在自治設(shè)置中運行的LLM。從LLM到Agent所需的工具使用、自治執(zhí)行和內(nèi)存的結(jié)合,促使一個新的Agent棧發(fā)展。

Agent技術(shù)棧的獨特之處

與基本的LLM聊天機(jī)器人相比,Agent是一個更復(fù)雜的工程挑戰(zhàn),因為它們需要狀態(tài)管理(保留消息/事件歷史記錄,存儲長期記憶,執(zhí)行多個LLM調(diào)用在一個Agent循環(huán)中)和工具執(zhí)行(安全執(zhí)行LLM輸出的動作并返回結(jié)果)。

因此,AI Agent棧與標(biāo)準(zhǔn)的LLM棧看起來非常不同。讓我們從模型服務(wù)層開始,分解今天的AI Agent棧:

模型服務(wù)


AI Agent的核心是LLM。 要使用LLM,模型需要通過推理引擎提供服務(wù),通常運行在付費API服務(wù)后面。

OpenAI和Anthropic在基于封閉API的模型推理提供商中領(lǐng)先,擁有私有前沿模型。Together.AI、Fireworks和Groq是提供開放權(quán)重模型(例如Llama 3)背后的付費API的流行選項。在本地模型推理提供商中,我們最常見到vLLM領(lǐng)先于生產(chǎn)級GPU基礎(chǔ)服務(wù)負(fù)載。SGLang是一個新興項目,擁有類似的開發(fā)者受眾。在業(yè)余愛好者(“AI愛好者”)中,Ollama和LM Studio是兩個流行的選項,用于在您自己的計算機(jī)上運行模型(例如M系列Apple Macbooks)。

存儲

存儲是定義為有狀態(tài)的Agent的基本構(gòu)建塊——Agent由持久狀態(tài)定義,如他們的對話歷史記錄、記憶和外部數(shù)據(jù)源,他們用于RAG。 像Chroma、Weaviate、Pinecone、Qdrant和Milvus這樣的向量數(shù)據(jù)庫很受歡迎,用于存儲Agent的“外部記憶”,允許Agent利用數(shù)據(jù)源和對話歷史記錄,這些數(shù)據(jù)太大,無法放入上下文窗口。 Postgres是一個自80年代以來就存在的傳統(tǒng)數(shù)據(jù)庫,現(xiàn)在也通過pgvector擴(kuò)展支持向量搜索。 基于Postgres的公司如Neon(無服務(wù)器Postgres)和Supabase也為Agent提供基于嵌入的搜索和存儲。

工具和庫

標(biāo)準(zhǔn)AI聊天機(jī)器人和AI Agent之間的一個主要區(qū)別是Agent調(diào)用“工具”(或“功能”)的能力。在大多數(shù)情況下,這種動作的機(jī)制是LLM生成結(jié)構(gòu)化輸出(例如JSON對象),指定要調(diào)用的函數(shù)和提供的參數(shù)。Agent工具執(zhí)行的一個常見混淆點是,工具執(zhí)行_不是_由LLM提供商本身完成的——LLM只選擇要調(diào)用的工具和提供的參數(shù)。支持任意工具或任意參數(shù)輸入工具的Agent服務(wù)必須使用沙箱(例如Modal、E2B)以確保安全執(zhí)行。

Agent通過OpenAI定義的JSON模式調(diào)用工具——這意味著Agent和工具實際上可以跨不同框架兼容。Letta Agent可以調(diào)用LangChain、CrewAI和Composio工具,因為它們都是由相同的模式定義的。因此,對于常見工具,有一個不斷增長的工具提供商生態(tài)系統(tǒng)。Composio是一個流行的通用工具庫,還管理授權(quán)。Browserbase是一個專門用于網(wǎng)頁瀏覽的專用工具的例子,Exa提供了一個專門用于搜索網(wǎng)絡(luò)的專用工具。隨著越來越多的Agent被構(gòu)建,我們預(yù)計工具生態(tài)系統(tǒng)將增長,并提供現(xiàn)有新功能,如Agent的身份驗證和訪問控制。

Agent框架


Agent框架協(xié)調(diào)LLM調(diào)用并管理Agent狀態(tài)。不同的框架將為以下方面有不同的設(shè)計:

  • 管理Agent的狀態(tài):大多數(shù)框架引入了一些“序列化”狀態(tài)的概念,允許Agent通過將序列化狀態(tài)(例如JSON、字節(jié))保存到文件中,在稍后的時間加載回相同的腳本——這包括狀態(tài)如對話歷史記錄、Agent記憶和執(zhí)行階段。在Letta中,所有狀態(tài)都由數(shù)據(jù)庫支持(例如消息表、Agent狀態(tài)表、內(nèi)存塊表),沒有“序列化”的概念,因為Agent狀態(tài)始終被持久化。這允許輕松查詢Agent狀態(tài)(例如,按日期查找過去的信息)。狀態(tài)的表示和管理方式?jīng)Q定了Agent應(yīng)用程序?qū)⑷绾坞S著更長的對話歷史記錄或更多的Agent數(shù)量進(jìn)行擴(kuò)展,以及如何靈活地訪問或修改狀態(tài)。

  • Agent的上下文窗口結(jié)構(gòu):每次調(diào)用LLM時,框架將“編譯”Agent的狀態(tài)到上下文窗口。不同的框架將以不同的方式將數(shù)據(jù)放入上下文窗口(例如指令、消息緩沖區(qū)等),這可能會改變性能。我們建議選擇一個使上下文窗口透明的框架,因為這最終是您可以控制您的Agent行為的方式。

  • 跨Agent通信(即多Agent):Llama Index通過消息隊列讓Agent通信,而CrewAI和AutoGen有明確的抽象器用于多Agent。Letta和LangGraph都支持Agent直接相互調(diào)用,這允許集中式(通過監(jiān)督Agent)和跨Agent的分布式通信。大多數(shù)框架現(xiàn)在支持多Agent和單Agent,因為一個設(shè)計良好的單Agent系統(tǒng)應(yīng)該使跨Agent協(xié)作易于實現(xiàn)。

  • 內(nèi)存方法:LLM的基本限制是它們有限的上下文窗口,這就需要管理隨時間的記憶。一些框架內(nèi)置了內(nèi)存管理,而其他框架則期望開發(fā)者自己管理內(nèi)存。CrewAI和AutoGen完全依賴基于RAG的內(nèi)存,而phidata和Letta使用額外的技術(shù),如自我編輯內(nèi)存(來自MemGPT)和遞歸總結(jié)。Letta Agent自動配備了一套內(nèi)存管理工具,允許Agent通過文本或數(shù)據(jù)搜索先前的消息,編寫記憶,并編輯Agent自己的上下文窗口(您可以在這里閱讀更多)。

  • 支持開放模型:模型提供商實際上做了很多幕后技巧,讓LLM以正確的格式生成文本(例如用于工具調(diào)用)——例如,當(dāng)它們沒有生成適當(dāng)?shù)墓ぞ邊?shù)時,重新采樣LLM輸出,或在提示中添加提示(例如“請輸出JSON”)。支持開放模型需要框架處理這些挑戰(zhàn),所以一些框架限制對主要模型提供商的支持。

在今天構(gòu)建Agent時,正確的框架選擇取決于您的應(yīng)用程序,例如您是否正在構(gòu)建會話Agent或工作流程,您是否希望在筆記本或作為服務(wù)運行Agent,以及您對開放權(quán)重模型支持的要求。

我們預(yù)計框架之間的主要區(qū)別將出現(xiàn)在它們的部署工作流程中,狀態(tài)/內(nèi)存管理和工具執(zhí)行的設(shè)計選擇變得更加重要。

Agent托管和Agent服務(wù)

今天的大多數(shù)Agent框架都是為那些不存在于它們編寫的Python腳本或Jupyter筆記本之外的Agent設(shè)計的。我們相信Agent的未來是將Agent視為一個_服務(wù)_,該服務(wù)被部署到本地或云基礎(chǔ)設(shè)施上,可以通過REST API訪問。就像OpenAI的ChatCompletion API成為與LLM服務(wù)交互的行業(yè)標(biāo)準(zhǔn)一樣,我們預(yù)計最終會有一個贏家為Agent API。但還沒有一個……。

部署Agent作為服務(wù)比部署LLM作為服務(wù)要復(fù)雜得多,因為狀態(tài)管理和安全工具執(zhí)行的問題。工具及其所需的依賴項和環(huán)境需求需要明確存儲在數(shù)據(jù)庫中,因為運行它們的環(huán)境需要由服務(wù)重新創(chuàng)建(這不是一個問題,當(dāng)您的工具和Agent在同一個腳本中運行時)。應(yīng)用程序可能需要運行數(shù)百萬Agent,每個Agent都累積了越來越多的對話歷史記錄。當(dāng)從原型轉(zhuǎn)移到生產(chǎn)時,Agent狀態(tài)不可避免地必須經(jīng)歷一個數(shù)據(jù)規(guī)范化過程,Agent交互必須由REST API定義。今天,這個過程通常是通過開發(fā)者編寫自己的FastAPI和數(shù)據(jù)庫代碼來完成的,但我們預(yù)計隨著Agent的成熟,這個功能將更多地嵌入到框架中。

結(jié)論

Agent技術(shù)棧仍然非常早期,我們對生態(tài)系統(tǒng)如何擴(kuò)展和演變感到興奮。對未來Agent技術(shù)棧發(fā)展你還有什么補(bǔ)充嗎?

https://www.letta.com/blog/ai-agents-stack

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
4月25日俄烏:特朗普繼續(xù)為俄開脫,俄軍少將莫斯科被炸身亡

4月25日俄烏:特朗普繼續(xù)為俄開脫,俄軍少將莫斯科被炸身亡

山河路口
2025-04-25 19:35:58
殺害最小人質(zhì)恐怖頭目全家被以色列送上路

殺害最小人質(zhì)恐怖頭目全家被以色列送上路

移光幻影
2025-04-25 11:31:56
深夜23點!山東泰山正式官宣,崔康熙鄭重表態(tài),4人缺席魯滬大戰(zhàn)

深夜23點!山東泰山正式官宣,崔康熙鄭重表態(tài),4人缺席魯滬大戰(zhàn)

璞玉話體壇
2025-04-26 08:41:36
2024年浙江公安查辦侵犯知識產(chǎn)權(quán)案件1923起 同比增長63.0%

2024年浙江公安查辦侵犯知識產(chǎn)權(quán)案件1923起 同比增長63.0%

環(huán)球網(wǎng)資訊
2025-04-25 23:28:19
昆明“大器史局長”婚內(nèi)出軌!小三:床上,他帶我去天堂!

昆明“大器史局長”婚內(nèi)出軌!小三:床上,他帶我去天堂!

文刀萬
2024-04-09 10:58:09
出差15天,公婆和小姑住進(jìn)陪嫁房,施工員老公的解釋讓我果斷離

出差15天,公婆和小姑住進(jìn)陪嫁房,施工員老公的解釋讓我果斷離

施工員小天哥
2025-04-25 13:24:01
北京地鐵臟衣服乘客家屬發(fā)聲感謝,外地人也看出北京人的講究

北京地鐵臟衣服乘客家屬發(fā)聲感謝,外地人也看出北京人的講究

九方魚論
2025-04-26 07:42:03
不是青島,王睿澤官宣,加盟新球隊,已抵達(dá)廣東,杜鋒期待

不是青島,王睿澤官宣,加盟新球隊,已抵達(dá)廣東,杜鋒期待

東球弟
2025-04-26 10:47:02
美國政府瘋狂刪除科研數(shù)據(jù),科學(xué)家連夜保存研究心血:我們必須爭分奪秒

美國政府瘋狂刪除科研數(shù)據(jù),科學(xué)家連夜保存研究心血:我們必須爭分奪秒

紅星新聞
2025-04-25 15:47:11
特朗普麻煩大了?我方甩出最大“王牌”,不是美債,美國絕沒料到

特朗普麻煩大了?我方甩出最大“王牌”,不是美債,美國絕沒料到

傲氣經(jīng)說
2025-04-26 11:18:02
再不談就晚了,印度開始拉閘斷水,中美俄反應(yīng)一致,巴軍出現(xiàn)異動

再不談就晚了,印度開始拉閘斷水,中美俄反應(yīng)一致,巴軍出現(xiàn)異動

老謝談史
2025-04-26 11:57:54
麗澤路,今晨開通!

麗澤路,今晨開通!

BRTV新聞
2025-04-26 10:33:26
傻子入洞房不懂,還要新娘教

傻子入洞房不懂,還要新娘教

文雅筆墨
2025-04-25 12:03:14
突發(fā)!遼寧某職校宿舍發(fā)生命案,疑似有人傷亡,官方卻保持沉默

突發(fā)!遼寧某職校宿舍發(fā)生命案,疑似有人傷亡,官方卻保持沉默

平老師666
2025-04-26 11:47:47
女生之間的聊天尺度有多大?哈哈,全都是虎狼之詞啊!

女生之間的聊天尺度有多大?哈哈,全都是虎狼之詞啊!

書畫藝術(shù)收藏
2025-04-22 19:40:04
美國再次天塌,沙特?fù)屜扰c中國簽署重磅協(xié)議,特朗普無計可施?

美國再次天塌,沙特?fù)屜扰c中國簽署重磅協(xié)議,特朗普無計可施?

文雅筆墨
2025-04-25 19:57:28
研究發(fā)現(xiàn):若晚餐經(jīng)常吃太早,不超半年,胰腺或迎來6種不良變化

研究發(fā)現(xiàn):若晚餐經(jīng)常吃太早,不超半年,胰腺或迎來6種不良變化

朗威游戲說
2025-04-24 08:20:00
美艦橫穿臺海!不到12小時我方傳來消息,4艘055同時開建!

美艦橫穿臺海!不到12小時我方傳來消息,4艘055同時開建!

阿纂看事
2025-04-24 11:45:14
憤怒至極!中國學(xué)生遭外籍生群毆滿臉是血,網(wǎng)友:學(xué)學(xué)哈工大!

憤怒至極!中國學(xué)生遭外籍生群毆滿臉是血,網(wǎng)友:學(xué)學(xué)哈工大!

侃故事的阿慶
2025-04-26 07:50:36
真是天佑中華!中美博弈的關(guān)鍵時刻,中國又傳來重大喜訊!

真是天佑中華!中美博弈的關(guān)鍵時刻,中國又傳來重大喜訊!

洞悉評說
2025-04-25 15:29:07
2025-04-26 15:39:00
人工智能研究 incentive-icons
人工智能研究
分享深度學(xué)習(xí)、CV、NLP
258文章數(shù) 125關(guān)注度
往期回顧 全部

科技要聞

李斌:對蔚來公司四季度盈利非常有信心

頭條要聞

男子炒股11年賺6000萬:初始本金150萬 曾1天虧1100萬

頭條要聞

男子炒股11年賺6000萬:初始本金150萬 曾1天虧1100萬

體育要聞

去更大的舞臺追夢 專訪中國男籃國手楊瀚森

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經(jīng)要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續(xù)航100公里 探訪華為兆瓦超充站

態(tài)度原創(chuàng)

藝術(shù)
本地
親子
房產(chǎn)
公開課

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

親子要聞

孩子的教育要正確,家長和老師共同配合

房產(chǎn)要聞

逆勢大幅漲價!最高2.8萬/平!長天雲(yún)汀開盤又賣爆了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 南丰县| 毕节市| 武义县| 延安市| 廊坊市| 晋城| 吐鲁番市| 万载县| 株洲市| 隆子县| 虹口区| 普陀区| 五峰| 乌鲁木齐县| 体育| 黔南| 阿瓦提县| 冕宁县| 江油市| 潼南县| 汝南县| 万年县| 乐清市| 霍林郭勒市| 海林市| 宣化县| 广西| 五莲县| 安庆市| 鄂托克旗| 周至县| 项城市| 苍南县| 东兰县| 武夷山市| 新沂市| 赞皇县| 金川县| 章丘市| 腾冲县| 景东|