網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

OpenAI新智能體API：小白狂喜，老手無感

2025-03-13 11:03:08　來源: 知危

浙江舉報(bào)

分享至

今天凌晨，OpenAI 給最基礎(chǔ)的 API 產(chǎn)品即 Chat Completion API 進(jìn)行了升級(jí)，也就是給 Chat Completion API 添加了智能體功能，命名為 Response API。

Response API 相當(dāng)于讓你在調(diào)用 Chat Completion API 時(shí)也可以使用聯(lián)網(wǎng)搜索、文件搜索和 Computer Use。

想想最近爆火的 Manus 應(yīng)用了什么功能，你會(huì)覺得味道比較微妙~

和 Response API 同時(shí)發(fā)布的還有之前發(fā)布的 Agent 框架 Swarm 的升級(jí)版，即OpenAI Agents SDK，主要的功能是智能體工作流的編排，包括了單智能體和多智能體。

Response API 可以算是 Chat Completion API 與 Assistant API 的結(jié)合體，從 Agent 構(gòu)建的角度來看，使用更加簡(jiǎn)便，其聲稱 “ 只需要一次 Response API，就能夠使用多個(gè)工具和模型論次來解決復(fù)雜任務(wù)。”

Response API 可以作為一個(gè)統(tǒng)一接口，將 OpenAI 的模型和內(nèi)置工具集成到應(yīng)用中，并能輕易實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)以及智能體的性能跟蹤、評(píng)估，OpenAI 還承諾：“ 不會(huì)默認(rèn)使用用戶的業(yè)務(wù)數(shù)據(jù)來訓(xùn)練我們的模型。”

至于原來的 Chat Completion API，也可以繼續(xù)使用，之后更新的新模型也會(huì)繼續(xù)支持，這對(duì)于只需要支持簡(jiǎn)單聊天應(yīng)用的開發(fā)者來說倒是好消息，不需要花費(fèi)大功夫遷移至 Response API 。

當(dāng)然，Response API 已經(jīng)完全包含了 Chat Completion API 的所有功能，如果你是從頭開始開發(fā)，可以直接從 Response API 用起。

至于 Assistant API，之后 OpenAI 將在 Response API 完成了對(duì) Assistant API 的功能繼承之后（比如本次很遺憾還沒加上的 Code Interpreter，以及Assistant、Thread 等），就會(huì)在 2026 年中期將 Assistant API 完全棄用，開發(fā)者們可以做好準(zhǔn)備開始遷移了。

網(wǎng)絡(luò)搜索工具基于 GPT-4o 和 GPT-4o-mini，在基準(zhǔn)測(cè)試 SimpleQA上，GPT-4o search preview 和 GPT-4o mini search preview 獲得了 90% 和 88% 的分?jǐn)?shù)，遠(yuǎn)超 OpenAI 其它沒有調(diào)用搜索的基礎(chǔ)模型。

費(fèi)用方面，GPT-4o search preview 和 GPT-4o mini search preview 的定價(jià)分別是 30 美元每千次查詢和 25 美元每千次查詢。

文件搜索工具和 Assistant API 中的類似，相比于 Assistant API，增加了元數(shù)據(jù)過濾、直接搜索端點(diǎn)（可直接搜索向量存儲(chǔ) ）等新功能。

費(fèi)用方面，每千次查詢是 2.50 美元，文件存儲(chǔ)則是 0.10 美元/GB/天，首 GB 免費(fèi)。

Computer Use 工具和之前發(fā)布的 Operator 一樣使用了 Computer-Using Agent（ CUA ）模型。基準(zhǔn)測(cè)試方面，該模型在 OSWorld 的全 Computer Use 任務(wù)上達(dá)到 38.1% 成功率，在 WebArena 上達(dá)到 58.1% 成功率，在 WebVoyager 的基于 Web 的交互任務(wù)上達(dá)到 87% 成功率，創(chuàng)下了新的 SOTA 記錄。

OpenAI 表示，此次通過 API 使用 Computer Use，相當(dāng)于將 Operator 的功能擴(kuò)展到本地操作系統(tǒng)，會(huì)引入新的風(fēng)險(xiǎn)，盡管進(jìn)行了額外的安全評(píng)估和紅隊(duì)測(cè)試，結(jié)合其在 OSWorld 上仍然遠(yuǎn)不夠好的表現(xiàn)，官方建議使用時(shí)進(jìn)行人工監(jiān)督。

費(fèi)用方面，Computer Use 的每百萬 token 輸入花費(fèi) 3 美元，每百萬 token 輸出花費(fèi) 12 美元。

按照 OpenAI 的表態(tài)，Response API 代表了他們未來構(gòu)建智能體的路線選擇。

OpenAI Agents SDK 建立在 Swarm 基礎(chǔ)之上，Swarm 基于 Chat Completion API，相比于 Assistant API，有更好的透明度，能夠進(jìn)行細(xì)粒度地控制上下文、執(zhí)行步驟和工具調(diào)用。

具體的改進(jìn)包括：

智能體：易于配置的LLM，具有清晰的指令和內(nèi)置工具；
交接：智能體之間的智能控制轉(zhuǎn)移；
防護(hù)機(jī)制：可配置的輸入輸出驗(yàn)證的安全檢查；
追蹤和可視化：通過可視化智能體脂性軌跡來調(diào)試和優(yōu)化性能；

在未來，OpenAI 可能將 Agents SDK 開源。

據(jù) OpenAI 的 Atty Eleti（ Response API 的開發(fā)者之一）分享，Response API 開發(fā)初衷是基于當(dāng)下多模態(tài)輸入輸出、思維鏈推理以及智能體工作流的趨勢(shì)，Chat Complete API 將逐漸無法適應(yīng)這樣的發(fā)展，而 Assistant API 的使用又過于復(fù)雜，后臺(tái)處理方式意味著其速度必然是很慢的。

相比于 Chat Completion API，Response API 會(huì)存儲(chǔ)所有 Response，無需重復(fù)輸入上下文，只需要使用 “ previous_response_id ” 就可以繼續(xù)對(duì)話。

Response API 的響應(yīng)結(jié)構(gòu)更加復(fù)雜，用概念 item 表示，代表了用戶輸入或模型輸出的多態(tài)對(duì)象，其中可以包含消息、推理、函數(shù)調(diào)用、web 搜索調(diào)用等。

盡管有那么多的改進(jìn)和便捷的設(shè)計(jì)，Response API 就香了嗎？

在過去由于 Chat Completion API 的限制，開發(fā)者只能用 Assistant API 實(shí)現(xiàn)文件搜索等功能，而 Assistant API 在使用中有太多槽點(diǎn)，比如使用復(fù)雜、響應(yīng)速度慢、缺少 Webhook 設(shè)置、上下文編輯困難、token 數(shù)容易暴漲（添加的文檔也會(huì)在多輪聊天中重復(fù)調(diào)用并消耗 token ）、RAG 文件存儲(chǔ)太昂貴等等。

這一次，Response API 能在多大程度上改進(jìn) Assistant API 糟糕的用戶體驗(yàn)還是一個(gè)未知數(shù)。

而基于 Reddit、Hacker News 上用戶的反饋，OpenAI 本次的發(fā)布并沒有引發(fā)特別大的驚喜，反而吐槽更多。

比如網(wǎng)絡(luò)搜索的費(fèi)用，有網(wǎng)友表示，這可比自己配置 Google search api（可能只需 1-1.5 美元）貴太多了。

OpenAI 的目的是想用一套工具，把自己過去的已有成果統(tǒng)統(tǒng)整合起來，提高產(chǎn)品易用性，并提供全套監(jiān)控和衡量工具，讓開發(fā)者更加依賴這個(gè)生態(tài)，尤其是數(shù)據(jù)存儲(chǔ)功能的支持，如果開發(fā)者入坑了，生態(tài)依賴會(huì)更加強(qiáng)。

但這終究是一種傻瓜式的產(chǎn)品，更適合初級(jí)開發(fā)者，對(duì)于那些需要有更多自定義和復(fù)雜功能的開發(fā)者而言，這樣的產(chǎn)品其實(shí)沒有太大的吸引力。

尤其是對(duì)于智能體的開發(fā)，目前智能體的發(fā)展尚處于早期階段，還沒有太多可以標(biāo)準(zhǔn)化的東西，或者說社區(qū)的探索還沒有出現(xiàn)大量重復(fù)造輪子的工作，那么對(duì)智能體進(jìn)行抽象的必要性就很小。把語(yǔ)言模型單獨(dú)作為一個(gè)黑盒存在，然后去構(gòu)建面向場(chǎng)景的工具和軟件才是最好的方式，而不是在它之上嵌套過多的 LLM 抽象。“ LLM應(yīng)該是一個(gè)應(yīng)用中最無聊的存在。”

簡(jiǎn)言之：小白狂喜，老手無感 —— 雞肋。

在設(shè)計(jì)能征服開發(fā)老手的產(chǎn)品上，OpenAI 還得跟 Anthropic 多學(xué)學(xué)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.