網易首頁 > 網易號 > 正文申請入駐

Manus刷屏了一天，再來聽聽OpenAI如何從0到1搭建AI Agent的經驗分享（附視頻）

2025-03-07 08:05:29　來源: AI深度研究員

上海舉報

分享至

（關注公眾號設為標，獲取AI深度洞察）

全文 4,000字 | 閱讀約16分鐘

自3月6日凌晨，Manus的AI產品突然在各大社交媒體刷屏。這個被稱為"全球第一款通用Agent產品"的工具一經推出就引發熱議，邀請碼甚至被炒到了5萬元一個。

在這股AI Agent熱潮中，值得關注的還有行業巨頭OpenAI的專家們對AI Agent開發的思考。"2025年將成為AI Agent之年，這一年人工智能將真正從助手角色畢業，成為真正的協作伙伴。"OpenAI解決方案架構團隊負責人Toki Sherbakov在近期的紐約AI工程師峰會上如此預測。

而對于如何構建有效的AI Agent，OpenAI的解決方案架構師Prashant Mital則提出了令人深思的觀點："團隊經常直接跳入設計多AI agent系統，AI agent調用AI agent，動態協調任務，處理長對話。這一切聽起來很強大，但當過早進行時，它會創造很多未知因素。我們建議從為單一任務專門構建的單一AI agent開始，將其投入使用，限定用戶群體，并觀察其表現。"

這種從0到1、從簡單到復雜的方法論，與當下很多企業急于求成的做法形成鮮明對比。那么，OpenAI專家們是如何一步步構建企業級AI Agent的？他們積累了哪些可復制的經驗？以下是他們分享的核心內容：

Toki Sherbakov的演講

如何利用OpenAI構建和擴展應用場景，這對企業與OpenAI合作將應用方案推向實際使用環境意味著什么，并簡要介紹AI agent以及我們在構建這些應用方案和智能工作流程方面的實踐經驗。

OpenAI的組織架構

首先簡單介紹一下OpenAI的組織架構。相信大家已經聽說過OpenAI，但就運作方式而言，我們有兩個核心技術團隊。一是研究團隊，由1,200名研究人員組成，他們負責創造這些人工智能模型，開發和部署這些基礎模型，可以說這些模型是"從天而降"的。二是應用團隊，我們的第二個技術團隊，他們將這些模型轉化為產品，這就是您看到的ChatGPT和API等產品的來源。

在市場推廣方面，我們的團隊將這些產品實際部署到用戶手中，幫助將這些技術應用到您的員工隊伍和產品中，真正開始自動化內部工作。一旦部署完成，我們會形成一個不斷改進的循環，從實際使用中獲取反饋來直接改進產品，并通過這個研究循環來改進我們的核心模型。這就是OpenAI的典型運作方式。

企業AI agent場景

在企業中，我們觀察到AI客戶使用旅程通常分為三個階段，雖然不一定按這個順序發展，但這是我們通常看到的模式。首先是建立能使用AI的員工隊伍，將AI技術交到員工手中，讓他們了解AI知識，在日常工作中使用AI。接著通常發展到自動化AI運營，這更多用于內部場景，為員工隊伍構建自動化或輔助工作的應用。最后一步是將AI融入面向最終用戶的產品中。

就OpenAI的具體產品而言，啟用員工隊伍通常始于ChatGPT，這是我們的主打產品，供用戶日常使用。當涉及內部自動化運營時，可以部分使用ChatGPT，但對于更復雜的場景或需要更多個性化的情況，則需要使用API。最后，將AI融入終端用戶產品主要是API應用。

企業在實踐中制定AI戰略通常從高層確定策略應該是什么。我們認識到，重要的不是"什么是你的AI戰略"，而是"什么是您更廣泛的業務戰略"，OpenAI的作用是幫助確定技術如何滿足這一更廣泛的業務戰略。有了高層的指導后，就可以確定一兩個重要的應用場景開始，并規劃這些場景，確實地實現。一旦有了戰略并執行了一兩個應用場景，就需要考慮如何在整個企業中建立部門能力。這包括通過培訓員工、建立專業中心，或者建立一個集中化的技術平臺，讓企業內的其他人可以在此基礎上進行開發。

以一個三個月的應用場景開發為例，當確定了要首先解決的場景后，首先要進行初步范圍界定，技術架構評估，以了解AI如何融入當前的技術環境，并明確定義成功指標和關鍵性能指標。接著是開發階段，這是花費最多時間的部分，在這里進行不斷嘗試，改進提示策略、智能檢索等，以不斷改進正在處理的方案。這是我們團隊與您的技術團隊通過研討會、辦公時間、共同編程會議、網絡講座等方式密切互動的地方。然后是測試和評估階段，使用預先定義的評估標準進行對比測試和小范圍推出，了解實際效果。最后是正式使用階段，進行啟動推出，進行規模優化測試，以確保在推廣給多個用戶時能夠正常工作，然后進行持續維護。

摩根士丹利案例

在與OpenAI合作過程中，我們提供專門的團隊，也要求你提供專門的團隊來使這一過程順利進行。我們提供的支持包括提前使用新模型和功能的權限，來自我們研究、技術和產品團隊的內部專家支持，以及聯合發展規劃會議，確保我們與您的未來發展方向保持一致。

以摩根士丹利為例，他們建立了一個內部知識助手，讓他們的財富管理員能夠查詢大量知識庫，并獲得高度準確的信息來回應客戶。最初，準確率只有45%。在與我們互動過程中，我們引入了新方法，如高級檢索技術、個性化調整、不同的信息分塊策略，這些改進了性能。隨著我們不斷引入更多方法，準確率不斷提高。我們引入了重新排序和分類步驟，使準確率達到了85%。最終，他們的目標是90%，但我們通過其他方法如提示優化和查詢擴展，實現了98%的準確率。

2025：AI agent之年

展望未來，我們越來越多地看到的是在AI agent領域的開發。可能你聽說過"2025年是AI agent之年"，智能工作流程一直是一個熱門話題，但我認為今年我們將看到它真正變為現實。

Prashant Mital的演講

OpenAI，我們有幸與正在構建最先進AI agent的客戶并肩工作，同時也與開發我們自己的智能產品（如Deep Research和Operator）的團隊成員密切合作。正如Toki所說，我們預計2025年將成為AI agent之年，這一年人工智能將真正從簡單的助手角色畢業，成為真正的協作伙伴。為了迎接這個時代的到來，我們一直在努力找出AI agent開發中常見的成功模式和需要避免的問題。今天我很高興與大家分享其中的四個要點。

AI agent的定義

在進一步討論之前，我想先解釋一下我們所說的"AI agent"。我們認為AI agent是一種人工智能應用，它由一個模型組成，這個模型有一些指令（通常以提示的形式出現），能夠獲取信息和與外部系統互動的工具，所有這些都在一個運行循環中，而這個循環的結束由模型自身控制。可以這樣理解：在每個運行周期中，AI agent可以被視為一個接收自然語言指令、決定是否使用工具、運行這些工具、整合工具返回的結果，然后向用戶提供答案的實體。此外，AI agent可能會判斷它已經完成了任務，因此結束運行循環。

構建AI agent的經驗教訓一：簡化工具而非依賴

想象一下，你正在設計一個AI agent，需要協調多個模型，獲取數據，分析并生成輸出。你有兩個選擇：可以從基礎部分開始，進行直接的程序調用，自己記錄結果和輸出及失敗；或者可以從現成的框架開始，選擇一個集成方案，連接起來，讓它處理許多細節。不得不說，從現成框架開始是很有吸引力的，這也是我開始構建AI agent的方式。這樣很容易上手，很快就能建立一個初步演示。但問題是，如果你直接從框架開始，你往往不知道你的系統如何運行或它使用什么基礎部分。在你理解限制條件之前，你就已經推遲了設計決策，而如果你不知道限制條件，你就無法優化解決方案。

我們認為更好的方法是：首先使用基礎部分構建，了解你的任務如何細分，失敗在哪里發生，以及什么實際需要改進。然后，當你發現自己在重復造輪子時，這可能是引入一些集成方案的好時機。現在很多團隊花費大量時間選擇正確的框架，但我們認為，以可擴展方式開發AI agent并不是選擇正確集成方案的問題，而是了解你的數據、失敗點和限制條件的問題。

教訓二：從簡單開始

團隊經常直接跳入設計多AI agent系統，AI agent調用AI agent，動態協調任務，處理長對話。這一切聽起來很強大，但當過早進行時，它會創造很多未知因素，而不會給你提供太多啟示。我們喜歡一種不同的方法：我們通常建議從為單一任務專門構建的單一AI agent開始，將其投入使用，限定用戶群體，并觀察其表現。這樣做可以讓你識別真正的問題：錯誤回答、對話過長、因反應慢導致的低使用率，或者由于信息獲取不佳導致的不準確。

然后，了解系統表現不佳的地方以及對用戶重要的因素，我們可以逐步改進它。簡而言之，我們應該將復雜性視為隨著我們發現更多明顯的失敗案例和限制而增加的東西，因為目標并不是構建一個復雜的系統，而是構建一個有效的系統。

教訓三：AI agent處理復雜任務

從簡單開始聽起來很好，但我們都知道，真正的價值在復雜中實現。那么，我們應該如何處理更復雜的任務呢？這就是AI agent網絡和交接概念的用武之地。 AI agent網絡是一個協作系統，多個AI agent一起工作，以解決復雜請求或執行一系列相互關聯的任務。你可以將其視為一系列專門的AI agent，處理大型智能工作流程中的子流程。

關于交接，你可以將其視為一個AI agent將正在進行的對話的控制權轉移給另一個AI agent的過程。這與電話中轉接到其他人很相似，只不過在這種情況下，你可以保留整個對話歷史，新AI agent就像魔術一樣已經知道你之前談過的所有內容。在示例架構中，我們展示了如何使用AI agent網絡和交接實現全自動客戶服務流程。這種方法允許我們將合適的工具用于合適的工作。例如，我們使用一種模型對傳入請求進行分類，然后使用另一種模型與用戶管理對話，最后使用第三種模型執行需要高準確性的任務，如檢查客戶是否有資格獲得退款。事實證明，交接非常有效，保持整個對話歷史和上下文，同時切換模型、指令、工具定義，提供了足夠的靈活性來解決廣泛的場景。

教訓四：保持指令簡單

我們的最后一個教訓涉及安全措施。安全措施是對應用程序中確保安全性和可靠性的任何機制的總稱，通常用于防止濫用并確保系統保持正常運行。保持模型指令簡單并專注于目標任務，確保系統的最大通用性，并確保我們能夠以最可預測的方式提高準確性和性能。安全措施不一定要成為你主要指令的一部分，而應該并行運行，更快更便宜的模型的普及使這一點比以往任何時候都更容易實現。

高風險的工具使用和用戶回應（例如，發出退款或向用戶顯示其個人賬戶中的信息）可以推遲，直到所有安全措施都已確認通過。在這個例子中，我們看到我們運行了一個輸入安全檢查來防止惡意指令，然后在AI agent的回應上運行了幾個輸出安全檢查。

總結

回顧一下，我們從構建AI agent的經驗中總結出四個教訓：

最小化使用集成工具
從單一AI agent開始
當你面臨更復雜的情況時，升級到AI agent網絡
保持指令簡單，專注于常規情況，使用安全措施處理特殊情況

星標公眾號，點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標

原文鏈接：https://www.youtube.com/watch?v=joHR2pmxDQE&t=377s&ab_channel=AIEngineer

來源：官方媒體/網絡新聞

排版：Atlas

編輯：深思

主編：圖靈

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.