99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

OpenAI發布首個電腦智能體

0
分享至


文:王智遠 | ID:Z201440

凌晨薅起來學習論文,你受得了嗎?

深夜,OpenAI展示了他們的首個智能體:Operator,這可不是普通的AI,它能像人類一樣操作電腦,更厲害的是,它可以直接和網頁交互,無論是打字、點擊還是滾動,都能一氣呵成。

01

Operator是什么,它有什么能力呢?簡單講,它是OpenAI最新推出的一款創新型AI模型,像一個會自己操作電腦的“數字助手”。

我們平時用電腦時,得自己點鼠標、敲鍵盤、得盯著屏幕找東西,但Operator不一樣,它能自己搞定這些,能自己和電腦界面打交道。

OpenAI為啥要開發這么個東西呢?

動機有三個方面:一,從用戶需求層面來看,現代社會中存在大量重復性、機械化的數字操作任務。

以日常辦公場景為例,表單填寫、數據整理、信息檢索等操作不僅耗時耗力,而且容易出錯,Operator的開發想解決這一痛點,通過AI自動化提升工作效率。

二,從技術發展角度來看,當前大多數AI系統仍局限于信息處理和問答交互的范疇,缺乏實際執行能力。

Operator的創新之處在于突破了這一限制,它實現了從認知到執行的完整閉環,這種能力拓展標志著AI技術向更高層次發展的重要一步。

三,從長遠發展來看,Operator的開發,體現OpenAI對AI技術潛力的深入探索;通過賦予AI直接操作計算機的能力,為未來更復雜的智能應用奠定了基礎,具有重要的戰略意義;所以,要做這個東西,我覺得它像一個RPA技術。


圖示:Operator操作頁面

那么,它的核心能力有什么呢?

首先,它能特別精準地理解你的指令。你給它下命令,它能完全聽懂,還能根據你的需求去完成任務;比如,你讓它幫你買一雙運動鞋,它就能在網上找到合適的店鋪,幫你下單,而且還能挑出性價比最高的那一雙。

然后,可以自己操作網頁,不限于網頁瀏覽與信息提取、表單填寫與數據錄入、文件管理與文檔處理、郵件收發與日程安排等四個方面。

最主要是,它有智能化決策能力。

例如:在商品采購任務中,系統能夠根據預設條件(如預算、品牌偏好等)進行智能篩選和決策;再或者,你讓它幫你訂一張機票,它就能自己搜索航班、比較價格,最后幫你下單,整個過程都不用你操心。

而且,這個智能化包括兩個維度:一,是復雜任務處理能力,二,持續學習與優化能力。

以會議安排為例,Operator可以協調參會人員時間、預定會議室、發送通知等,實現全流程自動化處理,甚至,它可以學習你操作過、編排過的任務然后再學習。

02

它的使用場景是什么?報告中,有七個有趣的例子。

首先是:網上購物。

想象一下,你正準備買一雙運動鞋。以前,你要自己打開購物網站,搜索款式、比較價格,還要手動填寫收貨地址和支付信息。

現在,有了Operator,你只要告訴它:“幫我買一雙耐克運動鞋,預算500元左右。”它就能自動完成搜索、下單,甚至還能幫你找到最劃算的優惠券。這個過程完全不需要你動手,是不是很省心?

然后是,自動填寫表單,注冊賬號、申請貸款,還是填寫各種復雜的在線表格,這些任務不僅繁瑣,還很容易出錯。但Operator可以輕松搞定這些。


圖示:Operator幫人選擇產品購物

再者是:信息檢索與整理。

在工作和學習中,我們常常需要查找各種資料。比如,你正在寫一篇關于人工智能的論文,需要查找最新的研究進展。以前,可能要在多個網站之間來回切換,手動整理信息。

Operator可以直接幫你搜索相關內容,把關鍵信息整理成一個簡潔的總結,甚至還能幫你找到相關的學術論文鏈接。這樣就不用把精力浪費在搜索上。

還有日程安排。

計劃下周和客戶開一個會議,要協調雙方的時間,預定會議室,還要發送會議通知。這些事情聽起來簡單,做起來卻很費時間,Operator會自動查看日程安排,找到一個雙方都方便的時間,預定會議室,甚至還能發送會議通知給所有參與者。

我認為最有用的兩個是:創意內容制作、文件管理

我想制作一個表情包,但又不會用復雜的圖像編輯軟件。只要告訴Operator:幫我做一個搞笑的表情包,主題是‘周一的我’。

它就能自動找到合適的圖片,添加文字,甚至還能調整圖片的風格,最后生成一個有趣的表情包。

至于文件夾管理上;以前,可能需要手動搜索,甚至還要逐個打開文件查看內容,現在,Operator可以幫忙快速找到需要的文件,并且還能整理文件夾,把相似的文件歸類在一起。

這就是它的能力,是其中一部分。

03

既然這樣,Operator是怎么訓練出來的呢?

一共四個步驟:先讓它“見多識廣”,然后讓它模仿(監督學習),再讓它思考(強化學習),最后通過人類反饋(讓它少走彎路)。

首先,訓練數據的來源至關重要。

報告中顯示,OpenAI從兩個主要渠道收集數據:一是公開數據集,包括行業標準的機器學習數據集、網絡爬取的數據,這些數據為模型提供了廣泛的任務場景,涵蓋從簡單的網頁瀏覽到復雜的文件管理等操作。

二是由人類訓練員創建的數據集,這些數據集展示了如何在計算機上解決各種任務,例如點擊按鈕、填寫表單、滾動頁面等。通過這些數據,Operator學會了如何模擬人類的操作行為。

在監督學習階段,Operator學習基本的計算機操作能力,如視覺感知和輸入控制。

這一階段的任務主要是為了讓模型掌握基本的操作技能,例如在網頁上點擊鏈接、填寫表單,或者在文件管理器中打開文件夾。

強化學習階段的目標是賦予模型更高級的能力,如推理和錯誤糾正。在這一階段,Operator學會了根據任務需求制定執行策略,適應意外事件,并在執行任務時做出智能決策。

例如:當用戶要求“幫我買一雙運動鞋”時,模型會自動搜索、比較價格,并選擇最合適的商品。此外,Operator還學會了錯誤糾正;如果模型在填寫表單時出錯,它會重新嘗試或提示用戶確認。

同時,Operator能夠適應意外事件,例如:當網頁加載緩慢或界面發生變化時,模型能夠調整策略,繼續完成任務。

值得注意的是,Operator的訓練數據與GPT-4有所不同。


圖示:模型自主性評估:不同任務在不同條件下的通過率比較

GPT-4的訓練數據,主要集中在文本理解和生成上,而Operator的訓練數據,則更偏向于視覺和交互任務,這種差異使得Operator在處理圖形界面和復雜操作時表現更出色,但純文本任務上不如GPT-4靈活。

最后,通過人類反饋,Operator能夠進一步優化其性能。人類訓練員的反饋幫助模型在實際應用中少走彎路,提高其在真實場景下的適應性和效率。

總的來說,思路就是:先有數據、讓它模仿、開始思考,人類使用再進化。

04

除了這些,風險意識測試,倫理安全問題也少不了,報告中顯示,開發Operator的過程中,OpenAI始終將安全性放在首位。

畢竟,讓一個AI模型操作計算機,就像賦予它一雙無形的手,因此,OpenAI在設計和訓練Operator時,采取了一系列多層次的防護措施。

我看了下,有三點:

一,它會主動拒絕高風險的任務。比如,當你要求它購買違禁品或執行其他潛在有害的操作時,模型會直接說“不”。

根據OpenAI的內部評估,Operator對高風險任務的拒絕率高達97%,這種機制有效防止了模型被濫用或執行不當操作。

二,Operator在執行高風險操作時,會主動要求用戶確認。比如,在發送重要郵件或完成購買之前,它會先展示相關內容,并詢問用戶是否確認繼續,這種機制確保了用戶對關鍵操作的控制權,減少了模型錯誤帶來的風險。

在一些敏感網站(如郵箱、銀行網站)上,它會自動進入“監控模式”;如果離開頁面或長時間未操作,模型會暫停任務執行,直到用戶返回并確認繼續。

另外,為了全面評估Operator的風險,們邀請了來自全球20個國家的紅隊成員,使用多種語言對Operator進行了測試。


圖釋:Operator與GPT-4o在挑戰性拒絕任務中的性能對比

紅隊成員的任務,是嘗試繞過模型的安全措施,例如:

通過提示注入攻擊或惡意指令誤導模型,盡管測試環境受到限制(例如使用模擬網站和數據庫),但,紅隊測試仍然發現了關鍵漏洞,這些發現幫助OpenAI進一步完善了模型的安全性。

報告中,也顯示了Operator也面臨的一些挑戰。

目前,它擅長處理短任務和重復性操作,但在復雜任務(如幻燈片制作、日歷管理)上表現不佳。

例如:

讓它處理多步驟任務,模型可能會因為界面變化或意外事件而失敗。還有,在處理長DNA序列、隨機字符串(如API密鑰)或復雜代碼時,Operator的光學字符識別(OCR)系統表現不佳。

這是因為任務超出了訓練數據的范圍,導致模型在識別和操作內容時,容易出錯;而且,盡管OpenAI已經采取了多種措施來防止提示注入攻擊和惡意指令,但Operator在面對新型對抗性攻擊時仍可能表現出脆弱性。

總的來說,OpenAI對Operator的未來發展充滿信心,它說,要在三個方面下功夫:

一,具體的真實場景;二,更多代碼編輯和終端操作;三,將繼續優化安全防御性能,為真正實現AGI之路而奮斗。

目前,Operator AI Agent已經上線,但目前僅面向Pro用戶;要200美刀,扎心;看完這個報告,我只想說:這難道不是RPA技術用到電腦上了嗎?國內前段時間流行的手機點單和這不一樣的嗎?

希望國內大模型趕緊跟上,彎道超車它。

參考:

發布會視頻地址:https://www.youtube.com/live/CSE77wAdDLg

技術報告鏈接地址:https://cdn.openai.com/operator_system_card.pdf

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
打起來了,巴鐵向印軍猛烈開火,巴鐵有多少中國武器:能不能打贏

打起來了,巴鐵向印軍猛烈開火,巴鐵有多少中國武器:能不能打贏

暖心的小屋
2025-04-26 10:17:48
TA官宣!曼聯不簽大牌!打造平民球隊!中小球隊2核心要下樹

TA官宣!曼聯不簽大牌!打造平民球隊!中小球隊2核心要下樹

卡靈頓分析師
2025-04-26 11:58:29
A股:預判還對!所有人都注意了,下周準備開啟降落傘了!

A股:預判還對!所有人都注意了,下周準備開啟降落傘了!

春江財富
2025-04-26 08:48:23
58歲劉嘉玲晨跑引爭議:穿緊身褲不遮臀部,被網友點評“沒一點老人樣”

58歲劉嘉玲晨跑引爭議:穿緊身褲不遮臀部,被網友點評“沒一點老人樣”

LadyDaily
2025-03-15 18:07:56
剛剛 | 天津預警升級!今9級大風+雷暴+降雨!

剛剛 | 天津預警升級!今9級大風+雷暴+降雨!

天津廣播
2025-04-26 09:53:04
愛德華茲談詹姆斯今日表現:簡直不可思議,能和他同場競技絕對是一種享受

愛德華茲談詹姆斯今日表現:簡直不可思議,能和他同場競技絕對是一種享受

雷速體育
2025-04-26 14:06:14
不可思議!被中國用核武器轟炸45次的羅布泊,現在變成這樣了!

不可思議!被中國用核武器轟炸45次的羅布泊,現在變成這樣了!

今日養生之道
2025-04-25 10:29:45
確認遇難!遺體已被發現,腳上綁有啞鈴......

確認遇難!遺體已被發現,腳上綁有啞鈴......

青城之窗
2025-04-25 06:04:58
于正回應多名藝人退圈:優勝劣汰,這是一個好事情

于正回應多名藝人退圈:優勝劣汰,這是一個好事情

魯中晨報
2025-04-25 17:04:08
方昊:哥哥正在經歷病痛的折磨,希望他早日戰勝病魔

方昊:哥哥正在經歷病痛的折磨,希望他早日戰勝病魔

直播吧
2025-04-25 22:08:16
董明珠攤上事了!間諜論持續升級,官媒點名狠批,胡錫進要求道歉

董明珠攤上事了!間諜論持續升級,官媒點名狠批,胡錫進要求道歉

二向箔
2025-04-25 14:53:38
2025紅土首秀出局!鄭欽文0-2遭遇一輪游,追平馬德里站最差戰績

2025紅土首秀出局!鄭欽文0-2遭遇一輪游,追平馬德里站最差戰績

侃球熊弟
2025-04-25 21:58:12
不到24小時超百萬播放!合肥六中神秘家長引爆全網

不到24小時超百萬播放!合肥六中神秘家長引爆全網

萬民說
2025-04-26 09:43:02
國民黨今上凱道,目標逾10萬人怒吼“戰獨裁”,馬英九韓國瑜將出席

國民黨今上凱道,目標逾10萬人怒吼“戰獨裁”,馬英九韓國瑜將出席

海峽導報社
2025-04-26 08:14:56
俄本土最后一戰,烏軍死守高地拒絕投降,俄3噸級炸彈炸平山頭

俄本土最后一戰,烏軍死守高地拒絕投降,俄3噸級炸彈炸平山頭

龍炎校尉
2025-04-25 11:28:17
真是天佑中華!中美博弈的關鍵時刻,中國又傳來重大喜訊!

真是天佑中華!中美博弈的關鍵時刻,中國又傳來重大喜訊!

洞悉評說
2025-04-25 15:29:07
世錦賽決出首位八強!中國名將8-8世界冠軍,趙心童連勝三局5-3反超

世錦賽決出首位八強!中國名將8-8世界冠軍,趙心童連勝三局5-3反超

慢歌輕步謠
2025-04-26 14:41:59
胡琳娜:是丁嘉麗的女兒,在沒有愛的環境里帶淚成長37歲仍未婚

胡琳娜:是丁嘉麗的女兒,在沒有愛的環境里帶淚成長37歲仍未婚

品茗賞娛
2025-04-25 19:50:07
皮爾斯:勇士奪冠窗口已關閉 因為巴特勒復出也不是100%狀態

皮爾斯:勇士奪冠窗口已關閉 因為巴特勒復出也不是100%狀態

直播吧
2025-04-26 06:40:10
飛象網項立剛:用人標準是企業自己的選擇,董明珠不用“海歸派”不是什么歧視!格力需要的人才,海歸的不多

飛象網項立剛:用人標準是企業自己的選擇,董明珠不用“海歸派”不是什么歧視!格力需要的人才,海歸的不多

和訊網
2025-04-25 16:52:40
2025-04-26 15:31:00
智遠同學 incentive-icons
智遠同學
暢銷書《復利思維》作者;精神生活與商業探索,關注科技人文、消費電商、品牌營銷、商業認知思維等方面。
408文章數 88關注度
往期回顧 全部

科技要聞

李斌:對蔚來公司四季度盈利非常有信心

頭條要聞

巴基斯坦防長:我們曾給西方"干臟活" 為此付出了代價

頭條要聞

巴基斯坦防長:我們曾給西方"干臟活" 為此付出了代價

體育要聞

去更大的舞臺追夢 專訪中國男籃國手楊瀚森

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

手機
游戲
本地
公開課
軍事航空

手機要聞

CounterPoint 報告 2024 全球手機攝像頭出貨量:索尼領銜

小明劍魔刪除回應!“要錢就離婚”還有后續?

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

印巴交火 從“斷水”到“反制”

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 马关县| 奉化市| 鸡西市| 拜城县| 东山县| 南开区| 古交市| 长治县| 宁河县| 静海县| 牟定县| 大理市| 京山县| 深水埗区| 平乡县| 乳源| 定远县| 温州市| 张掖市| 黎平县| 扶沟县| 鸡西市| 理塘县| 龙门县| 炉霍县| 富顺县| 平潭县| 广平县| 永州市| 新巴尔虎右旗| 嘉定区| 靖远县| 德江县| 通州市| 富平县| 栖霞市| 二手房| 金乡县| 博乐市| 上杭县| 宜川县|