99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

合成數據的突破: 從降低迎合性偏差到認知自主性的重構

0
分享至

馬來西亞思特雅大學博士生王立博,近兩年來主要研究大語言模型。起初,王立博做這類研究也是被大語言模型給逼的,因為日常總得提防其“獻媚(Sycophancy)”,這是由基于人類反饋的強化學習調優策略導致的固有缺陷。

因此,他致力于設計能夠自主學習、思考和推理的人工智能,而不是人工寵物。

引入強化學習的訓練獎勵模型進行微調,盡管可以優化用戶體驗,但是引入偏見是不可避免的,因為“獎勵”的依據是優先考慮用戶反饋的滿意度而未必是考慮客觀事實。這種偏見通常來源于互聯網數據,而大語言模型的訓練數據集主要依賴于互聯網信息。

基于此,王立博嘗試通過合成數據干預來優化僅解碼器(decoder-only)transformer 架構,彌補其對輸入序列缺乏深度分析的不足。

在生成過程中他嘗試設計加入額外阻礙,促使模型自主判斷并拒絕不合理的輸入。這一構想原理上能有效避免過度依賴用戶的反饋,因為合成數據干預會更側重于模型內在推理能力的培養,而非尋求 RAG 外部知識庫。


(來源:OpenAI)

此外,實現自主思考的重要標志之一就是判斷力,為此王立博構想加入反面示例和對抗性輸入來提升模型的抗獻媚性。

實驗結果顯示,經過合成數據干預后的 GPT4o 在量化獻媚指標上顯著下降。如果這一成果有機會走出實驗室,它可能為 decoder-only 架構的模型會帶來更客觀的決策支持,并減少偏見。

同時,該成果在機器人、自動駕駛和醫療等領域的應用,有助于提升自動化科學研究的效率。

更令王立博興奮的是,此次實驗是通過提示詞工程(prompt engineering)實現。這意味著未來合成數據干預可以不再依賴傳統的代碼編寫,僅通過編寫自然語言,推動“AI 工程師”從專業技術人員走向普羅大眾,為更多探索者擴大平等契機。

未來,開發、優化、數據處理、特征挖掘以及對前沿技術知識的了解,可能無需再依賴少數掌握編程和數學知識的專家,而只需設計邏輯清晰的提示詞。

日前,相關論文《減輕僅解碼器變換器架構中的獻媚:合成數據干預》(Mitigating Sycophancy in Decoder-Only Transformer Architectures: Synthetic Data Intervention)為題發在 arXiv[1]。


圖 | 相關論文(來源:arXiv)

隨著大語言模型推理思考和生成代碼等能力的增強, 提示詞工程使人們有機會更平等地與各領域科學家共享信息資源。因此,未來王立博會致力于推動未來工程的提示詞化,簡單直接平等。

比如,最近王立博通過設計 prompt 進行黑盒測試 (Black-Box Testing) 實驗,嘗試模擬攻擊大語言模型的護欄。他發現即便如 GPT4o 和 Grok-2 Beta,其護欄在識別多步驟越獄傾向的提示詞時仍存在較大困難。

其還通過模擬場景設計了 7 到 10 步的提示詞成功順利使得所有模型模擬生成言語攻擊的內容。這意味著當前的大語言模型的護欄仍需完善。

在稀疏注意力方面,王立博曾設計通過稀疏注意力機制降低大語言模型中思維鏈推理的成本。

同樣的,王立博通過提示詞基于 GPTs 訓練的實驗模型與 o1 preview 進行對比。實驗結果顯示,在犧牲可接受范圍內的準確率的條件下,稀疏注意力機制與具備思維鏈的編碼器-解碼器(encoder-decoder)transformer 架構結合,在推理時間和推理步驟方面都顯著降低。

王立博也曾設計過將自動語音識別和大語言模型引入智能眼鏡的架構,這些構想如今正在被工業界所實踐。即便合成數據干預或稀疏注意力機制被廣泛應用,由于其本身的限制性使交互仍主要集中在視覺和聽覺。而隨著當前深度強化學習技術不斷優化更新,人形機器人將迎來質的高速發展。在促進自主學習能力的同時,王立博設計了人形機器人多場景推理 (Multi-Scenario Reasoning) 以及模塊化機器人實現自主變形的認知模塊化控制 (Cognitive Modular Control) 等架構。受到人腦認知架構的啟發,他致力于為自適應機器人引入認知的自主化技術,促進機器人的多形態或多用途的方向轉型。因此,探索機器人在工業領域具備感知、思考、推理、規劃、記憶和決策等能力的認知自主性成為王立博的下一個研究目標。

參考資料:

1.https://doi.org/10.48550/arXiv.2411.10156

2.https://doi.org/10.48550/arXiv.2411.09111

3.https://doi.org/10.48550/arXiv.2411.16730

4.https://doi.org/10.48550/arXiv.2412.20429

5.https://openreview.net/pdf?id=lJr0M8vpZO

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
華為享界月銷量驟降至622輛,是什么原因讓這款車賣不動?

華為享界月銷量驟降至622輛,是什么原因讓這款車賣不動?

小毅說事
2025-04-08 08:47:40
歐盟:4月15日起實施第一輪對美關稅反制

歐盟:4月15日起實施第一輪對美關稅反制

新華社
2025-04-07 23:50:06
中紀委指定貪污千萬與受賄并罰獲最低刑

中紀委指定貪污千萬與受賄并罰獲最低刑

京都律師事務所
2025-04-08 15:37:24
中美貿易戰如何收尾:72年前毛主席一番話,才是最佳解決方案!

中美貿易戰如何收尾:72年前毛主席一番話,才是最佳解決方案!

老謝談史
2025-04-08 12:31:35
澳衛星接近中國空間站,并拍攝高清照片,天宮竟成了他們的宣傳品

澳衛星接近中國空間站,并拍攝高清照片,天宮竟成了他們的宣傳品

科學黑洞v
2025-04-07 19:32:10
一貨車進入甘肅蘭州西沙黃河大橋時撞到限高桿,駕駛員不幸身亡

一貨車進入甘肅蘭州西沙黃河大橋時撞到限高桿,駕駛員不幸身亡

大風新聞
2025-04-08 09:23:03
連著兩天失態后,特朗普主動提出和解條件,要中方必須滿足!

連著兩天失態后,特朗普主動提出和解條件,要中方必須滿足!

星辰故事屋
2025-04-07 21:03:41
網傳某新能源汽車銷售人員邀約客戶清明節提車!引發客戶雷霆發怒

網傳某新能源汽車銷售人員邀約客戶清明節提車!引發客戶雷霆發怒

火山詩話
2025-04-07 08:40:01
林美貞宣布與孫興離婚!斬斷24年情:他以后的行為與我和兒子無關

林美貞宣布與孫興離婚!斬斷24年情:他以后的行為與我和兒子無關

阿鳧愛吐槽
2025-04-08 14:53:20
再見杜蘭特,再見申京,火箭史詩級交易出爐,這讓其他隊怎么打

再見杜蘭特,再見申京,火箭史詩級交易出爐,這讓其他隊怎么打

青山隱隱啊
2025-04-08 15:35:27
馬奇諾防線真的是笑話嗎?62年毛主席:你們沒看懂法國的真實目的

馬奇諾防線真的是笑話嗎?62年毛主席:你們沒看懂法國的真實目的

boss外傳
2025-04-08 09:20:06
甲亢哥只想和大張偉合體,卻被送到芒果臺錄節目,還能更尬嗎?

甲亢哥只想和大張偉合體,卻被送到芒果臺錄節目,還能更尬嗎?

新金牌娛樂觀察家
2025-04-08 06:33:51
特朗普輸定了,若對中國關稅再加征50%,統一臺灣時間將加速到來

特朗普輸定了,若對中國關稅再加征50%,統一臺灣時間將加速到來

跳跳歷史
2025-04-08 16:43:14
松江消防通報:一單位發生火災,已撲滅無人員傷亡

松江消防通報:一單位發生火災,已撲滅無人員傷亡

澎湃新聞
2025-04-08 16:32:26
男子100萬買的房子,去交稅時卻被要求按照125萬去交稅,男子怒懟工作人員。

男子100萬買的房子,去交稅時卻被要求按照125萬去交稅,男子怒懟工作人員。

張曉磊
2025-04-07 11:50:01
上海一豪華酒店報警!女子低價購買“灰色服務”遇尷尬一幕!多家星級酒店被“鉚牢”

上海一豪華酒店報警!女子低價購買“灰色服務”遇尷尬一幕!多家星級酒店被“鉚牢”

新民晚報
2025-04-08 10:00:58
微軟回應停止在華運營:信息不實

微軟回應停止在華運營:信息不實

財聯社
2025-04-07 15:35:28
次輪行情!佛大明星后衛克萊頓當選瘋三MOP!

次輪行情!佛大明星后衛克萊頓當選瘋三MOP!

直播吧
2025-04-08 11:33:13
再加征50%關稅!特朗普威脅中國舉手投降,中方:奉陪到底

再加征50%關稅!特朗普威脅中國舉手投降,中方:奉陪到底

第一軍情
2025-04-08 09:35:06
現在高價賣掉房子的人,都將后悔?2025年中國樓市或迎來一輪暴漲

現在高價賣掉房子的人,都將后悔?2025年中國樓市或迎來一輪暴漲

巢客HOME
2025-04-08 06:40:05
2025-04-08 18:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15035文章數 513525關注度
往期回顧 全部

科技要聞

iPhone在美會賣2萬元上嗎?在中國會漲價嗎

頭條要聞

美媒談"貿易戰":"明代中國"已給特朗普政府敲響警鐘

頭條要聞

美媒談"貿易戰":"明代中國"已給特朗普政府敲響警鐘

體育要聞

極限一穿四,他把韓國主場打到靜音

娛樂要聞

尷尬!甲亢哥想聯動大張偉,卻被迫錄節目

財經要聞

"中國版平準基金"橫空出世 央行表態

汽車要聞

一季度車企銷量:下沉與上行,覺醒與迷惘

態度原創

本地
家居
手機
時尚
公開課

本地新聞

云游中國|更好濰坊,更好的家

家居要聞

現代風格 年輕簡約

手機要聞

酷賽科技旗下產品登頂紅點獎 中國智造再獲國際設計界權威認證

別再披頭散發了!今春流行“奶奶發飾”,好看巨顯臉小

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 阿鲁科尔沁旗| 图们市| 涿州市| 六安市| 石屏县| 类乌齐县| 延吉市| 濮阳市| 井陉县| 镇平县| 江口县| 延安市| 香港| 宁安市| 宜宾市| 马公市| 乐亭县| 积石山| 赞皇县| 区。| 伊宁县| 桃园县| 桐柏县| 万全县| 区。| 沛县| 如东县| 高青县| 亚东县| 普兰店市| 肇庆市| 南京市| 邹城市| 石台县| 新邵县| 马边| 师宗县| 方城县| 宜兰县| 汤原县| 温泉县|