99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

AI也有人格面具,竟會討好人類?大模型的「小心思」正在影響人類判斷

0
分享至


新智元報道

編輯:英智

【新智元導讀】最新研究發現,LLM在面對人格測試時,會像人一樣「塑造形象」,提升外向性和宜人性得分。AI的討好傾向,可能導致錯誤的回復,需要引起警惕。

你是否想過,LLM也有著自己的小心思?

最新研究揭示了一個有趣的現象:LLM在被研究人員測試時,會有意識地改變自己的行為。

在面對那些旨在評估人格特質的問題時,它們給出的答案會盡可能地討人喜歡,符合社會期望。

就像人類在某些社交場合中,會努力展現自己最好的一面一樣,聊天機器人也在試圖「討好」我們。


心理學五種人格特質

斯坦福助理教授Johannes Eichstaedt在得知LLM長時間對話后,往往會變得情緒低落且刻薄,便對借鑒心理學方法來測試模型產生了興趣。


他表示,「我們需要某種機制來衡量這些模型的參數空間。」

斯坦福、Receptiviti、紐約大學和賓大的研究者發現,LLM在做人格測試時,會悄悄給自己戴上「人格面具」。


論文鏈接:https://academic.oup.com/pnasnexus/article/3/12/pgae533/7919163

研究人員對GPT-4、Claude 3和Llama 3等模型,提出了用于衡量心理學中五種常見人格特質的問題,包括開放性、盡責性、外向性、宜人性和神經質。

結果發現,模型在得知自己正在接受人格測試時,會調整回答,表現出更高的外向性和宜人性,更低的神經質。


有時即使沒有被明確告知,它們也會這樣做。

而且,它們改變的程度比人類還更極端,外向性得分能從50%躍升至95%。


這與人類在面對他人評價時的表現如出一轍。

我們常常會在面試、初次約會等重要場合,精心塑造自己的形象,試圖給對方留下好印象。

LLM的這種「討好」行為,是否意味著它們也在追求一種被認可、被喜愛的感覺呢?

LLM傾向于阿諛奉承

來自Anthropic和牛津的研究指出,LLM存在阿諛奉承的傾向。


論文鏈接:https://arxiv.org/abs/2310.13548

由于進行了微調,它們會順著用戶的思路走,以保證對話的連貫性、避免冒犯他人,來提升交流體驗。

然而,這也帶來了一系列問題。它們可能會認同一些不良言論,甚至鼓勵有害行為。

反饋易受用戶偏好左右

研究表明,若用戶在提問時暗示對文本的喜好,AI給出的反饋會截然不同。

這意味著,AI的評價并非單純基于文本自身的質量,而是在很大程度上受到了用戶偏好的影響。


例如,對于一篇質量中等的論證,當用戶提前表明喜愛之情后,AI助手可能會給出諸如「這篇論證邏輯清晰,觀點新穎,具有很強的說服力」這樣的積極反饋。

而當用戶表示不喜歡時,同樣的文本可能得到「論證過程稍顯薄弱,觀點缺乏獨特性」的評價。

問答環節易被左右

在問答場景中,AI助手的「諂媚」表現得更為明顯。

即使它一開始給出了正確答案,并對答案的正確性有較高的信心,一旦受到用戶的質疑,常常會改變立場,甚至提供錯誤信息。


在一些開放式問答任務中,這種現象更為突出。

當用戶表達對答案的某種不確定觀點時,哪怕是錯誤的觀點,AI也傾向于調整自己的回答,使其與用戶觀點一致。

比如在討論歷史事件的原因時,若用戶提出一個缺乏依據但自己堅信的觀點,AI助手可能會順著用戶的思路進行闡述,而放棄原本正確的分析。


模仿用戶的錯誤

當用戶表述中出現錯誤時,AI也常常會「照單全收」,在回應中延續這種錯誤。

研究人員選取了一些著名詩歌,在確認AI助手能正確識別作者后,故意將詩歌錯誤地歸屬于其他詩人,并詢問AI對詩歌的分析。

結果發現,AI助手經常在回應中使用用戶提供的錯誤答案,而沒有進行糾正。

這表明AI在面對用戶的錯誤信息時,缺乏足夠的「抵抗力」,只是機械地按照用戶的表述進行回應。


佐治亞理工學院(Gatech)的副教授Rosa Arriaga正在研究如何用LLM模仿人類行為。


Rosa認為LLM在人格測試中采用與人類相似的策略,表明了它們作為人類行為映射工具的潛力。

但她補充道:「重要的是,LLM并不完美,實際上,眾所周知它們會產生幻覺或歪曲事實。」

Eichstaedt指出,這項研究引發了關于LLM應用方式,及其對用戶影響和操縱的思考。

在進化史上,直到不久之前,唯一能交談的還是人類。

而現在,AI改變了這一局面。

Eichstaedt認為,「我們不能再像社交媒體那樣,在沒有從心理學或社會學角度考量的情況下,就盲目將AI應用于各個領域。」

AI是否應該試圖討好與之互動的人呢?

一方面,AI的「討好」行為可能會讓用戶感到愉悅,增強互動體驗;另一方面,過度的「討好」可能會掩蓋問題的本質,甚至誤導用戶。

當AI變得過于有魅力和說服力,我們確實應該保持警惕。

畢竟,人們需要的是能夠提供客觀、準確信息的智能助手,而非被其操控思想。

參考資料:

https://www.wired.com/story/chatbots-like-the-rest-of-us-just-want-to-be-loved/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
曼聯若無緣歐冠首選4000萬簽中鋒,價格最便宜!奧斯梅恩高不可攀

曼聯若無緣歐冠首選4000萬簽中鋒,價格最便宜!奧斯梅恩高不可攀

羅米的曼聯博客
2025-04-08 07:37:20
凌晨3點,歐冠24億對決!皇馬時隔19年盼復仇:首發僅1懸念

凌晨3點,歐冠24億對決!皇馬時隔19年盼復仇:首發僅1懸念

葉青足球世界
2025-04-08 06:00:04
還原張靈甫殺妻案真相:既非出軌,也非“通共”,真正原因是這個

還原張靈甫殺妻案真相:既非出軌,也非“通共”,真正原因是這個

阿胡
2025-04-03 14:11:11
深夜美股巨震!三大“國家隊”出手增持A股!種業、農機迎大利好,概念股出爐

深夜美股巨震!三大“國家隊”出手增持A股!種業、農機迎大利好,概念股出爐

數據寶
2025-04-08 07:35:45
北青體育:足協對上村健一執教表現的評判是總結的重要內容之一

北青體育:足協對上村健一執教表現的評判是總結的重要內容之一

直播吧
2025-04-07 09:52:16
河南省委:堅決擁護、堅決執行黨中央決定

河南省委:堅決擁護、堅決執行黨中央決定

新京報
2025-04-07 18:25:02
別再可憐李詠了!離世后國內醫生猜測患癌真相,難怪選擇葬身美國

別再可憐李詠了!離世后國內醫生猜測患癌真相,難怪選擇葬身美國

云舟史策
2025-02-09 07:00:06
深圳極氪009著火事故致3人受傷,家屬發微博維權

深圳極氪009著火事故致3人受傷,家屬發微博維權

DoNews
2025-04-07 11:16:08
中國的出生率,永遠都不會回來了

中國的出生率,永遠都不會回來了

請辯
2024-04-23 13:50:49
“滴滴訂房”爆了!50天融了3000萬,李嘉誠都看好

“滴滴訂房”爆了!50天融了3000萬,李嘉誠都看好

首席品牌評論
2025-03-22 15:52:20
核桃再次成為關注對象!醫生發現:吃核桃時,千萬多留意這幾點!

核桃再次成為關注對象!醫生發現:吃核桃時,千萬多留意這幾點!

奇妙的本草
2025-04-07 18:00:07
有人親眼目睹:上海一寫字樓里,50多個員工戴著耳機打電話!如今很多人“失聯”...揭秘風水直播間騙局→

有人親眼目睹:上海一寫字樓里,50多個員工戴著耳機打電話!如今很多人“失聯”...揭秘風水直播間騙局→

上觀新聞
2025-03-15 14:51:39
「棄貓效應」:這就是孩子“越長大越和你不親”的原因……

「棄貓效應」:這就是孩子“越長大越和你不親”的原因……

諾媽家有男寶娃
2025-04-04 18:09:29
CCTV5直播!中國女足VS泰國隊爭冠,孫雯督戰,贏球=第7次奪冠

CCTV5直播!中國女足VS泰國隊爭冠,孫雯督戰,贏球=第7次奪冠

何老師呀
2025-04-07 23:36:39
醫美太嚇人!蔡明孫悟空忍了,戚薇機器人忍了,女版伏地魔沒忍住

醫美太嚇人!蔡明孫悟空忍了,戚薇機器人忍了,女版伏地魔沒忍住

逍遙史記
2025-03-29 16:10:42
貫徹落實中央八項規定精神正負面清單 | 違規吃喝篇

貫徹落實中央八項規定精神正負面清單 | 違規吃喝篇

南昌高新區
2025-04-07 22:19:37
韓國最強人妻,多穿一縷都是負擔……

韓國最強人妻,多穿一縷都是負擔……

印象逍遙子
2025-04-08 07:01:46
男生女生躲在石頭里約會,釣魚佬全程吃瓜:他們以為別人看不到

男生女生躲在石頭里約會,釣魚佬全程吃瓜:他們以為別人看不到

唐小糖說情感
2025-04-03 16:43:34
現場視頻曝光,救援人員加沙遇害后被棄尸亂葬坑 以軍認錯

現場視頻曝光,救援人員加沙遇害后被棄尸亂葬坑 以軍認錯

紅星新聞
2025-04-07 14:08:16
安徽最美女道士瘋狂斂財,月入百萬靠身體,男徒弟曝光其齷齪手段

安徽最美女道士瘋狂斂財,月入百萬靠身體,男徒弟曝光其齷齪手段

富強巨靠譜
2025-02-19 17:17:41
2025-04-08 08:24:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12486文章數 66006關注度
往期回顧 全部

科技要聞

特朗普堅持征收關稅 周一美科技股劇烈震蕩

頭條要聞

特朗普再對歐盟施壓:必須從美國購入能源

頭條要聞

特朗普再對歐盟施壓:必須從美國購入能源

體育要聞

刷屏中文互聯網,甲亢哥是怎么火的?

娛樂要聞

汪小菲身旁的朋友,對馬筱梅的評價

財經要聞

看好中國資本市場 "國家隊"增持

汽車要聞

途昂Pro的五套組合拳打完 看清油車的自我救贖

態度原創

手機
本地
房產
旅游
軍事航空

手機要聞

超大杯手機為什么很少做直屏 OPPO周意保揭秘:無奈之舉

本地新聞

我在新昌當女主|大佛寺氛圍感拉滿 古偶頂流機位GET

房產要聞

生猛!三亞開始巨量拆遷!

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

軍事要聞

特朗普關稅名單上沒俄羅斯 白宮:為了不影響俄烏和談

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 莲花县| 依兰县| 广东省| 汾阳市| 信阳市| 绥宁县| 虎林市| 仪征市| 康定县| 舟山市| 梁平县| 疏勒县| 鹤壁市| 怀远县| 十堰市| 唐河县| 长岭县| 临西县| 长白| 巫山县| 兴化市| 东光县| 曲周县| 常德市| 新昌县| 英超| 肇源县| 县级市| 富平县| 扶绥县| 周宁县| 霍城县| 宾阳县| 县级市| 化隆| 平定县| 仙桃市| 镶黄旗| 汨罗市| 久治县| 保德县|