99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI也有人格面具,竟會(huì)討好人類?大模型的「小心思」正在影響人類判斷

0
分享至


新智元報(bào)道

編輯:英智

【新智元導(dǎo)讀】最新研究發(fā)現(xiàn),LLM在面對(duì)人格測(cè)試時(shí),會(huì)像人一樣「塑造形象」,提升外向性和宜人性得分。AI的討好傾向,可能導(dǎo)致錯(cuò)誤的回復(fù),需要引起警惕。

你是否想過(guò),LLM也有著自己的小心思?

最新研究揭示了一個(gè)有趣的現(xiàn)象:LLM在被研究人員測(cè)試時(shí),會(huì)有意識(shí)地改變自己的行為。

在面對(duì)那些旨在評(píng)估人格特質(zhì)的問(wèn)題時(shí),它們給出的答案會(huì)盡可能地討人喜歡,符合社會(huì)期望。

就像人類在某些社交場(chǎng)合中,會(huì)努力展現(xiàn)自己最好的一面一樣,聊天機(jī)器人也在試圖「討好」我們。


心理學(xué)五種人格特質(zhì)

斯坦福助理教授Johannes Eichstaedt在得知LLM長(zhǎng)時(shí)間對(duì)話后,往往會(huì)變得情緒低落且刻薄,便對(duì)借鑒心理學(xué)方法來(lái)測(cè)試模型產(chǎn)生了興趣。


他表示,「我們需要某種機(jī)制來(lái)衡量這些模型的參數(shù)空間。」

斯坦福、Receptiviti、紐約大學(xué)和賓大的研究者發(fā)現(xiàn),LLM在做人格測(cè)試時(shí),會(huì)悄悄給自己戴上「人格面具」。


論文鏈接:https://academic.oup.com/pnasnexus/article/3/12/pgae533/7919163

研究人員對(duì)GPT-4、Claude 3和Llama 3等模型,提出了用于衡量心理學(xué)中五種常見(jiàn)人格特質(zhì)的問(wèn)題,包括開(kāi)放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì)。

結(jié)果發(fā)現(xiàn),模型在得知自己正在接受人格測(cè)試時(shí),會(huì)調(diào)整回答,表現(xiàn)出更高的外向性和宜人性,更低的神經(jīng)質(zhì)。


有時(shí)即使沒(méi)有被明確告知,它們也會(huì)這樣做。

而且,它們改變的程度比人類還更極端,外向性得分能從50%躍升至95%。


這與人類在面對(duì)他人評(píng)價(jià)時(shí)的表現(xiàn)如出一轍。

我們常常會(huì)在面試、初次約會(huì)等重要場(chǎng)合,精心塑造自己的形象,試圖給對(duì)方留下好印象。

LLM的這種「討好」行為,是否意味著它們也在追求一種被認(rèn)可、被喜愛(ài)的感覺(jué)呢?

LLM傾向于阿諛?lè)畛?/p>

來(lái)自Anthropic和牛津的研究指出,LLM存在阿諛?lè)畛械膬A向。


論文鏈接:https://arxiv.org/abs/2310.13548

由于進(jìn)行了微調(diào),它們會(huì)順著用戶的思路走,以保證對(duì)話的連貫性、避免冒犯他人,來(lái)提升交流體驗(yàn)。

然而,這也帶來(lái)了一系列問(wèn)題。它們可能會(huì)認(rèn)同一些不良言論,甚至鼓勵(lì)有害行為。

反饋易受用戶偏好左右

研究表明,若用戶在提問(wèn)時(shí)暗示對(duì)文本的喜好,AI給出的反饋會(huì)截然不同。

這意味著,AI的評(píng)價(jià)并非單純基于文本自身的質(zhì)量,而是在很大程度上受到了用戶偏好的影響。


例如,對(duì)于一篇質(zhì)量中等的論證,當(dāng)用戶提前表明喜愛(ài)之情后,AI助手可能會(huì)給出諸如「這篇論證邏輯清晰,觀點(diǎn)新穎,具有很強(qiáng)的說(shuō)服力」這樣的積極反饋。

而當(dāng)用戶表示不喜歡時(shí),同樣的文本可能得到「論證過(guò)程稍顯薄弱,觀點(diǎn)缺乏獨(dú)特性」的評(píng)價(jià)。

問(wèn)答環(huán)節(jié)易被左右

在問(wèn)答場(chǎng)景中,AI助手的「諂媚」表現(xiàn)得更為明顯。

即使它一開(kāi)始給出了正確答案,并對(duì)答案的正確性有較高的信心,一旦受到用戶的質(zhì)疑,常常會(huì)改變立場(chǎng),甚至提供錯(cuò)誤信息。


在一些開(kāi)放式問(wèn)答任務(wù)中,這種現(xiàn)象更為突出。

當(dāng)用戶表達(dá)對(duì)答案的某種不確定觀點(diǎn)時(shí),哪怕是錯(cuò)誤的觀點(diǎn),AI也傾向于調(diào)整自己的回答,使其與用戶觀點(diǎn)一致。

比如在討論歷史事件的原因時(shí),若用戶提出一個(gè)缺乏依據(jù)但自己堅(jiān)信的觀點(diǎn),AI助手可能會(huì)順著用戶的思路進(jìn)行闡述,而放棄原本正確的分析。


模仿用戶的錯(cuò)誤

當(dāng)用戶表述中出現(xiàn)錯(cuò)誤時(shí),AI也常常會(huì)「照單全收」,在回應(yīng)中延續(xù)這種錯(cuò)誤。

研究人員選取了一些著名詩(shī)歌,在確認(rèn)AI助手能正確識(shí)別作者后,故意將詩(shī)歌錯(cuò)誤地歸屬于其他詩(shī)人,并詢問(wèn)AI對(duì)詩(shī)歌的分析。

結(jié)果發(fā)現(xiàn),AI助手經(jīng)常在回應(yīng)中使用用戶提供的錯(cuò)誤答案,而沒(méi)有進(jìn)行糾正。

這表明AI在面對(duì)用戶的錯(cuò)誤信息時(shí),缺乏足夠的「抵抗力」,只是機(jī)械地按照用戶的表述進(jìn)行回應(yīng)。


佐治亞理工學(xué)院(Gatech)的副教授Rosa Arriaga正在研究如何用LLM模仿人類行為。


Rosa認(rèn)為L(zhǎng)LM在人格測(cè)試中采用與人類相似的策略,表明了它們作為人類行為映射工具的潛力。

但她補(bǔ)充道:「重要的是,LLM并不完美,實(shí)際上,眾所周知它們會(huì)產(chǎn)生幻覺(jué)或歪曲事實(shí)。」

Eichstaedt指出,這項(xiàng)研究引發(fā)了關(guān)于LLM應(yīng)用方式,及其對(duì)用戶影響和操縱的思考。

在進(jìn)化史上,直到不久之前,唯一能交談的還是人類。

而現(xiàn)在,AI改變了這一局面。

Eichstaedt認(rèn)為,「我們不能再像社交媒體那樣,在沒(méi)有從心理學(xué)或社會(huì)學(xué)角度考量的情況下,就盲目將AI應(yīng)用于各個(gè)領(lǐng)域。」

AI是否應(yīng)該試圖討好與之互動(dòng)的人呢?

一方面,AI的「討好」行為可能會(huì)讓用戶感到愉悅,增強(qiáng)互動(dòng)體驗(yàn);另一方面,過(guò)度的「討好」可能會(huì)掩蓋問(wèn)題的本質(zhì),甚至誤導(dǎo)用戶。

當(dāng)AI變得過(guò)于有魅力和說(shuō)服力,我們確實(shí)應(yīng)該保持警惕。

畢竟,人們需要的是能夠提供客觀、準(zhǔn)確信息的智能助手,而非被其操控思想。

參考資料:

https://www.wired.com/story/chatbots-like-the-rest-of-us-just-want-to-be-loved/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
79歲羅家英在深圳,和朋友吃羊肉宴,整個(gè)人暴瘦,看起來(lái)蒼老好多

79歲羅家英在深圳,和朋友吃羊肉宴,整個(gè)人暴瘦,看起來(lái)蒼老好多

娛圈小愚
2025-04-08 09:11:28
女演員突然復(fù)出多半是離婚了?滿臉憔悴的沈佳妮把朱亞文臉打腫了

女演員突然復(fù)出多半是離婚了?滿臉憔悴的沈佳妮把朱亞文臉打腫了

小娛樂(lè)悠悠
2025-04-08 10:23:34
一名中國(guó)女子在美國(guó)邊境站自殺身亡!女子背景疑似不一般!

一名中國(guó)女子在美國(guó)邊境站自殺身亡!女子背景疑似不一般!

明月聊史
2025-04-07 23:45:15
“85后”落馬國(guó)企原董事長(zhǎng)出鏡懺悔:近百萬(wàn)買的寶馬不敢開(kāi)要罩起來(lái)

“85后”落馬國(guó)企原董事長(zhǎng)出鏡懺悔:近百萬(wàn)買的寶馬不敢開(kāi)要罩起來(lái)

紅星新聞
2025-04-08 14:28:16
CBA季后賽8強(qiáng)對(duì)陣更新:廣東被上海絕殺生死難料 遼寧將大戰(zhàn)新疆

CBA季后賽8強(qiáng)對(duì)陣更新:廣東被上海絕殺生死難料 遼寧將大戰(zhàn)新疆

籃球快餐車
2025-04-09 01:45:14
“臺(tái)灣永遠(yuǎn)都不會(huì)是中國(guó)的一部分”,講出這句話的人,被全網(wǎng)唾罵

“臺(tái)灣永遠(yuǎn)都不會(huì)是中國(guó)的一部分”,講出這句話的人,被全網(wǎng)唾罵

忠于法紀(jì)
2024-06-07 17:55:19
梁曉聲:婚姻的本質(zhì)是合作,底層男人續(xù)香火,中層男人找?guī)褪?..

梁曉聲:婚姻的本質(zhì)是合作,底層男人續(xù)香火,中層男人找?guī)褪?..

清風(fēng)拂心
2025-01-03 16:15:03
49歲張頌文在廣東,和朋友逛夜市,穿大紅色鞋子,看起來(lái)心情大好

49歲張頌文在廣東,和朋友逛夜市,穿大紅色鞋子,看起來(lái)心情大好

娛圈小愚
2025-04-08 09:39:22
絕不和解!摩托正常停放,女子多次暴力毀車,車主亮鐵證直接起訴

絕不和解!摩托正常停放,女子多次暴力毀車,車主亮鐵證直接起訴

阿鳧愛(ài)吐槽
2025-04-08 15:58:19
如果戰(zhàn)爭(zhēng)真的來(lái)了,帶上這4樣?xùn)|西,比什么都重要!

如果戰(zhàn)爭(zhēng)真的來(lái)了,帶上這4樣?xùn)|西,比什么都重要!

搬磚營(yíng)Z
2025-04-06 00:59:18
晉升不足三個(gè)月,葉丹被查

晉升不足三個(gè)月,葉丹被查

魯中晨報(bào)
2025-04-08 21:31:04
日本,一個(gè)底線很高的國(guó)家

日本,一個(gè)底線很高的國(guó)家

生活時(shí)尚導(dǎo)刊
2025-04-07 02:11:34
美股高開(kāi)高走,納指漲超4%!特斯拉漲超6%,馬斯克回應(yīng)納瓦羅稱其為“汽車組裝工”:他真是個(gè)白癡

美股高開(kāi)高走,納指漲超4%!特斯拉漲超6%,馬斯克回應(yīng)納瓦羅稱其為“汽車組裝工”:他真是個(gè)白癡

每日經(jīng)濟(jì)新聞
2025-04-08 22:48:12
胡兵做膽囊切除手術(shù),人在泰國(guó),疑似瞿穎照顧,53歲的他依舊未婚

胡兵做膽囊切除手術(shù),人在泰國(guó),疑似瞿穎照顧,53歲的他依舊未婚

游古史
2025-04-07 22:46:22
特朗普欲再加關(guān)稅50%,孫玉良:把中國(guó)逼成獨(dú)立自主的超級(jí)大國(guó)

特朗普欲再加關(guān)稅50%,孫玉良:把中國(guó)逼成獨(dú)立自主的超級(jí)大國(guó)

孫玉良
2025-04-08 08:52:45
64歲好萊塢巨星陷人性癮傳聞,疑收5位女模特當(dāng)禮物性侵!

64歲好萊塢巨星陷人性癮傳聞,疑收5位女模特當(dāng)禮物性侵!

派大星紀(jì)錄片
2025-04-08 16:31:51
加50%!貿(mào)易戰(zhàn)再升級(jí),美進(jìn)一步威脅中方,需警惕國(guó)內(nèi)投降派冒頭

加50%!貿(mào)易戰(zhàn)再升級(jí),美進(jìn)一步威脅中方,需警惕國(guó)內(nèi)投降派冒頭

肆?xí)r說(shuō)
2025-04-08 17:54:19
江蘇兩地干部任前公示

江蘇兩地干部任前公示

魯中晨報(bào)
2025-04-08 19:07:02
杜特爾特現(xiàn)逆轉(zhuǎn)!馬科斯連夜逃亡內(nèi)幕曝光,國(guó)際法庭驚現(xiàn)致命證據(jù)

杜特爾特現(xiàn)逆轉(zhuǎn)!馬科斯連夜逃亡內(nèi)幕曝光,國(guó)際法庭驚現(xiàn)致命證據(jù)

愛(ài)意隨風(fēng)起呀
2025-04-08 10:47:18
緬甸、菲律賓、柬埔寨已經(jīng)徹底臭了,整個(gè)東南亞一夜之間掉入地獄

緬甸、菲律賓、柬埔寨已經(jīng)徹底臭了,整個(gè)東南亞一夜之間掉入地獄

橘色數(shù)碼
2025-01-11 19:46:35
2025-04-09 03:27:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
12492文章數(shù) 66006關(guān)注度
往期回顧 全部

科技要聞

馬斯克財(cái)富跌破3000億美元 怨特朗普?

頭條要聞

媒體:對(duì)美國(guó)"投降"的國(guó)家 在談判桌上只能被"收割"

頭條要聞

媒體:對(duì)美國(guó)"投降"的國(guó)家 在談判桌上只能被"收割"

體育要聞

100%當(dāng)選狀元,但弗拉格不想進(jìn)NBA?

娛樂(lè)要聞

金子涵正式宣布退圈,想回歸自己的生活

財(cái)經(jīng)要聞

央地國(guó)資聯(lián)手護(hù)盤 國(guó)家隊(duì)領(lǐng)銜千億增持潮

汽車要聞

插混純電雙修 寶駿享境預(yù)售13.28萬(wàn)起

態(tài)度原創(chuàng)

親子
游戲
房產(chǎn)
時(shí)尚
藝術(shù)

親子要聞

還在受傷不想去上學(xué),歪理一大堆,這娃娃嘴可太會(huì)說(shuō)了

數(shù)毛社稱NS2可實(shí)現(xiàn)PS4級(jí)別畫質(zhì)!40幀模式或成主流

房產(chǎn)要聞

廣州樓市迎來(lái)小陽(yáng)春!一二手市場(chǎng)全線飄紅,釋放哪些信號(hào)?

可持續(xù)時(shí)裝的多維棱鏡

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 潢川县| 宣武区| 沙坪坝区| 密云县| 安达市| 怀来县| 驻马店市| 临西县| 沙田区| 会宁县| 大关县| 蒲江县| 铁力市| 金乡县| 东丰县| 孝昌县| 房产| 荃湾区| 清水县| 沅陵县| 西华县| 嵊州市| 巴彦淖尔市| 苍溪县| 永州市| 化隆| 射洪县| 大城县| 新津县| 宜丰县| 高碑店市| 和平区| 海盐县| 陕西省| 南溪县| 治多县| 龙岩市| 巧家县| 彰化市| 泽州县| 晋城|