在發表于《公共科學圖書館·計算生物學》的一項新研究中,來自馬克斯·普朗克進化生物學研究所、卡迪夫大學和谷歌的一個國際研究團隊重新審視了羅伯特·阿克塞爾羅德的開創性工作。
在重復的囚徒困境中,成功在很大程度上取決于對不同環境的適應。在阿克塞爾羅德的受控場景中表現出色的策略,在面對更多樣化的對手時往往會失敗。成功的策略不僅友善且互惠,而且聰明、略帶嫉妒,還能適應周圍環境。
囚徒困境是博弈論中的一個經典游戲,為玩家提供了合作或背叛的選擇。雙方合作會給雙方帶來適度的獎賞,而單方面的背叛會給背叛者帶來高額獎勵,給合作者帶來重大損失。如果雙方都背叛,他們得到的比雙方合作要少。這種個人利益與集體利益之間的緊張關系,使該游戲成為經濟學、政治學和生物學中決策的范例。
1980 年,羅伯特·阿克塞爾羅德組織了一場極具影響力的迭代囚徒困境錦標賽。
他邀請全球各地的科學家通過計算機代碼提交策略。
獲勝策略“以牙還牙”遵循了以下四個關鍵原則:避免嫉妒、保持友善、相互回報以及保持簡單。
雖然這些原則解釋了“以牙還牙”在阿克塞爾羅德錦標賽中成功的原因,但該研究存在明顯的局限性。
僅測試了 14 種策略,而且初步結果與參與者進行了共享,這或許會影響提交的內容。
此外,錦標賽具有受控性質,其種類有限,規則嚴格,并未反映出現實世界場景的復雜性。
最近的研究在不同條件下的數千場比賽里對已發表作品中的 195 種策略進行了測試。結果表明,在面對更為多樣的對手時,往往表現欠佳。該團隊并非確定了單一的獲勝策略,而是發現了成功方法所具有的共同特征:它們略帶嫉妒、聰明、互惠、適應性強,并且愿意根據環境調整合作水平。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.