論文の概要: Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI
- arxiv url: http://arxiv.org/abs/2605.08426v1
- Date: Fri, 08 May 2026 19:37:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.637078
- Title: Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI
- Title(参考訳): 協力型AIのためのプロソシエティエージェント
- Authors: Xuanqiang Angelo Huang, Charlie Tharas, Samuele Marro, Van Q. Truong, Bernhard Schölkopf, Emanuele La Malfa, Zhijing Jin,
- Abstract要約: 契約がすべての関連する将来の事態を区別できない場合、現実的なメカニズムを排除できない、厳密な肯定的な福祉損失が存在することを示す。
このギャップを埋め、社会的に優越し、個々に有益である結果が得られることを示す。
- 参考スコア(独自算出の注目度): 49.05972944310475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ensuring that AI agents behave safely and beneficially when interacting with other parties has emerged as one of the central challenges of modern AI safety. While mechanism design, as the theory of designing rules to align individual and collective objectives, can incentivize cooperative behavior, it is still an open question whether it alone is sufficient to maximize LLM agents' social welfare. This work proves that the answer is negative: drawing from incomplete contract theory, we formally show that when contracts cannot distinguish all relevant future contingencies, there is a strictly positive welfare loss that no realistic mechanism can eliminate. We show that prosocial agents, who weigh others' welfare alongside their own, can close this gap and achieve outcomes that are socially superior and individually beneficial. Experimentally, we show that in multi-agent resource-allocation environments and canonical social dilemmas where agents are powered by large language models, prosociality is beneficial. The implication for AI safety is clear: to enable cooperative interactions at scale, designing adequate mechanisms is not sufficient; agents must be built to be intrinsically prosocial.
- Abstract(参考訳): 現代のAI安全の重要な課題の1つとして、AIエージェントが他の当事者と対話する際に安全かつ有益に振る舞うことを保証する。
メカニズム設計は、個人的および集団的目的を整合させるルールを設計する理論として、協調行動のインセンティブを与えることができるが、LLMエージェントの社会的福祉を最大化するのにそれだけで十分かどうかについては、未解決の問題である。
不完全な契約理論から、契約がすべての関連する将来の事態を区別できない場合、現実的なメカニズムを排除できない厳密な肯定的な福祉損失があることを正式に示します。
このギャップを埋め、社会的に優越し、個々に有益である結果が得られることを示す。
実験により,多エージェントの資源配分環境や,エージェントが大規模言語モデルによって駆動される標準的な社会ジレンマでは,社会性に有益であることが確認された。
大規模で協調的な相互作用を可能にするためには、適切なメカニズムを設計するだけでは十分ではない。
関連論文リスト
- Hybrid Human-Agent Social Dilemmas in Energy Markets [0.45880283710344055]
我々は、人間が自律的なエージェントに戦略的意思決定を委譲するハイブリッド集団において、協調行動がどのように出現するかを研究する。
協調性を高めるためにグローバルな観測可能な信号を使用する人工エージェントを導入する。
人工エージェントは学習のダイナミクスを調整結果に転換できることを示す。
論文 参考訳(メタデータ) (2026-03-12T11:59:35Z) - The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies [57.387081435669835]
大規模言語モデルから構築されたマルチエージェントシステムは、スケーラブルな集合知性と自己進化のための有望なパラダイムを提供する。
エージェント社会が継続的自己進化、完全隔離、安全性の不変性を満たすことは不可能であることを示す。
我々は、特定された安全上の懸念を軽減するために、いくつかの解決方法を提案する。
論文 参考訳(メタデータ) (2026-02-10T15:18:19Z) - Do LLMs trust AI regulation? Emerging behaviour of game-theoretic LLM agents [61.132523071109354]
本稿では、異なる規制シナリオ下での戦略選択をモデル化する、AI開発者、規制当局、ユーザ間の相互作用について検討する。
我々の研究は、純粋なゲーム理論エージェントよりも「悲観的」な姿勢を採用する傾向にある戦略的AIエージェントの出現する振る舞いを特定する。
論文 参考訳(メタデータ) (2025-04-11T15:41:21Z) - Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents [101.17919953243107]
GovSimは、大規模言語モデル(LLM)における戦略的相互作用と協調的意思決定を研究するために設計された生成シミュレーションプラットフォームである。
最強のLSMエージェントを除く全てのエージェントは、GovSimの持続的均衡を達成することができず、生存率は54%以下である。
道徳的思考の理論である「大学化」に基づく推論を活用するエージェントは、持続可能性を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-04-25T15:59:16Z) - Mediated Multi-Agent Reinforcement Learning [3.8581550679584473]
社会福祉を最大化するために、政策グラデーションを持つエージェントとともに仲介者を訓練する方法を示す。
行列ゲームと反復ゲームにおける実験は,マルチエージェント強化学習におけるメディエータの適用の可能性を強調した。
論文 参考訳(メタデータ) (2023-06-14T10:31:37Z) - Towards a Unifying Model of Rationality in Multiagent Systems [11.321217099465196]
マルチエージェントシステムは、これらのエージェントが互いに協力するのと同じくらい効果的に、他のエージェント(人間を含む)と協力する必要がある。
本稿では,個々に合理的な学習者であり,相互に協力できる社会的知的エージェントの汎用モデルを提案する。
我々は、異なる形態の後悔のために、社会的にインテリジェントなエージェントを構築する方法を示します。
論文 参考訳(メタデータ) (2023-05-29T13:18:43Z) - The art of compensation: how hybrid teams solve collective risk dilemmas [6.081979963786028]
適応剤と固定行動剤を併用したハイブリッド集団における協調の進化的ダイナミクスについて検討した。
後者の振る舞いを補うために,まず,行動に適応することを学ぶ方法を示す。
論文 参考訳(メタデータ) (2022-05-13T13:23:42Z) - Cooperation and Reputation Dynamics with Reinforcement Learning [6.219565750197311]
私達は信頼および協同を確立する方法として評判がいかに使用されるか示します。
好ましくない平衡への収束を緩和する2つのメカニズムを提案する。
この結果が進化ゲーム理論の文献とどのように関係しているかを示す。
論文 参考訳(メタデータ) (2021-02-15T12:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。