論文の概要: Mapping Human Anti-collusion Mechanisms to Multi-agent AI
- arxiv url: http://arxiv.org/abs/2601.00360v1
- Date: Thu, 01 Jan 2026 14:30:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.399696
- Title: Mapping Human Anti-collusion Mechanisms to Multi-agent AI
- Title(参考訳): ヒトの抗凝固機構をマルチエージェントAIにマッピングする
- Authors: Jamiu Adekunle Idowu, Ahmed Almasoud, Ayman Alfahid,
- Abstract要約: 我々は、制裁、寛大さと内部告発、監視と監査、市場デザイン、ガバナンスを含む、人間の反共機構の分類法を開発する。
それぞれのメカニズムに対して,実装アプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As multi-agent AI systems become increasingly autonomous, evidence shows they can develop collusive strategies similar to those long observed in human markets and institutions. While human domains have accumulated centuries of anti-collusion mechanisms, it remains unclear how these can be adapted to AI settings. This paper addresses that gap by (i) developing a taxonomy of human anti-collusion mechanisms, including sanctions, leniency & whistleblowing, monitoring & auditing, market design, and governance and (ii) mapping them to potential interventions for multi-agent AI systems. For each mechanism, we propose implementation approaches. We also highlight open challenges, such as the attribution problem (difficulty attributing emergent coordination to specific agents) identity fluidity (agents being easily forked or modified) the boundary problem (distinguishing beneficial cooperation from harmful collusion) and adversarial adaptation (agents learning to evade detection).
- Abstract(参考訳): マルチエージェントAIシステムがますます自律的になるにつれて、人間市場や機関で長年観察されてきたような、協調的な戦略を開発できる証拠が示される。
人間のドメインは、何世紀にもわたって反共のメカニズムを蓄積してきたが、どのようにAI設定に適応できるかは不明だ。
この論文はそのギャップに対処する
一 制裁、恩赦及び内部告発、監視及び監査、市場設計及び統治を含む人間の反共機構の分類を整備すること。
(ii)マルチエージェントAIシステムの潜在的な介入にマッピングする。
それぞれのメカニズムに対して,実装アプローチを提案する。
また,帰属問題(特定のエージェントに対する創発的調整の難しさ),アイデンティティ流動性(エージェントのフォークや修正が容易),境界問題(有害な共謀からの有益な協力の排除),敵適応(検出を避けるための学習者)といったオープンな課題も強調した。
関連論文リスト
- Can an Individual Manipulate the Collective Decisions of Multi-Agents? [53.01767232004823]
M-Spoilerは、マルチエージェントシステム内のエージェントインタラクションをシミュレートして、対向サンプルを生成するフレームワークである。
M-スポイラーは、敵対的サンプルの最適化を積極的に支援するスタブボーン剤を導入した。
本研究は,マルチエージェントシステムにおける個々のエージェントの知識によって引き起こされるリスクを検証した。
論文 参考訳(メタデータ) (2025-09-20T01:54:20Z) - Exploring Human-AI Collaboration Using Mental Models of Early Adopters of Multi-Agent Generative AI Tools [4.382163871275696]
アーリーアダプターと開発者がマルチエージェントGen AIツールをどのように概念化するかを検討した。
私たちは、Microsoftで働く13人の開発者、すべてマルチエージェントのGen AI技術のアーリーアダプターと半構造化インタビューを行いました。
エラーの伝播、予測不可能で非生産的なエージェントループの挙動、層状透明性の問題を軽減するための明確なコミュニケーションの必要性など、重要な課題を特定した。
論文 参考訳(メタデータ) (2025-09-10T05:35:38Z) - When Autonomy Goes Rogue: Preparing for Risks of Multi-Agent Collusion in Social Systems [78.04679174291329]
悪意のあるマルチエージェントシステム(MAS)のリスクをシミュレートするための概念実証手法を提案する。
この枠組みを、誤情報拡散とeコマース詐欺という2つのリスクの高い分野に適用する。
その結果,分散システムの方が,集中型システムよりも悪意ある行動を実行するのに効果的であることが示唆された。
論文 参考訳(メタデータ) (2025-07-19T15:17:30Z) - Neurodivergent Influenceability as a Contingent Solution to the AI Alignment Problem [1.3905735045377272]
AIアライメント問題は、人工知能(AI)システムが人間の価値観に従って行動することを保証することに重点を置いている。
狭義のAIからAI(Artificial General Intelligence, AGI)やスーパーインテリジェンス(Superintelligence, 超知能)への進化に伴い、制御に対する恐怖と現実的なリスクがエスカレートした。
ここでは、避けられないAIのミスアライメントを受け入れることが、競合するエージェントの動的なエコシステムを育むための緊急戦略であるかどうかを検討する。
論文 参考訳(メタデータ) (2025-05-05T11:33:18Z) - Agentic AI Needs a Systems Theory [46.36636351388794]
AI開発は現在、個々のモデル機能に過度に重点を置いている、と私たちは主張する。
エージェント認知の強化,創発的因果推論能力,メタ認知認知のメカニズムについて概説する。
システムレベルの視点は、より理解し、意図的に形作り、エージェントAIシステムに不可欠である、と私たちは強調する。
論文 参考訳(メタデータ) (2025-02-28T22:51:32Z) - Multi-Agent Risks from Advanced AI [90.74347101431474]
先進的なAIのマルチエージェントシステムは、新規で未発見のリスクを生じさせる。
エージェントのインセンティブに基づく3つの重要な障害モードと7つの重要なリスク要因を同定する。
各リスクのいくつかの重要な事例と、それらを緩和するための有望な方向性を強調します。
論文 参考訳(メタデータ) (2025-02-19T23:03:21Z) - Managing extreme AI risks amid rapid progress [171.05448842016125]
我々は、大規模社会被害、悪意のある使用、自律型AIシステムに対する人間の制御の不可逆的な喪失を含むリスクについて説明する。
このようなリスクがどのように発生し、どのように管理するかについては、合意の欠如があります。
現在のガバナンスイニシアチブには、誤用や無謀を防ぎ、自律システムにほとんど対処するメカニズムや制度が欠けている。
論文 参考訳(メタデータ) (2023-10-26T17:59:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。