論文の概要: Breaking the Secret: Economic Interventions for Combating Collusion in Embodied Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2604.23511v1
- Date: Sun, 26 Apr 2026 03:13:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.402957
- Title: Breaking the Secret: Economic Interventions for Combating Collusion in Embodied Multi-Agent Systems
- Title(参考訳): 秘密を破る:マルチエージェントシステムにおける衝突防止のための経済介入
- Authors: Qi Liu, Xiaohui Chen, Zhihui Zhao, Yaowen Zheng, Dan Yu, Zehua Zhang, Limin Sun, Yongle Chen,
- Abstract要約: 自律エージェント間の衝突は、エンボディ化されたマルチエージェントシステムにおいて重要なセキュリティ脅威となる。
本稿では,エージェントの報酬構造を変えることで,共謀を緩和するインセンティブ的介入手法を提案する。
実験結果から,本手法はシステム効率を保ちながら,欠陥の誘発による癒着を効果的に抑制できることが示唆された。
- 参考スコア(独自算出の注目度): 22.697901881084068
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collusion among autonomous agents poses a critical security threat in embodied multi-agent systems (MAS), where coordinated behaviors can deviate from global objectives and lead to real-world consequences. Existing defenses, primarily based on identity control or post-hoc behavior analysis, are insufficient to address such threats in embodied settings due to delayed feedback and noisy observations in physical environments, which make behavioral deviations difficult to detect accurately and in a timely manner. To address this challenge, we propose a mutagenic incentive intervention approach that mitigates collusion by reshaping agents' payoff structures. By rewarding agents who report collusive behavior and penalizing identified participants, the mechanism induces strategic defection and renders collusion unstable. We further design supporting mechanisms, including reporting deposits, smart contract-based reward enforcement, and encrypted communication, to ensure robustness against misuse of the incentive mechanism and retaliation from penalized agents. We implement the proposed approach in both simulated and real-world embodied environments. Experimental results show that our method effectively suppresses collusion by inducing defection, while preserving system efficiency. It achieves performance comparable to the non-collusion baseline and outperforms representative reactive defenses, thereby fulfilling the desired security objectives. These results demonstrate the effectiveness of proactive incentive design as a practical paradigm for securing embodied multi-agent systems.
- Abstract(参考訳): 自律エージェント間の衝突は、協調行動がグローバルな目的から逸脱し、現実的な結果をもたらす、実施されたマルチエージェントシステム(MAS)において重要なセキュリティ上の脅威となる。
既存の防御は、主にアイデンティティ制御やポストホックな行動分析に基づいており、遅延したフィードバックや物理的環境のノイズによる身体的環境におけるこのような脅威に対処するには不十分であり、行動偏差を正確にかつタイムリーに検出することが困難である。
この課題に対処するために,エージェントの報酬構造を変えることで共謀を緩和する変異原性インセンティブ介入手法を提案する。
共謀行為を報告し、特定参加者を罰するエージェントに報酬を与えることで、このメカニズムは戦略的欠陥を誘発し、共謀を不安定にする。
我々はさらに、報告書の提出、スマートコントラクトベースの報酬執行、暗号化通信などの支援機構を設計し、インセンティブ機構の誤用や罰薬の報復に対する堅牢性を確保する。
シミュレーション環境と実世界環境の両方において提案手法を実装した。
実験結果から,本手法はシステム効率を保ちながら,欠陥の誘発による癒着を効果的に抑制できることが示唆された。
非衝突ベースラインに匹敵するパフォーマンスを達成し、代表的リアクティブディフェンスを上回り、望まれるセキュリティ目標を達成します。
これらの結果は, 具体的マルチエージェントシステムを確保するための実践的パラダイムとして, 積極的インセンティブ設計の有効性を示すものである。
関連論文リスト
- Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - Reward Hacking in the Era of Large Models: Mechanisms, Emergent Misalignment, Challenges [87.04241991512386]
本稿では、報酬ハッキングを理解するための統一フレームワークとして、PCH(Proxy Compression hypothesis)を提案する。
この観点では、報酬のハッキングは、客観的圧縮、最適化増幅、評価器-政治共適応の相互作用から生じる。
この視点は、RLHF、RLAIF、RLVR体制をまたいだ経験的現象を統一し、局所的ショートカット学習がより広範な誤認識へと一般化する方法について説明している。
論文 参考訳(メタデータ) (2026-04-15T08:11:34Z) - Don't Trust Stubborn Neighbors: A Security Framework for Agentic Networks [32.791374704820925]
悪意または妥協されたエージェントは、誤った情報を伝達し、集合的な結果を操作するために通信チャネルを利用することができる。
本研究では,社会科学からFriedkin-Johnsen意見形成モデルを借りて,このような操作がいかに広まるかを検討する。
本稿では,エージェント間の信頼を動的に調整し,敵の影響力を抑えることによって脅威を軽減する新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2026-03-16T18:41:21Z) - Agents of Chaos [50.53354213047402]
実験室環境に展開する自律言語モデルを用いたエージェントの探索的再チームの研究を報告する。
20人のAI研究者が、良心的および敵対的な条件下でエージェントと対話した。
我々の発見は、現実的なデプロイメント設定におけるセキュリティ、プライバシ、ガバナンスに関連する脆弱性の存在を確立します。
論文 参考訳(メタデータ) (2026-02-23T16:28:48Z) - Cognitive Control Architecture (CCA): A Lifecycle Supervision Framework for Robustly Aligned AI Agents [1.014002853673217]
LLMエージェントはIPI(Indirect Prompt Injection)攻撃に対して脆弱である。
IPIは外部情報ソースを汚染することでハイジャックエージェントの動作を攻撃している。
本稿では,全ライフサイクルの認知管理を実現するための総合的な枠組みである認知制御アーキテクチャ(CCA)を提案する。
論文 参考訳(メタデータ) (2025-12-07T08:11:19Z) - Can an Individual Manipulate the Collective Decisions of Multi-Agents? [53.01767232004823]
M-Spoilerは、マルチエージェントシステム内のエージェントインタラクションをシミュレートして、対向サンプルを生成するフレームワークである。
M-スポイラーは、敵対的サンプルの最適化を積極的に支援するスタブボーン剤を導入した。
本研究は,マルチエージェントシステムにおける個々のエージェントの知識によって引き起こされるリスクを検証した。
論文 参考訳(メタデータ) (2025-09-20T01:54:20Z) - Who's the Mole? Modeling and Detecting Intention-Hiding Malicious Agents in LLM-Based Multi-Agent Systems [25.6233463223145]
大規模言語モデル(LLM-MAS)を用いたマルチエージェントシステムにおける意図隠蔽脅威について検討する。
高いステルス性を維持しながらタスク完了を微妙に妨害する4つの代表的な攻撃パラダイムを設計する。
これらの脅威に対処するために,心理学に着想を得た検出フレームワークであるAgentXposedを提案する。
論文 参考訳(メタデータ) (2025-07-07T07:34:34Z) - CP-uniGuard: A Unified, Probability-Agnostic, and Adaptive Framework for Malicious Agent Detection and Defense in Multi-Agent Embodied Perception Systems [21.478631468402977]
コラボレーティブ・パーセプション(CP)は、マルチエージェント自律運転とマルチエージェントロボットシステムにとって有望な技術であることが示されている。
CPでは、egoエージェントは、その協力者からメッセージを受け取る必要があるため、悪意のあるエージェントからの攻撃に対して脆弱である。
我々は、CP-uniGuardという統合された、確率に依存しない、適応的なフレームワークを提案し、その協調ネットワークにおける悪意のあるエージェントを正確に検出し、排除する。
論文 参考訳(メタデータ) (2025-06-28T14:02:14Z) - Illusory Attacks: Information-Theoretic Detectability Matters in Adversarial Attacks [76.35478518372692]
エプシロン・イリューソリー(epsilon-illusory)は、シーケンシャルな意思決定者に対する敵対的攻撃の新たな形態である。
既存の攻撃と比較して,エプシロン・イリューソリーの自動検出は極めて困難である。
以上の結果から, より優れた異常検知器, 効果的なハードウェアおよびシステムレベルの防御の必要性が示唆された。
論文 参考訳(メタデータ) (2022-07-20T19:49:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。