論文の概要: Adaptive Accountability in Networked MAS: Tracing and Mitigating Emergent Norms at Scale
- arxiv url: http://arxiv.org/abs/2512.18561v1
- Date: Sun, 21 Dec 2025 02:04:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.397553
- Title: Adaptive Accountability in Networked MAS: Tracing and Mitigating Emergent Norms at Scale
- Title(参考訳): ネットワークMASにおける適応的アカウンタビリティ--スケールにおける創発的ノルムの追跡と緩和
- Authors: Saad Alqithami,
- Abstract要約: 大規模ネットワーク化されたマルチエージェントシステムは、ますます重要なインフラの基盤となっている。
ライフサイクルを意識した監査台帳を通じて責任フローをトレースする適応的説明責任フレームワークを導入する。
我々は、期待される介入コストが敵の支払額を超えると、妥協された相互作用の長期比率は1より厳密に小さい定数で制限されることを示す有界補完定理を証明した。
- 参考スコア(独自算出の注目度): 2.28438857884398
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large-scale networked multi-agent systems increasingly underpin critical infrastructure, yet their collective behavior can drift toward undesirable emergent norms that elude conventional governance mechanisms. We introduce an adaptive accountability framework that (i) continuously traces responsibility flows through a lifecycle-aware audit ledger, (ii) detects harmful emergent norms online via decentralized sequential hypothesis tests, and (iii) deploys local policy and reward-shaping interventions that realign agents with system-level objectives in near real time. We prove a bounded-compromise theorem showing that whenever the expected intervention cost exceeds an adversary's payoff, the long-run proportion of compromised interactions is bounded by a constant strictly less than one. Extensive high-performance simulations with up to 100 heterogeneous agents, partial observability, and stochastic communication graphs show that our framework prevents collusion and resource hoarding in at least 90% of configurations, boosts average collective reward by 12-18%, and lowers the Gini inequality index by up to 33% relative to a PPO baseline. These results demonstrate that a theoretically principled accountability layer can induce ethically aligned, self-regulating behavior in complex MAS without sacrificing performance or scalability.
- Abstract(参考訳): 大規模なネットワーク化されたマルチエージェントシステムは、ますます重要なインフラの基盤となっているが、それらの集団行動は、従来のガバナンスメカニズムを損なう、望ましくない創発的な規範へと流れ込む可能性がある。
適応的アカウンタビリティフレームワークを導入する。
i)ライフサイクルを意識した監査台帳を通じて、責任フローを継続的にトレースする。
二 分散型逐次仮説テストにより、オンラインで有害な創発的規範を検知し、
三 システムレベルの目的をほぼリアルタイムで実現する地域政策及び報酬形成介入を展開させる。
我々は、期待される介入コストが敵の支払額を超えると、妥協された相互作用の長期比率は1より厳密に小さい定数で制限されることを示す有界補完定理を証明した。
最大100個の異種エージェント,部分可観測性,確率的通信グラフを用いた大規模高性能シミュレーションにより,我々のフレームワークは,少なくとも90%のコンフィグレーションにおいて,コンフィグレーションや資源ホルディングを防止し,平均集団報酬を12-18%引き上げ,PPOベースラインと比較してギニ不等式指数を最大33%下げることを示した。
これらの結果は、理論的に原理化された説明責任層は、複雑なMASにおいて、性能やスケーラビリティを犠牲にすることなく、倫理的に整合した自己制御の振る舞いを誘導できることを示した。
関連論文リスト
- Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Resilient by Design -- Active Inference for Distributed Continuum Intelligence [6.2095604527397485]
本稿では,DCCシステムのレジリエンスを実現するための確率的アクティブ・推論・レジリエンス・エージェント(PAIR-Agent)を提案する。
PAIR-Agentは、デバイスログから因果断層グラフを構築すること、(ii)マルコフ毛布と自由エネルギー原理を用いて不確かさと不確実性を管理しながら障害を識別すること、(iii)アクティブ推論によって自律的に問題を修復すること、の3つのコアオペレーションを実行する。
論文 参考訳(メタデータ) (2025-11-10T15:30:44Z) - Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
情報共有の適度なレベルでさえ、環境固有のエラーを著しく軽減することを示す。
論文 参考訳(メタデータ) (2025-03-21T18:06:28Z) - Benign Overfitting in Out-of-Distribution Generalization of Linear Models [19.203753135860016]
我々は、アウト・オブ・ディストリビューション(OOD)体制における良心過剰の理解に向けて、最初の一歩を踏み出した。
我々は、標準的な隆起回帰において良性過剰適合が生じることを証明する非漸近保証を提供する。
また、より一般的な目標共分散行列の族についても理論的結果を示す。
論文 参考訳(メタデータ) (2024-12-19T02:47:39Z) - VALID: a Validated Algorithm for Learning in Decentralized Networks with Possible Adversarial Presence [13.612214163974459]
不均一なデータを持つ非方向性ネットワークに対して、検証された分散学習のパラダイムを導入する。
VALIDプロトコルは、検証された学習保証を達成した最初のプロトコルである。
興味深いことに、VALIDは敵のない環境での最適なパフォーマンス指標を維持している。
論文 参考訳(メタデータ) (2024-05-12T15:55:43Z) - IBP Regularization for Verified Adversarial Robustness via
Branch-and-Bound [85.6899802468343]
IBP-Rは, どちらも簡便なトレーニングアルゴリズムである。
また、$beta$-CROWNに基づく新しいロバスト性であるUPBを提示し、最先端の分岐アルゴリズムのコストを削減する。
論文 参考訳(メタデータ) (2022-06-29T17:13:25Z) - Policy Smoothing for Provably Robust Reinforcement Learning [109.90239627115336]
入力のノルム有界対向摂動に対する強化学習の証明可能な堅牢性について検討する。
我々は、スムーズなポリシーによって得られる全報酬が、入力の摂動のノルムバウンドな逆数の下で一定の閾値以下に収まらないことを保証した証明書を生成する。
論文 参考訳(メタデータ) (2021-06-21T21:42:08Z) - Robust Regularization with Adversarial Labelling of Perturbed Samples [22.37046166576859]
本稿では、正規化手法として、ALPS(Adversarial Labelling of Perturbed Samples)を提案する。
ALPSはニューラルネットワークを、それぞれの真正な入力サンプルを、逆向きに割り当てられたラベルとともに、別のものに向かって摂動することによって形成された合成サンプルで訓練する。
SVHN、CIFAR-10、CIFAR-100、Tiny-ImageNetのデータセットによる実験は、ALPSが最先端の正規化性能を持っていることを示している。
論文 参考訳(メタデータ) (2021-05-28T11:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。