論文の概要: Hidden Coalitions in Multi-Agent AI: A Spectral Diagnostic from Internal Representations
- arxiv url: http://arxiv.org/abs/2605.06696v1
- Date: Mon, 04 May 2026 16:59:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.469083
- Title: Hidden Coalitions in Multi-Agent AI: A Spectral Diagnostic from Internal Representations
- Title(参考訳): 多エージェントAIにおける隠れ結合:内部表現からのスペクトル診断
- Authors: Cameron Berg, Susan L. Schneider, Mark M. Bailey,
- Abstract要約: 相互作用するAIエージェントのコレクションは、AIの安全性と整合性に不可欠な創発的なグループレベルの組織を形成することができる。
本稿では,マルチエージェントシステムの内部神経表現から連立構造を検出するための実用的手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Collections of interacting AI agents can form coalitions, creating emergent group-level organization that is critical for AI safety and alignment. However, observing agent behavior alone is often insufficient to distinguish genuine informational coupling from spurious similarity, as consequential coalitions may form at the level of internal representations before any overt behavioral change is apparent. Here, we introduce a practical method for detecting coalition structure from the internal neural representations of multi-agent systems. The approach constructs a pairwise mutual-information graph from the hidden states of agents and applies spectral partitioning to identify the most salient coalition boundary. We validate this method in two domains. First, in multi-agent reinforcement learning environments, the method successfully recovers programmed hierarchical and dynamic coalition structures and correctly rejects false positives arising from behavioral coordination without informational coupling. Second, using a large language model, the method identifies coalition structures implied by descriptive prompts, tracks dynamic team reassignments, and reveals a representational hierarchy where explicit labels dominate over conflicting interaction patterns. Across both settings, the recovered partition reveals subgroup organization that a scalar cross-agent mutual-information measure cannot distinguish. The results demonstrate that analyzing hidden-state mutual information through spectral partitioning provides a scalable diagnostic for identifying representational coalitions, offering a valuable tool for monitoring emergent structure in distributed AI systems.
- Abstract(参考訳): 相互作用するAIエージェントのコレクションは、AIの安全性と整合性に不可欠な創発的なグループレベルの組織を形成することができる。
しかしながら、エージェントの振る舞いを観察することだけでは、真の情報結合と突発的な類似性を区別するには不十分な場合が多い。
本稿では,マルチエージェントシステムの内部神経表現から連立構造を検出するための実用的手法を提案する。
このアプローチはエージェントの隠蔽状態からペアワイズ相互情報グラフを構築し、最も健全な連立境界を特定するためにスペクトル分割を適用する。
この手法を2つの領域で検証する。
まず、マルチエージェント強化学習環境では、プログラムされた階層的・動的連立構造を回復し、情報結合のない行動調整から生じる偽陽性を正しく否定する。
第二に、大きな言語モデルを用いて、説明的プロンプトによって示唆される連立構造を特定し、動的チームの再割り当てを追跡し、競合する相互作用パターンを明示的なラベルが支配する表現階層を明らかにする。
両方の設定で、復元されたパーティションは、スカラー・クロスエージェントの相互情報化手段が区別できないサブグループ組織を明らかにする。
その結果、スペクトル分割による隠れ状態の相互情報の解析は、分散AIシステムにおける創発的構造を監視するための貴重なツールとして、表現的連立を識別するためのスケーラブルな診断を提供することを示した。
関連論文リスト
- Group Cognition Learning: Making Everything Better Through Governed Two-Stage Agents Collaboration [13.299987551113809]
グループ認知学習(グループ認知学習、Group Cognition Learning、GCL)は、モダリティ固有の符号化の後に2段階のプロトコルを適用する、管理された協調パラダイムである。
GCLはモダリティの優位性と結合を緩和し、回帰ベンチマークと分類ベンチマークの両方で最先端の結果を確立する。
論文 参考訳(メタデータ) (2026-05-01T03:19:34Z) - Beyond Nodes vs. Edges: A Multi-View Fusion Framework for Provenance-Based Intrusion Detection [6.343815622517112]
PROVfusionは、証明に基づく侵入検知のための多視点異常融合フレームワークである。
軽量な融合スキームを通じて異種異常信号を融合し、投票ベースの統合プロセスを通じて最終的な異常決定を決定する。
広く使用されている9つのベンチマークエンティティデータセットの実験では、PROVfusionは単一ノードとエッジ中心のベースラインよりも高い検出精度と偽陽性率を実現する。
論文 参考訳(メタデータ) (2026-04-16T06:40:50Z) - Detecting Multi-Agent Collusion Through Multi-Agent Interpretability [0.3467226901703539]
NARCBenchは環境分布シフト下での衝突検出のベンチマークである。
グループレベルでシナリオを分類するために,エージェントごとの詐欺スコアを集計する5つの探索手法を提案する。
単一のプローブ技術が全ての共謀タイプで支配的であり、異なる形の共謀が活性化空間で異なることを示唆している。
論文 参考訳(メタデータ) (2026-04-01T17:08:05Z) - Code-in-the-Loop Forensics: Agentic Tool Use for Image Forgery Detection [59.04089915447622]
ForenAgentはインタラクティブなIFDフレームワークで、MLLMが検出対象に関するPythonベースの低レベルツールを自律的に生成、実行、洗練することができる。
人間の推論にインスパイアされた我々は、グローバルな認識、局所的な焦点、反復的探索、そして全体論的偏見を含む動的推論ループを設計する。
実験の結果,ForenAgent は IFD 課題に対する創発的なツール利用能力と反射的推論を示すことがわかった。
論文 参考訳(メタデータ) (2025-12-18T08:38:44Z) - Emergent Coordination in Multi-Agent Language Models [2.504366738288215]
マルチエージェントシステムが高次構造の兆候を示すかどうかをテストするための情報理論フレームワークを提案する。
この情報分解により、マルチエージェントLLMシステムに動的に出現するかどうかを測定することができる。
我々は,エージェントの直接通信を使わずに,単純な推測ゲームを用いた実験に本フレームワークを適用した。
論文 参考訳(メタデータ) (2025-10-05T11:26:41Z) - Sectoral Coupling in Linguistic State Space [0.0]
我々は,ある認知セクターが,ある抽象レベルにおいて他の認知セクターにどのように影響するかを特徴付ける,セクター結合定数のシステムを導入する。
我々は,これらのレベル内結合の役割を詳細に分類し,知覚統合,メモリアクセスと形成,計画,メタ認知,実行制御,情動調節などの領域を網羅する。
このフレームワークは、AIシステム設計、アライメント診断、創発的エージェントの振る舞いの分析など、複雑な認知をモデル化するための機械的かつ解釈可能なアプローチに寄与する。
論文 参考訳(メタデータ) (2025-06-15T17:58:54Z) - A Cooperative Multi-Agent Framework for Zero-Shot Named Entity Recognition [71.61103962200666]
ゼロショット名付きエンティティ認識(NER)は、注釈のないテキストコーパスからエンティティ認識システムを開発することを目的としている。
最近の研究は、特別なプロンプトテンプレートを作成することで、ゼロショットNERに大規模な言語モデル(LLM)を適用している。
ゼロショットNERのための新しいフレームワークである協調型マルチエージェントシステム(CMAS)を紹介する。
論文 参考訳(メタデータ) (2025-02-25T23:30:43Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - CoADNet: Collaborative Aggregation-and-Distribution Networks for
Co-Salient Object Detection [91.91911418421086]
Co-Salient Object Detection (CoSOD)は、2つ以上の関連する画像を含む所定のクエリグループに繰り返し現れる健全なオブジェクトを発見することを目的としている。
課題の1つは、画像間の関係をモデリングし、活用することによって、コ・サリヤ・キューを効果的にキャプチャする方法である。
我々は,複数画像から有能かつ反復的な視覚パターンを捉えるために,エンドツーエンドの協調集約配信ネットワーク(CoADNet)を提案する。
論文 参考訳(メタデータ) (2020-11-10T04:28:11Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z) - Dual Adversarial Auto-Encoders for Clustering [152.84443014554745]
教師なしクラスタリングのためのDual-AAE(Dual-AAE)を提案する。
Dual-AAEの目的関数に対する変分推論を行うことで,一対のオートエンコーダをトレーニングすることで最適化可能な新たな再構成損失を導出する。
4つのベンチマーク実験により、Dual-AAEは最先端のクラスタリング手法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-23T13:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。