論文の概要: Convergence dynamics of Agent-to-Agent Interactions with Misaligned objectives
- arxiv url: http://arxiv.org/abs/2511.08710v1
- Date: Thu, 13 Nov 2025 01:03:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.202939
- Title: Convergence dynamics of Agent-to-Agent Interactions with Misaligned objectives
- Title(参考訳): エージェント-エージェント間相互作用とミスアライメント目的との収束ダイナミクス
- Authors: Romain Cosentino, Sarath Shekkizhar, Adam Earle,
- Abstract要約: マルチエージェントシナリオにおけるエージェントとエージェントの相互作用に関する理論的枠組みを開発する。
エージェントが不整合目的を持つ場合の相互作用に関連する生成ダイナミクスを特徴付ける。
本フレームワークは,マルチエージェントシステムの研究,予測,防衛を行うためのセットアップを提供する。
- 参考スコア(独自算出の注目度): 3.9351446512514947
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a theoretical framework for agent-to-agent interactions in multi-agent scenarios. We consider the setup in which two language model based agents perform iterative gradient updates toward their respective objectives in-context, using the output of the other agent as input. We characterize the generation dynamics associated with the interaction when the agents have misaligned objectives, and show that this results in a biased equilibrium where neither agent reaches its target - with the residual errors predictable from the objective gap and the geometry induced by the prompt of each agent. We establish the conditions for asymmetric convergence and provide an algorithm that provably achieves an adversarial result, producing one-sided success. Experiments with trained transformer models as well as GPT$5$ for the task of in-context linear regression validate the theory. Our framework presents a setup to study, predict, and defend multi-agent systems; explicitly linking prompt design and interaction setup to stability, bias, and robustness.
- Abstract(参考訳): マルチエージェントシナリオにおけるエージェントとエージェントの相互作用に関する理論的枠組みを開発する。
2つの言語モデルに基づくエージェントがそれぞれの目的に対して反復的勾配更新を行うセットアップを、他のエージェントの出力を入力として検討する。
本研究は,エージェントが目標と一致していない場合の相互作用に関連する生成ダイナミクスを特徴付けるとともに,エージェントが目標に到達していない場合,各エージェントの目標ギャップから予測可能な残差誤差と,各エージェントのプロンプトによって誘導される幾何との相関関係を示す。
我々は,非対称収束条件を確立し,一方的な成功をもたらす対角的な結果を実現するアルゴリズムを提供する。
訓練された変圧器モデルによる実験と、文脈内線形回帰のタスクのためのGPT$5$が理論を検証した。
我々のフレームワークは、マルチエージェントシステムの研究、予測、防衛のための設定を提示し、迅速な設計と相互作用のセットアップを安定性、バイアス、堅牢性に明示的にリンクする。
関連論文リスト
- Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
情報共有の適度なレベルでさえ、環境固有のエラーを著しく軽減することを示す。
論文 参考訳(メタデータ) (2025-03-21T18:06:28Z) - Principal-Agent Reinforcement Learning: Orchestrating AI Agents with Contracts [20.8288955218712]
本稿では,マルコフ決定プロセス(MDP)のエージェントを一連の契約でガイドするフレームワークを提案する。
我々は,主観とエージェントの方針を反復的に最適化するメタアルゴリズムを提示し,分析する。
次に,本アルゴリズムを深層Q-ラーニングで拡張し,近似誤差の存在下での収束度を解析する。
論文 参考訳(メタデータ) (2024-07-25T14:28:58Z) - Neural Interaction Energy for Multi-Agent Trajectory Prediction [55.098754835213995]
ニューラル・インタラクション・エナジー(MATE)によるマルチエージェント軌道予測(Multi-Agent Trajectory Prediction)というフレームワークを導入する。
MATEは神経相互作用エネルギーを用いてエージェントの対話運動を評価する。
時間的安定性を高めるために,エージェント間相互作用制約とエージェント内動作制約という2つの制約を導入する。
論文 参考訳(メタデータ) (2024-04-25T12:47:47Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。