論文の概要: Learning Probabilistic Responsibility Allocations for Multi-Agent Interactions
- arxiv url: http://arxiv.org/abs/2604.13128v1
- Date: Mon, 13 Apr 2026 21:49:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.218727
- Title: Learning Probabilistic Responsibility Allocations for Multi-Agent Interactions
- Title(参考訳): マルチエージェントインタラクションのための確率的責任割当の学習
- Authors: Isaac Remy, Caleb Chang, Karen Leung,
- Abstract要約: 人々がどのように責任を割り当てるかを理解することは、社会的に準拠し、信頼できる自律システムの設計に通知することができる。
本稿では,マルチエージェントインタラクションに固有のマルチモーダル不確実性をキャプチャする確率的責任割り当てモデルを学習する手法を提案する。
本手法をインターアクション駆動データセット上で評価し,高い予測性能を達成できるだけでなく,解釈可能な洞察も提供することを示す。
- 参考スコア(独自算出の注目度): 4.847470451539329
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human behavior in interactive settings is shaped not only by individual objectives but also by shared constraints with others, such as safety. Understanding how people allocate responsibility, i.e., how much one deviates from their desired policy to accommodate others, can inform the design of socially compliant and trustworthy autonomous systems. In this work, we introduce a method for learning a probabilistic responsibility allocation model that captures the multimodal uncertainty inherent in multi-agent interactions. Specifically, our approach leverages the latent space of a conditional variational autoencoder, combined with techniques from multi-agent trajectory forecasting, to learn a distribution over responsibility allocations conditioned on scene and agent context. Although ground-truth responsibility labels are unavailable, the model remains tractable by incorporating a differentiable optimization layer that maps responsibility allocations to induced controls, which are available. We evaluate our method on the INTERACTION driving dataset and demonstrate that it not only achieves strong predictive performance but also provides interpretable insights, through the lens of responsibility, into patterns of multi-agent interaction.
- Abstract(参考訳): 対話的な環境での人間の行動は、個々の目的だけでなく、安全性などの他者との共有的な制約によっても形作られます。
人々がどのように責任を割り当てるか、すなわち、他者に対応するための政策からどの程度逸脱するかを理解することは、社会的に適合し、信頼できる自律システムの設計に通知することができる。
本研究では,マルチエージェントインタラクションに固有のマルチモーダル不確実性をキャプチャする確率的責任割り当てモデルを学習する手法を提案する。
具体的には、条件付き変分オートエンコーダの潜時空間とマルチエージェント軌道予測の手法を組み合わせることで、シーンとエージェントのコンテキストで条件付けられた責任配分に関する分布を学習する。
地道な責任ラベルは利用できないが、モデルには、責任割り当てを誘導制御にマッピングする差別化可能な最適化層が組み込まれており、それが利用可能である。
本手法を対話駆動データセット上で評価し,高い予測性能を達成できるだけでなく,責任レンズを通して多エージェントインタラクションのパターンに解釈可能な洞察を提供することを示す。
関連論文リスト
- Interpreting Agentic Systems: Beyond Model Explanations to System-Level Accountability [0.6745502291821954]
エージェントシステムは、ゴール指向の振る舞いを持つ自律システムを構築するために、大規模言語モデルをどのように活用するかを変えてきた。
主に静的モデルのために開発された現在の解釈可能性技術は、エージェントシステムに適用する際の制限を示す。
本稿では,エージェントシステムにおける既存の解釈可能性手法の適合性と限界について検討する。
論文 参考訳(メタデータ) (2026-01-23T21:05:32Z) - Multi-Modal Manipulation via Multi-Modal Policy Consensus [62.49978559936122]
本稿では,ロボット操作のための多様な感覚モダリティを統合するための新しいアプローチを提案する。
提案手法は,それぞれが単一の表現に特化している拡散モデルの集合にポリシーを分解する。
我々は、RLBenchにおけるシミュレーション操作タスクと、隠蔽対象のピック、手作業のスプーン再配向、パズル挿入といった実世界のタスクについて評価した。
論文 参考訳(メタデータ) (2025-09-27T19:43:04Z) - Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions [12.074590482085831]
責任レンズを介して安全なマルチエージェントインタラクションを規定する要因を定式化する。
本稿では,制御障壁関数と微分可能最適化に基づくデータ駆動モデリング手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T20:20:41Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Domain Knowledge Driven Pseudo Labels for Interpretable Goal-Conditioned
Interactive Trajectory Prediction [29.701029725302586]
目標条件付きフレームワークを用いた共同軌道予測問題について検討する。
本研究では,条件付き変分自動エンコーダ(CVAE)モデルを導入し,異なる相互作用モードを潜在空間に明示的にエンコードする。
KLの消滅を回避する新しい手法を提案し、擬似ラベルを用いた解釈可能な対話型潜在空間を誘導する。
論文 参考訳(メタデータ) (2022-03-28T21:41:21Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Scene Transformer: A unified multi-task model for behavior prediction
and planning [42.758178896204036]
実世界の運転環境における全てのエージェントの行動予測モデルを定式化する。
近年の言語モデリングアプローチにインスパイアされた我々は、マスキング戦略をモデルに対するクエリとして使用しています。
我々は,行動予測のための自律走行データセットに対するアプローチを評価し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-06-15T20:20:44Z) - Domain-Robust Visual Imitation Learning with Mutual Information
Constraints [0.0]
Disentangling Generative Adversarial Imitation Learning (DisentanGAIL)と呼ばれる新しいアルゴリズムを導入する。
本アルゴリズムは,タスクを実行する専門家の高次元観察から自律エージェントを直接学習することを可能にする。
論文 参考訳(メタデータ) (2021-03-08T21:18:58Z) - Deep Interactive Bayesian Reinforcement Learning via Meta-Learning [63.96201773395921]
他のエージェントの戦略に対する不確実性下での最適適応行動は、インタラクティブベイズ強化学習フレームワークを用いて計算することができる。
本稿では,メタラーン近似的信念推論とベイズ最適行動を提案する。
提案手法は, モデルフリーアプローチ, 近似後部からのサンプル採取, 他者のメモリフリーモデル維持, あるいは環境の既知の構造を完全に活用しない既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-01-11T13:25:13Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。