論文の概要: ToMCAT: Theory-of-Mind for Cooperative Agents in Teams via Multiagent Diffusion Policies
- arxiv url: http://arxiv.org/abs/2502.18438v1
- Date: Tue, 25 Feb 2025 18:31:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-26 15:18:57.534024
- Title: ToMCAT: Theory-of-Mind for Cooperative Agents in Teams via Multiagent Diffusion Policies
- Title(参考訳): ToMCAT:マルチエージェント拡散政策によるチームにおける協調エージェントの理論
- Authors: Pedro Sequeira, Vidyasagar Sadhu, Melinda Gervasio,
- Abstract要約: ToMCAT(Theory-of-Mind for Cooperative Agents in Teams)は、ToM条件のトラジェクトリを生成するための新しいフレームワークである。
メタラーニングのメカニズムは、チームメイトの基本となる目標と将来の振る舞いに対してToM推論を実行し、マルチエージェントのデノベーション/拡散モデルと組み合わせます。
- 参考スコア(独自算出の注目度): 2.6490401904186758
- License:
- Abstract: In this paper we present ToMCAT (Theory-of-Mind for Cooperative Agents in Teams), a new framework for generating ToM-conditioned trajectories. It combines a meta-learning mechanism, that performs ToM reasoning over teammates' underlying goals and future behavior, with a multiagent denoising-diffusion model, that generates plans for an agent and its teammates conditioned on both the agent's goals and its teammates' characteristics, as computed via ToM. We implemented an online planning system that dynamically samples new trajectories (replans) from the diffusion model whenever it detects a divergence between a previously generated plan and the current state of the world. We conducted several experiments using ToMCAT in a simulated cooking domain. Our results highlight the importance of the dynamic replanning mechanism in reducing the usage of resources without sacrificing team performance. We also show that recent observations about the world and teammates' behavior collected by an agent over the course of an episode combined with ToM inferences are crucial to generate team-aware plans for dynamic adaptation to teammates, especially when no prior information is provided about them.
- Abstract(参考訳): 本稿では,ToM条件のトラジェクトリを生成するための新しいフレームワークであるToMCAT(Theory-of-Mind for Cooperative Agents in Teams)を提案する。
メタラーニングメカニズムは、ToMがチームメイトの基本的な目標と将来の振る舞いを推論する仕組みと、ToMによって計算されるように、エージェントの目標とチームメイトの特徴の両方に基づいて、エージェントとそのチームメイトのための計画を生成するマルチエージェント・デノナイジング・ディフュージョンモデルを組み合わせる。
我々は,以前生成された計画と現在の世界の状況との相違を検出する際に,拡散モデルから新しい軌跡(計画)を動的にサンプリングするオンライン計画システムを実装した。
模擬調理領域におけるToMCATを用いた実験を行った。
結果から,チームパフォーマンスを犠牲にすることなく,リソース使用量を削減するための動的リプランニング機構の重要性を強調した。
ToM推論と組み合わせることで,チームメイトへの動的適応のためのチームアウェアプランを生成する上で,特に事前情報が提供されていない場合に,エージェントが収集した世界とチームメイトの行動に関する最近の知見が重要であることも示している。
関連論文リスト
- Towards Collaborative Intelligence: Propagating Intentions and Reasoning for Multi-Agent Coordination with Large Language Models [41.95288786980204]
現在のエージェントフレームワークは、シングルエージェント実行への依存に悩まされ、モジュール間通信が堅牢でないことが多い。
協調的なMARLにおける協調行動を可能にするための協調エージェントとして,大規模言語モデルを訓練するためのフレームワークを提案する。
伝搬ネットワークは、放送意図をチームメイト固有のコミュニケーションメッセージに変換し、指定されたチームメイトと関連する目標を共有する。
論文 参考訳(メタデータ) (2024-07-17T13:14:00Z) - Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.52387511006586]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。
HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。
HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文 参考訳(メタデータ) (2024-06-12T08:48:06Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。
分散ポリシと集中型コントローラの両方として機能する。
実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - Deep Interactive Motion Prediction and Planning: Playing Games with
Motion Prediction Models [162.21629604674388]
本研究は,新しい対話型マルチエージェントニューラルネットワークポリシを予測モデルの一部として使用するゲーム理論モデル予測制御器(MPC)を提案する。
本手法の成功の基礎は,周辺エージェントの状態と地図情報に基づいて車両を操縦できる,新しいマルチエージェントポリシーネットワークの設計である。
論文 参考訳(メタデータ) (2022-04-05T17:58:18Z) - Emergence of Theory of Mind Collaboration in Multiagent Systems [65.97255691640561]
ToMとエージェント間の効果的な協調を開発するための適応的学習アルゴリズムを提案する。
アルゴリズムはToMをモデル化せずに従来の分散実行アルゴリズムを全て上回る2つのゲームで評価する。
論文 参考訳(メタデータ) (2021-09-30T23:28:00Z) - BGC: Multi-Agent Group Belief with Graph Clustering [1.9949730506194252]
エージェントがコミュニケーションなしで情報を交換できる半通信方式を提案する。
近接するエージェントを小さなグループに分割し,グループ内のエージェントの信念を最小化するグループベースのモジュールを提案する。
その結果,提案手法はSMACベンチマークの大幅な改善を実現していることがわかった。
論文 参考訳(メタデータ) (2020-08-20T07:07:20Z) - Model-based Reinforcement Learning for Decentralized Multiagent
Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。
分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文 参考訳(メタデータ) (2020-03-15T19:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。