論文の概要: Safe and Interpretable Multimodal Path Planning for Multi-Agent Cooperation
- arxiv url: http://arxiv.org/abs/2602.19304v1
- Date: Sun, 22 Feb 2026 18:57:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.574988
- Title: Safe and Interpretable Multimodal Path Planning for Multi-Agent Cooperation
- Title(参考訳): マルチエージェント協調のための安全かつ解釈可能なマルチモーダルパス計画
- Authors: Haojun Shi, Suyu Ye, Katherine M. Guerrerio, Jianzhi Shen, Yifan Yin, Daniel Khashabi, Chien-Ming Huang, Tianmin Shu,
- Abstract要約: 安全かつ解釈可能なマルチモーダルパス計画法CaPE(コード・アズ・パス・エディタ)を提案する。
CaPEは、他のエージェントからの環境と言語通信に基づいて、エージェントのパスプランを生成し、更新する。
CaPEは様々なロボットシステムにプラグイン・アンド・プレイモジュールとして組み込めることを示す。
- 参考スコア(独自算出の注目度): 28.99685727779745
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Successful cooperation among decentralized agents requires each agent to quickly adapt its plan to the behavior of other agents. In scenarios where agents cannot confidently predict one another's intentions and plans, language communication can be crucial for ensuring safety. In this work, we focus on path-level cooperation in which agents must adapt their paths to one another in order to avoid collisions or perform physical collaboration such as joint carrying. In particular, we propose a safe and interpretable multimodal path planning method, CaPE (Code as Path Editor), which generates and updates path plans for an agent based on the environment and language communication from other agents. CaPE leverages a vision-language model (VLM) to synthesize a path editing program verified by a model-based planner, grounding communication to path plan updates in a safe and interpretable way. We evaluate our approach in diverse simulated and real-world scenarios, including multi-robot and human-robot cooperation in autonomous driving, household, and joint carrying tasks. Experimental results demonstrate that CaPE can be integrated into different robotic systems as a plug-and-play module, greatly enhancing a robot's ability to align its plan to language communication from other robots or humans. We also show that the combination of the VLM-based path editing program synthesis and model-based planning safety enables robots to achieve open-ended cooperation while maintaining safety and interpretability.
- Abstract(参考訳): 分散エージェント間の協力が成功するには、各エージェントは、その計画を他のエージェントの行動に迅速に適応させる必要がある。
エージェントが互いの意図や計画を自信を持って予測できないシナリオでは、安全を確保するために言語コミュニケーションが不可欠である。
本研究では, 衝突を避けたり, 関節搬送などの物理的協力を行うために, エージェント同士の経路を調整しなければならない経路レベルの協調に焦点を当てた。
特に,安全かつ解釈可能なマルチモーダルパス計画手法であるCaPE(コード・アズ・パス・エディタ)を提案する。
CaPEはヴィジュアル言語モデル(VLM)を利用して、モデルベースのプランナーによって検証されたパス編集プログラムを合成し、安全かつ解釈可能な方法でパス計画更新への通信を基盤とする。
我々は, 自律運転, 家庭, 共同運送作業におけるマルチロボットと人間ロボットの協調を含む, 多様なシミュレーションおよび実世界のシナリオにおけるアプローチを評価した。
実験の結果、CaPEは様々なロボットシステムにプラグイン・アンド・プレイモジュールとして組み込むことができ、ロボットが他のロボットや人間との言語コミュニケーションに計画を調整する能力を大幅に向上することが示された。
また,VLMを用いた経路編集プログラムの合成とモデルに基づく計画安全性を組み合わせることで,ロボットが安全と解釈性を維持しながらオープンな協調を実現できることを示す。
関連論文リスト
- Communicating Plans, Not Percepts: Scalable Multi-Agent Coordination with Embodied World Models [0.0]
MARL(Multi-Agent Reinforcement Learning)の中心的な疑問は、通信プロトコルを設計するか、エンドツーエンドで学習するかである。
本稿では,協調的なタスク割り当て問題に対する2つのコミュニケーション戦略を提案し,比較する。
我々の実験によると、創発的コミュニケーションは単純な設定で実現可能であるが、設計された世界モデルベースのアプローチは、複雑さが増大するにつれて、優れたパフォーマンス、サンプル効率、スケーラビリティを示す。
論文 参考訳(メタデータ) (2025-08-04T21:29:07Z) - Agentic Web: Weaving the Next Web with AI Agents [109.13815627467514]
大規模言語モデル(LLM)を活用したAIエージェントの出現は、エージェントWebに対する重要な転換点である。
このパラダイムでは、エージェントが直接対話して、ユーザに代わって複雑なタスクを計画、コーディネート、実行します。
本稿では,エージェントWebの理解と構築のための構造化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-28T17:58:12Z) - Cooperative and Asynchronous Transformer-based Mission Planning for Heterogeneous Teams of Mobile Robots [1.1049608786515839]
エージェント間の分散意思決定を協調するための協調型非同期トランスフォーマーベースミッションプランニング(CATMiP)フレームワークを提案する。
我々は,CATMiPを2次元グリッドワールドシミュレーション環境で評価し,その性能を計画に基づく探索法と比較した。
論文 参考訳(メタデータ) (2024-10-08T21:14:09Z) - Unified Human-Scene Interaction via Prompted Chain-of-Contacts [61.87652569413429]
HSI(Human-Scene Interaction)は、AIや仮想現実といった分野において重要なコンポーネントである。
本稿では,言語コマンドによる多様なインタラクションの統一制御を支援する統一型HSIフレームワークUniHSIを提案する。
論文 参考訳(メタデータ) (2023-09-14T17:59:49Z) - RoCo: Dialectic Multi-Robot Collaboration with Large Language Models [13.260289557301688]
我々は,事前学習された大規模言語モデル(LLM)のパワーを利用する,マルチロボット協調のための新しいアプローチを提案する。
そこで,RoCoはロボットエージェントとコミュニケーションし,協調してタスクを完了させることができる。
論文 参考訳(メタデータ) (2023-07-10T17:52:01Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - AdverSAR: Adversarial Search and Rescue via Multi-Agent Reinforcement
Learning [4.843554492319537]
本稿では,敵対的エージェント間コミュニケーションの存在下で,ロボットの戦略を効率的に調整するアルゴリズムを提案する。
ロボットは対象の場所について事前の知識を持っておらず、隣接するロボットのサブセットのみといつでも対話できると仮定される。
提案手法の有効性は, グリッドワールド環境のプロトタイプで実証した。
論文 参考訳(メタデータ) (2022-12-20T08:13:29Z) - Deep Interactive Motion Prediction and Planning: Playing Games with
Motion Prediction Models [162.21629604674388]
本研究は,新しい対話型マルチエージェントニューラルネットワークポリシを予測モデルの一部として使用するゲーム理論モデル予測制御器(MPC)を提案する。
本手法の成功の基礎は,周辺エージェントの状態と地図情報に基づいて車両を操縦できる,新しいマルチエージェントポリシーネットワークの設計である。
論文 参考訳(メタデータ) (2022-04-05T17:58:18Z) - Model-based Reinforcement Learning for Decentralized Multiagent
Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。
分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文 参考訳(メタデータ) (2020-03-15T19:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。