論文の概要: MATRIX: Multi-Agent Trajectory Generation with Diverse Contexts
- arxiv url: http://arxiv.org/abs/2403.06041v1
- Date: Sat, 9 Mar 2024 23:28:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 09:00:21.870324
- Title: MATRIX: Multi-Agent Trajectory Generation with Diverse Contexts
- Title(参考訳): MATRIX: 多様なコンテキストを持つマルチエージェント軌道生成
- Authors: Zhuo Xu, Rui Zhou, Yida Yin, Huidong Gao, Masayoshi Tomizuka, Jiachen
Li
- Abstract要約: マルチヒューマン・ロボットインタラクションシナリオにおけるトラジェクトリレベルのデータ生成について検討する。
Diverse conteXts(MATRIX)を用いたマルチエージェントTRajectory生成と呼ばれる学習に基づく自動軌道生成モデルを提案する。
- 参考スコア(独自算出の注目度): 47.12378253630105
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data-driven methods have great advantages in modeling complicated human
behavioral dynamics and dealing with many human-robot interaction applications.
However, collecting massive and annotated real-world human datasets has been a
laborious task, especially for highly interactive scenarios. On the other hand,
algorithmic data generation methods are usually limited by their model
capacities, making them unable to offer realistic and diverse data needed by
various application users. In this work, we study trajectory-level data
generation for multi-human or human-robot interaction scenarios and propose a
learning-based automatic trajectory generation model, which we call Multi-Agent
TRajectory generation with dIverse conteXts (MATRIX). MATRIX is capable of
generating interactive human behaviors in realistic diverse contexts. We
achieve this goal by modeling the explicit and interpretable objectives so that
MATRIX can generate human motions based on diverse destinations and
heterogeneous behaviors. We carried out extensive comparison and ablation
studies to illustrate the effectiveness of our approach across various metrics.
We also presented experiments that demonstrate the capability of MATRIX to
serve as data augmentation for imitation-based motion planning.
- Abstract(参考訳): データ駆動手法は複雑な人間の行動力学をモデル化し、多くの人間とロボットの相互作用アプリケーションを扱う点で大きな利点がある。
しかし、特に高度にインタラクティブなシナリオでは、大規模な、注釈付きの現実世界の人間データセットの収集は大変な作業でした。
一方、アルゴリズムによるデータ生成手法は通常、そのモデル能力によって制限され、様々なアプリケーションユーザが必要とするリアルで多様なデータを提供することができない。
本研究では,マルチヒューマン・ロボットインタラクションシナリオにおけるトラジェクトリレベルのデータ生成について検討し,dIverse conteXts (MATRIX) を用いたマルチエージェントTRajectory生成と呼ばれる学習に基づく自動トラジェクトリ生成モデルを提案する。
MATRIXは、現実的な多様な文脈で対話的な人間の行動を生成することができる。
この目標を明示的かつ解釈可能な目的をモデル化することにより達成し、マトリックスは多様な目的地や不均一な振る舞いに基づいて人間の動きを生成することができる。
我々は,様々な測定値にまたがるアプローチの有効性を説明するため,広範囲な比較・アブレーション研究を行った。
また、模倣に基づく動き計画のためのデータ拡張として、MATRIXの能力を示す実験を行った。
関連論文リスト
- COLLAGE: Collaborative Human-Agent Interaction Generation using Hierarchical Latent Diffusion and Language Models [14.130327598928778]
大規模言語モデル (LLMs) と階層型運動固有ベクトル量子化変分オートエンコーダ (VQ-VAEs) を提案する。
我々のフレームワークは、現実的で多様な協調的な人間-オブジェクト-ヒューマンインタラクションを生成し、最先端の手法より優れています。
我々の研究は、ロボット工学、グラフィックス、コンピュータビジョンなど、様々な領域における複雑な相互作用をモデリングする新たな可能性を開く。
論文 参考訳(メタデータ) (2024-09-30T17:02:13Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Large Language Models as Zero-Shot Human Models for Human-Robot Interaction [12.455647753787442]
大型言語モデル(LLM)は、人間とロボットの相互作用のためのゼロショット人間モデルとして機能する。
LLMは目的のモデルに匹敵する性能を達成する。
シミュレーションされた信頼に基づくテーブルクリーニングタスクのケーススタディを提案する。
論文 参考訳(メタデータ) (2023-03-06T23:16:24Z) - MILD: Multimodal Interactive Latent Dynamics for Learning Human-Robot
Interaction [34.978017200500005]
我々は,HRI(Human-Robot Interactions)の問題に対処するために,MILD(Multimodal Interactive Latent Dynamics)を提案する。
変分オートエンコーダ(VAE)の潜時空間における相互作用エージェントの結合分布をモデル化するために,Hidden Semi-Markov Models (HSMMs) を用いて実演から相互作用ダイナミクスを学習する。
MILDは、観察されたエージェント(人間の)軌道に条件付けされたときに、制御されたエージェント(ロボット)に対してより正確な軌道を生成する。
論文 参考訳(メタデータ) (2022-10-22T11:25:11Z) - DIME: Fine-grained Interpretations of Multimodal Models via Disentangled
Local Explanations [119.1953397679783]
我々は,マルチモーダルモデルの解釈における最先端化に注力する。
提案手法であるDIMEは,マルチモーダルモデルの高精度かつきめ細かな解析を可能にする。
論文 参考訳(メタデータ) (2022-03-03T20:52:47Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Multimodal Deep Generative Models for Trajectory Prediction: A
Conditional Variational Autoencoder Approach [34.70843462687529]
本研究では,人間の行動予測に対する条件付き変分オートエンコーダアプローチに関する自己完結型チュートリアルを提供する。
本チュートリアルの目的は,人間の行動予測における最先端の手法の分類をレビューし,構築することである。
論文 参考訳(メタデータ) (2020-08-10T03:18:27Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z) - Learning Predictive Models From Observation and Interaction [137.77887825854768]
世界との相互作用から予測モデルを学ぶことで、ロボットのようなエージェントが世界がどのように働くかを学ぶことができる。
しかし、複雑なスキルのダイナミクスを捉えるモデルを学ぶことは大きな課題である。
本研究では,人間などの他のエージェントの観察データを用いて,トレーニングセットを増強する手法を提案する。
論文 参考訳(メタデータ) (2019-12-30T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。