論文の概要: Latent Variable Nested Set Transformers & AutoBots
- arxiv url: http://arxiv.org/abs/2104.00563v1
- Date: Fri, 19 Feb 2021 18:53:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 10:43:57.168563
- Title: Latent Variable Nested Set Transformers & AutoBots
- Title(参考訳): 潜在可変ネスト型変圧器とオートボット
- Authors: Roger Girgis, Florian Golemo, Felipe Codevilla, Jim Aldon D'Souza,
Samira Ebrahimi Kahou, Felix Heide, Christopher Pal
- Abstract要約: ネスト集合の自己回帰的モデリングシーケンスに基づくこの問題設定のための理論的枠組みを提案する。
集合の要素間の社会的関心の形式として機能する集合の集合に対して、マルチヘッドの自己アテンションブロックを採用する新しいモデルアーキテクチャを提示する。
我々は、シーン内の複数のエージェントのキー属性のシーケンシャルな観察に基づいて、エゴエージェントの軌道をモデル化する、自律運転設定のためのNested Set Transformer("AutoBot")を検証する。
- 参考スコア(独自算出の注目度): 25.194344543085005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans have the innate ability to attend to the most relevant actors in their
vicinity and can forecast how they may behave in the future. This ability will
be crucial for the deployment of safety-critical agents such as robots or
vehicles which interact with humans. We propose a theoretical framework for
this problem setting based on autoregressively modelling sequences of nested
sets, using latent variables to better capture multimodal distributions over
future sets of sets. We present a new model architecture which we call a Nested
Set Transformer which employs multi-head self-attention blocks over sets of
sets that serve as a form of social attention between the elements of the sets
at every timestep. Our approach can produce a distribution over future
trajectories for all agents under consideration, or focus upon the trajectory
of an ego-agent. We validate the Nested Set Transformer for autonomous driving
settings which we refer to as ("AutoBot"), where we model the trajectory of an
ego-agent based on the sequential observations of key attributes of multiple
agents in a scene. AutoBot produces results better than state-of-the-art
published prior work on the challenging nuScenes vehicle trajectory modeling
benchmark. We also examine the multi-agent prediction version of our model and
jointly forecast an ego-agent's future trajectory along with the other agents
in the scene. We validate the behavior of our proposed Nested Set Transformer
for scene level forecasting with a pedestrian trajectory dataset.
- Abstract(参考訳): 人間は、周囲の最も関係のある俳優に自然に出席できる能力を持ち、将来どのように振る舞うかを予測することができる。
この能力は、人間と対話するロボットや車両のような安全に重要なエージェントの配備に不可欠である。
本研究では, ネスト集合の自己回帰モデルに基づくこの問題設定のための理論的枠組みを提案し, 潜在変数を用いて, 将来の集合集合上のマルチモーダル分布をよりよく把握する。
本稿では,各時間ステップにおける集合の要素間の社会的注意の形式として機能する集合の集合に対して,マルチヘッドセルフアテンションブロックを用いたネステッド集合トランスフォーマと呼ばれる新しいモデルアーキテクチャを提案する。
提案手法は,すべてのエージェントに対する将来の軌道上の分布を考慮に入れたり,エゴエージェントの軌道に着目したりすることができる。
我々は、シーン内の複数のエージェントのキー属性のシーケンシャルな観察に基づいて、エゴエージェントの軌道をモデル化する、自律運転設定のためのNested Set Transformer("AutoBot")を検証する。
autobotは、難解なnuscenes vehicle tracking modeling benchmarkの先行研究よりも優れた結果を生み出す。
また, 本モデルのマルチエージェント予測版を調査し, シーン内の他のエージェントと共同でエゴエージェントの将来の軌道を予測した。
歩行者軌道データを用いたシーンレベルの予測のためのNested Set Transformerの挙動を検証する。
関連論文リスト
- Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - JRDB-Traj: A Dataset and Benchmark for Trajectory Forecasting in Crowds [79.00975648564483]
ロボット工学、自動運転車、ナビゲーションなどの分野で使用される軌道予測モデルは、現実のシナリオにおいて課題に直面している。
このデータセットは、ロボットの観点から、すべてのエージェント、シーンイメージ、ポイントクラウドの位置を含む包括的なデータを提供する。
本研究の目的は,ロボットに対するエージェントの将来の位置を,生の感覚入力データを用いて予測することである。
論文 参考訳(メタデータ) (2023-11-05T18:59:31Z) - Robot Learning with Sensorimotor Pre-training [98.7755895548928]
ロボット工学のための自己教師型感覚運動器事前学習手法を提案する。
我々のモデルはRTTと呼ばれ、センサモレータトークンのシーケンスで動作するトランスフォーマーである。
感覚運動の事前学習は、ゼロからトレーニングを一貫して上回り、優れたスケーリング特性を持ち、さまざまなタスク、環境、ロボット間での移動を可能にしている。
論文 参考訳(メタデータ) (2023-06-16T17:58:10Z) - Scene Transformer: A unified multi-task model for behavior prediction
and planning [42.758178896204036]
実世界の運転環境における全てのエージェントの行動予測モデルを定式化する。
近年の言語モデリングアプローチにインスパイアされた我々は、マスキング戦略をモデルに対するクエリとして使用しています。
我々は,行動予測のための自律走行データセットに対するアプローチを評価し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-06-15T20:20:44Z) - Time-series Imputation of Temporally-occluded Multiagent Trajectories [18.862173210927658]
エージェントのサブセットの過去と将来の観測が、他のエージェントの欠落した観察を推定するために使用される、マルチエージェントの時系列計算の問題について検討する。
グラフインプタ(Graph Imputer)と呼ばれる我々の手法は,グラフネットワークと変分オートエンコーダを組み合わせた前方情報と後方情報を利用する。
提案手法は,プロジェクティブカメラモジュールを用いて,オフスクリーンプレーヤの状態推定設定のためのモデルをトレーニングし,評価する。
論文 参考訳(メタデータ) (2021-06-08T09:58:43Z) - Future Frame Prediction for Robot-assisted Surgery [57.18185972461453]
本稿では,ロボット手術用ビデオシーケンスにおけるフレーム予測のためのtpg-vaeモデルを提案する。
コンテンツ配信に加えて、私たちのモデルは、手術ツールの小さな動きを処理するために斬新な運動分布を学習します。
論文 参考訳(メタデータ) (2021-03-18T15:12:06Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z) - Trajectory Prediction for Autonomous Driving based on Multi-Head
Attention with Joint Agent-Map Representation [8.203012391711932]
エージェントの将来の軌跡は、エージェントの位置と過去の動きと静的なシーン構造という2つの重要な手がかりを用いて推測することができる。
本稿では,静的シーンと周辺エージェントの同時表現を考慮したマルチヘッドアテンション手法を提案する。
提案モデルでは,nuScenes 予測ベンチマークの結果が得られ,シーン構造やエージェント構成に適合した様々な将来の軌跡が生成される。
論文 参考訳(メタデータ) (2020-05-06T00:39:45Z) - Diverse and Admissible Trajectory Forecasting through Multimodal Context
Understanding [46.52703817997932]
自律走行におけるマルチエージェント軌道予測には、周囲の車両や歩行者の挙動を正確に予測するエージェントが必要である。
マルチモーダル世界から複数の入力信号を合成するモデルを提案する。
従来の最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-03-06T13:59:39Z) - Trajectron++: Dynamically-Feasible Trajectory Forecasting With
Heterogeneous Data [37.176411554794214]
人間の動きに関する推論は、安全で社会的に認識されたロボットナビゲーションにとって重要な前提条件である。
我々は,多種多様なエージェントの軌道を予測できるモジュール型グラフ構造化リカレントモデルであるTrajectron++を提案する。
実世界の軌道予測データセットにおいて,その性能を実証する。
論文 参考訳(メタデータ) (2020-01-09T16:47:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。