論文の概要: Decoder Fusion RNN: Context and Interaction Aware Decoders for
Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2108.05814v1
- Date: Thu, 12 Aug 2021 15:53:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-13 14:22:17.830752
- Title: Decoder Fusion RNN: Context and Interaction Aware Decoders for
Trajectory Prediction
- Title(参考訳): デコーダフュージョンRNN:軌道予測のためのデコーダのコンテキストとインタラクション
- Authors: Edoardo Mello Rella (1), Jan-Nico Zaech (1), Alexander Liniger (1),
Luc Van Gool (1 and 2) ((1) Computer Vision Lab, ETH Z\"uurich (2) PSI, KU
Leuven)
- Abstract要約: 本稿では,動き予測のための反復的,注意に基づくアプローチを提案する。
Decoder Fusion RNN (DF-RNN) は、リカレント動作エンコーダ、エージェント間マルチヘッドアテンションモジュール、コンテキスト認識デコーダで構成される。
提案手法の有効性をArgoverseモーション予測データセットで検証し,その性能を公開ベンチマークで示す。
- 参考スコア(独自算出の注目度): 53.473846742702854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Forecasting the future behavior of all traffic agents in the vicinity is a
key task to achieve safe and reliable autonomous driving systems. It is a
challenging problem as agents adjust their behavior depending on their
intentions, the others' actions, and the road layout. In this paper, we propose
Decoder Fusion RNN (DF-RNN), a recurrent, attention-based approach for motion
forecasting. Our network is composed of a recurrent behavior encoder, an
inter-agent multi-headed attention module, and a context-aware decoder. We
design a map encoder that embeds polyline segments, combines them to create a
graph structure, and merges their relevant parts with the agents' embeddings.
We fuse the encoded map information with further inter-agent interactions only
inside the decoder and propose to use explicit training as a method to
effectively utilize the information available. We demonstrate the efficacy of
our method by testing it on the Argoverse motion forecasting dataset and show
its state-of-the-art performance on the public benchmark.
- Abstract(参考訳): 周囲の交通機関の将来の行動を予測することは、安全で信頼性の高い自動運転システムを実現するための重要な課題である。
エージェントは、意図、他者の行動、および道路レイアウトに応じて行動を調整するため、難しい問題である。
本稿では,動き予測のための繰り返し注意に基づくアプローチであるDecoder Fusion RNN (DF-RNN)を提案する。
我々のネットワークは、繰り返し振舞いエンコーダ、エージェント間マルチヘッドアテンションモジュール、コンテキスト認識デコーダで構成されている。
ポリラインセグメントを埋め込み、グラフ構造を作成するためにそれらを結合し、それらの関連部分とエージェントの埋め込みをマージするマップエンコーダを設計する。
符号化された地図情報をデコーダ内でのみ、さらにエージェント間相互作用で融合し、利用可能な情報を効果的に活用する方法として明示的なトレーニングを提案する。
本手法の有効性をargoverse motion forecasting dataset上で検証し,その最新性能を公開ベンチマークで示す。
関連論文リスト
- SocialFormer: Social Interaction Modeling with Edge-enhanced Heterogeneous Graph Transformers for Trajectory Prediction [3.733790302392792]
SocialFormerはエージェント間相互作用を意識した軌道予測手法である。
本稿では,エージェント動作の時間的社会的挙動をモデル化するために,ゲートリカレント単位(GRU)に基づくテンポラルエンコーダを提案する。
一般的なnuScenesベンチマークの軌道予測タスクとしてSocialFormerを評価し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-05-06T19:47:23Z) - Real-Time Motion Prediction via Heterogeneous Polyline Transformer with
Relative Pose Encoding [121.08841110022607]
既存のエージェント中心の手法は、公開ベンチマークで顕著な性能を示した。
K-nearest neighbor attention with relative pose encoding (KNARPE) は、トランスフォーマーがペアワイズ相対表現を使用できる新しいアテンション機構である。
エージェント間でコンテキストを共有し、変化しないコンテキストを再利用することで、私たちのアプローチはシーン中心のメソッドと同じくらい効率的になり、最先端のエージェント中心のメソッドと同等に実行されます。
論文 参考訳(メタデータ) (2023-10-19T17:59:01Z) - Fusion-GRU: A Deep Learning Model for Future Bounding Box Prediction of
Traffic Agents in Risky Driving Videos [20.923004256768635]
Fusion-Gated Recurrent Unit (Fusion-GRU)は、将来のバウンディングボックスローカライゼーションのための新しいエンコーダデコーダアーキテクチャである。
提案手法は, ROL と HEV-I の2つの公開データセットを用いて評価する。
論文 参考訳(メタデータ) (2023-08-12T18:35:59Z) - SIMMF: Semantics-aware Interactive Multiagent Motion Forecasting for
Autonomous Vehicle Driving [2.7195102129095003]
本研究では,意味を空間情報とともに捉えるための意味認識型対話型マルチエージェント動作予測手法を提案する。
具体的には、シーンから関連するエージェントのセマンティック・アウェア・セレクションを実装し、アテンション・メカニズムを通してそれらを渡すことでこれを実現する。
その結果,提案手法は最先端のベースラインより優れており,より正確かつシーン一貫性のある予測が可能であることが示唆された。
論文 参考訳(メタデータ) (2023-06-26T17:54:24Z) - GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting [121.42898228997538]
精度や一般化を犠牲にすることなく、全てのエージェントとマップに対して効率的な共有符号化を提案する。
不均一空間グラフにおけるエージェントとマップ要素間の幾何学的関係を表現するために、ペアワイズ相対的な位置符号化を利用する。
我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
論文 参考訳(メタデータ) (2022-11-04T16:10:50Z) - LaneRCNN: Distributed Representations for Graph-Centric Motion
Forecasting [104.8466438967385]
LaneRCNNはグラフ中心のモーション予測モデルです。
アクターごとのローカルレーングラフ表現を学び、過去の動きとローカルマップのトポロジをエンコードします。
我々はレーングラフに基づいて出力軌跡をパラメータ化し,よりアメニブルな予測パラメータ化を行う。
論文 参考訳(メタデータ) (2021-01-17T11:54:49Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z) - VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized
Representation [74.56282712099274]
本稿では,ベクトルで表される個々の道路成分の空間的局所性を利用する階層型グラフニューラルネットワークであるVectorNetを紹介する。
ベクトル化高定義(HD)マップとエージェントトラジェクトリの操作により、ロッキーなレンダリングや計算集約的なConvNetエンコーディングのステップを避けることができる。
我々は、社内行動予測ベンチマークと最近リリースされたArgoverse予測データセットでVectorNetを評価した。
論文 参考訳(メタデータ) (2020-05-08T19:07:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。