論文の概要: ProIn: Learning to Predict Trajectory Based on Progressive Interactions for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2403.16374v1
- Date: Mon, 25 Mar 2024 02:38:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 16:17:05.308451
- Title: ProIn: Learning to Predict Trajectory Based on Progressive Interactions for Autonomous Driving
- Title(参考訳): ProIn: 自律運転のための進行的インタラクションに基づく軌道予測の学習
- Authors: Yinke Dong, Haifeng Yuan, Hongkun Liu, Wei Jing, Fangzhen Li, Hongmin Liu, Bin Fan,
- Abstract要約: プログレッシブ・インタラクション・ネットワークが提案され、エージェントの特徴が関係する地図に徐々に焦点を合わせることができる。
このネットワークは、グラフ畳み込みを通じて、地図制約の複雑な影響をエージェントの特徴に徐々にエンコードする。
実験は、既存の1段階の相互作用に対する進歩的相互作用の優越性を検証した。
- 参考スコア(独自算出の注目度): 11.887346755144485
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate motion prediction of pedestrians, cyclists, and other surrounding vehicles (all called agents) is very important for autonomous driving. Most existing works capture map information through an one-stage interaction with map by vector-based attention, to provide map constraints for social interaction and multi-modal differentiation. However, these methods have to encode all required map rules into the focal agent's feature, so as to retain all possible intentions' paths while at the meantime to adapt to potential social interaction. In this work, a progressive interaction network is proposed to enable the agent's feature to progressively focus on relevant maps, in order to better learn agents' feature representation capturing the relevant map constraints. The network progressively encode the complex influence of map constraints into the agent's feature through graph convolutions at the following three stages: after historical trajectory encoder, after social interaction, and after multi-modal differentiation. In addition, a weight allocation mechanism is proposed for multi-modal training, so that each mode can obtain learning opportunities from a single-mode ground truth. Experiments have validated the superiority of progressive interactions to the existing one-stage interaction, and demonstrate the effectiveness of each component. Encouraging results were obtained in the challenging benchmarks.
- Abstract(参考訳): 歩行者、サイクリスト、その他の周囲の車両(すべてエージェントと呼ばれる)の正確な動き予測は、自動運転にとって非常に重要である。
既存のほとんどの研究は、地図とベクトルに基づく一段階の相互作用を通して地図情報をキャプチャし、社会的相互作用とマルチモーダル微分のための地図制約を提供する。
しかし,これらの手法では,社会的相互作用に適応する一方で,すべての意図の経路を維持するために,必要なマップルールをすべて焦点エージェントの特徴にエンコードする必要がある。
本研究では,エージェントの機能的制約を捉えたエージェントの特徴表現をよりよく学習するため,エージェントの機能的制約を段階的に対象マップに焦点を合わせるために,プログレッシブ・インタラクション・ネットワークを提案する。
ネットワークは、歴史的軌跡エンコーダの後に、社会的相互作用の後に、そしてマルチモーダル微分の後に、グラフ畳み込みによって、地図制約の複雑な影響をエージェントの特徴に徐々にエンコードする。
さらに,マルチモーダルトレーニングにおける重み付け機構を提案し,各モードが単一モードの基底真実から学習機会を得ることができるようにした。
実験は、既存の1段階の相互作用に対する進歩的相互作用の優位性を検証し、各コンポーネントの有効性を実証した。
試行錯誤の結果は, 挑戦的なベンチマークで得られた。
関連論文リスト
- GraphAD: Interaction Scene Graph for End-to-end Autonomous Driving [16.245949174447574]
我々は,エゴ車両,道路エージェント,地図要素間の相互作用をモデル化するための統合手法として,インタラクションシーングラフ(ISG)を提案する。
提案手法をnuScenesデータセット上で評価した。
論文 参考訳(メタデータ) (2024-03-28T02:22:28Z) - Heterogeneous Graph-based Trajectory Prediction using Local Map Context
and Social Interactions [47.091620047301305]
本稿では,3つの重要な情報源を活用することにより,欠点に対処するベクトルベース軌道予測手法を提案する。
まず,その関係の性質と重要な特徴を考慮に入れたセマンティックシーングラフを用いて,トラフィックエージェント間のインタラクションをモデル化する。
第2に,ローカルマップコンテキストをモデル化するために,エージェント中心の画像中心マップの特徴を抽出する。
論文 参考訳(メタデータ) (2023-11-30T13:46:05Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - SSAGCN: Social Soft Attention Graph Convolution Network for Pedestrian
Trajectory Prediction [59.064925464991056]
ソーシャルソフトアテンショングラフ畳み込みネットワーク(SSAGCN)という新しい予測モデルを提案する。
SSAGCNは、歩行者間の社会的相互作用と歩行者と環境間のシーンインタラクションを同時に扱うことを目的としている。
公開データセットの実験は、SAGCNの有効性を証明し、最先端の結果を得た。
論文 参考訳(メタデータ) (2021-12-05T01:49:18Z) - Decoder Fusion RNN: Context and Interaction Aware Decoders for
Trajectory Prediction [53.473846742702854]
本稿では,動き予測のための反復的,注意に基づくアプローチを提案する。
Decoder Fusion RNN (DF-RNN) は、リカレント動作エンコーダ、エージェント間マルチヘッドアテンションモジュール、コンテキスト認識デコーダで構成される。
提案手法の有効性をArgoverseモーション予測データセットで検証し,その性能を公開ベンチマークで示す。
論文 参考訳(メタデータ) (2021-08-12T15:53:37Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - Multi-modal Trajectory Prediction for Autonomous Driving with Semantic
Map and Dynamic Graph Attention Network [12.791191495432829]
現実の交通シナリオにおける軌道予測にはいくつかの課題がある。
目的や周囲に注意を払って交通をナビゲートする人々の自然な習慣に触発された本論文は,ユニークなグラフ注意ネットワークを示す。
ネットワークはエージェント間の動的社会的相互作用をモデル化し、セマンティックマップでトラフィックルールに適合するように設計されている。
論文 参考訳(メタデータ) (2021-03-30T11:53:12Z) - Pedestrian Behavior Prediction via Multitask Learning and Categorical
Interaction Modeling [13.936894582450734]
マルチモーダルデータに頼って歩行者の軌跡や行動を同時に予測するマルチタスク学習フレームワークを提案する。
本モデルでは, トラジェクティブと動作予測を最大22%, 6%向上させる。
論文 参考訳(メタデータ) (2020-12-06T15:57:11Z) - Interaction-Based Trajectory Prediction Over a Hybrid Traffic Graph [4.574413934477815]
本稿では,トラフィックアクタと静的および動的トラフィック要素の両方をノードが表現するハイブリッドグラフを提案する。
アクターとトラフィック要素間の時間的相互作用(例えば、停止と移動)の異なるモードは、グラフエッジによって明示的にモデル化される。
提案するモデルであるTrafficGraphNetは,高いレベルの解釈性を維持しつつ,最先端の軌道予測精度を実現する。
論文 参考訳(メタデータ) (2020-09-27T18:20:03Z) - Learning Lane Graph Representations for Motion Forecasting [92.88572392790623]
生の地図データからレーングラフを構築し,地図構造を保存する。
我々は,アクター・トゥ・レーン,レーン・トゥ・レーン,レーン・トゥ・アクター,アクター・トゥ・アクターの4種類のインタラクションからなる融合ネットワークを利用する。
提案手法は,大規模Argoverse運動予測ベンチマークにおいて,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-07-27T17:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。