論文の概要: Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism
- arxiv url: http://arxiv.org/abs/2007.02515v1
- Date: Mon, 6 Jul 2020 03:48:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 01:06:43.486737
- Title: Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism
- Title(参考訳): 社会的畳み込みと注意機構を用いた交通エージェント軌道予測
- Authors: Tao Yang, Zhixiong Nan, He Zhang, Shitao Chen and Nanning Zheng
- Abstract要約: 本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
- 参考スコア(独自算出の注目度): 57.68557165836806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The trajectory prediction is significant for the decision-making of
autonomous driving vehicles. In this paper, we propose a model to predict the
trajectories of target agents around an autonomous vehicle. The main idea of
our method is considering the history trajectories of the target agent and the
influence of surrounding agents on the target agent. To this end, we encode the
target agent history trajectories as an attention mask and construct a social
map to encode the interactive relationship between the target agent and its
surrounding agents. Given a trajectory sequence, the LSTM networks are firstly
utilized to extract the features for all agents, based on which the attention
mask and social map are formed. Then, the attention mask and social map are
fused to get the fusion feature map, which is processed by the social
convolution to obtain a fusion feature representation. Finally, this fusion
feature is taken as the input of a variable-length LSTM to predict the
trajectory of the target agent. We note that the variable-length LSTM enables
our model to handle the case that the number of agents in the sensing scope is
highly dynamic in traffic scenes. To verify the effectiveness of our method, we
widely compare with several methods on a public dataset, achieving a 20% error
decrease. In addition, the model satisfies the real-time requirement with the
32 fps.
- Abstract(参考訳): 軌道予測は自動運転車の意思決定に重要である。
本稿では,自律走行車周辺におけるターゲットエージェントの軌道予測モデルを提案する。
本手法の主な考え方は,対象エージェントの履歴軌跡と周辺エージェントが対象エージェントに与える影響を検討することである。
この目的のために,対象エージェント履歴軌跡を注意マスクとしてエンコードし,対象エージェントとその周辺エージェントとの相互作用関係をエンコードするソーシャルマップを構築する。
トラジェクトリシーケンスが与えられると、まずLSTMネットワークを使用して、注目マスクとソーシャルマップが形成されるすべてのエージェントの特徴を抽出する。
そして、注目マスクとソーシャルマップとを融合させて融合特徴マップを取得し、社会畳み込みによって処理され、融合特徴表現を得る。
最後に、この融合特徴を可変長LSTMの入力として、対象エージェントの軌道を予測する。
可変長LSTMにより,センサ範囲内のエージェント数が交通シーンにおいて非常に動的である場合の処理が可能となることに留意する。
提案手法の有効性を検証するため,公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
さらに、モデルは32fpsでリアルタイム要求を満たす。
関連論文リスト
- Spatial and social situation-aware transformer-based trajectory prediction of autonomous systems [2.498836880652668]
エージェントの振る舞いを所定の状況で予測するには、時間内に適切に反応する必要がある。
近年,深層学習に基づくモデルが動き予測の主流となっている。
より長い予測地平線の場合、予測軌道の地平線からの偏差は、空間的・社会的に非依存なモデルに比べて低い。
論文 参考訳(メタデータ) (2024-06-04T20:36:16Z) - SocialFormer: Social Interaction Modeling with Edge-enhanced Heterogeneous Graph Transformers for Trajectory Prediction [3.733790302392792]
SocialFormerはエージェント間相互作用を意識した軌道予測手法である。
本稿では,エージェント動作の時間的社会的挙動をモデル化するために,ゲートリカレント単位(GRU)に基づくテンポラルエンコーダを提案する。
一般的なnuScenesベンチマークの軌道予測タスクとしてSocialFormerを評価し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-05-06T19:47:23Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - JRDB-Traj: A Dataset and Benchmark for Trajectory Forecasting in Crowds [79.00975648564483]
ロボット工学、自動運転車、ナビゲーションなどの分野で使用される軌道予測モデルは、現実のシナリオにおいて課題に直面している。
このデータセットは、ロボットの観点から、すべてのエージェント、シーンイメージ、ポイントクラウドの位置を含む包括的なデータを提供する。
本研究の目的は,ロボットに対するエージェントの将来の位置を,生の感覚入力データを用いて予測することである。
論文 参考訳(メタデータ) (2023-11-05T18:59:31Z) - SIMMF: Semantics-aware Interactive Multiagent Motion Forecasting for
Autonomous Vehicle Driving [2.7195102129095003]
本研究では,意味を空間情報とともに捉えるための意味認識型対話型マルチエージェント動作予測手法を提案する。
具体的には、シーンから関連するエージェントのセマンティック・アウェア・セレクションを実装し、アテンション・メカニズムを通してそれらを渡すことでこれを実現する。
その結果,提案手法は最先端のベースラインより優れており,より正確かつシーン一貫性のある予測が可能であることが示唆された。
論文 参考訳(メタデータ) (2023-06-26T17:54:24Z) - Traj-MAE: Masked Autoencoders for Trajectory Prediction [69.7885837428344]
軌道予測は、危険を予測して信頼性の高い自動運転システムを構築する上で重要な課題である。
本稿では,運転環境におけるエージェントの複雑な動作をよりよく表現する,軌道予測のための効率的なマスク付きオートエンコーダを提案する。
複数エージェント設定と単一エージェント設定の両方の実験結果から,Traj-MAEが最先端手法と競合する結果が得られることが示された。
論文 参考訳(メタデータ) (2023-03-12T16:23:27Z) - GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting [121.42898228997538]
精度や一般化を犠牲にすることなく、全てのエージェントとマップに対して効率的な共有符号化を提案する。
不均一空間グラフにおけるエージェントとマップ要素間の幾何学的関係を表現するために、ペアワイズ相対的な位置符号化を利用する。
我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
論文 参考訳(メタデータ) (2022-11-04T16:10:50Z) - Decoder Fusion RNN: Context and Interaction Aware Decoders for
Trajectory Prediction [53.473846742702854]
本稿では,動き予測のための反復的,注意に基づくアプローチを提案する。
Decoder Fusion RNN (DF-RNN) は、リカレント動作エンコーダ、エージェント間マルチヘッドアテンションモジュール、コンテキスト認識デコーダで構成される。
提案手法の有効性をArgoverseモーション予測データセットで検証し,その性能を公開ベンチマークで示す。
論文 参考訳(メタデータ) (2021-08-12T15:53:37Z) - Spatial-Channel Transformer Network for Trajectory Prediction on the
Traffic Scenes [2.7955111755177695]
本稿では,注意機能付き軌道予測のための空間チャネル変換器ネットワークを提案する。
エージェント間の社会的相互作用を測定するために、チャネルワイズモジュールが挿入される。
このネットワークは,交通現場における実世界の軌道予測データセットにおいて,有望な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-01-27T15:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。