論文の概要: Predicting Pedestrian Crossing Intention with Feature Fusion and
Spatio-Temporal Attention
- arxiv url: http://arxiv.org/abs/2104.05485v1
- Date: Mon, 12 Apr 2021 14:10:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:04:44.385642
- Title: Predicting Pedestrian Crossing Intention with Feature Fusion and
Spatio-Temporal Attention
- Title(参考訳): 機能融合と時空間的注意による歩行者交差注意の予測
- Authors: Dongfang Yang, Haolin Zhang, Ekim Yurtsever, Keith Redmill, \"Umit
\"Ozg\"uner
- Abstract要約: 歩行者の交差の意図は都市運転のためにリアルタイムで認識されるべきです。
最近の研究は、このタスクに視覚ベースのディープニューラルネットワークモデルを使用することの可能性を示している。
本研究は,歩行者横断意図予測において,本質的に異なる時間的特徴を融合するニューラルネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting vulnerable road user behavior is an essential prerequisite for
deploying Automated Driving Systems (ADS) in the real-world. Pedestrian
crossing intention should be recognized in real-time, especially for urban
driving. Recent works have shown the potential of using vision-based deep
neural network models for this task. However, these models are not robust and
certain issues still need to be resolved. First, the global spatio-temproal
context that accounts for the interaction between the target pedestrian and the
scene has not been properly utilized. Second, the optimum strategy for fusing
different sensor data has not been thoroughly investigated. This work addresses
the above limitations by introducing a novel neural network architecture to
fuse inherently different spatio-temporal features for pedestrian crossing
intention prediction. We fuse different phenomena such as sequences of RGB
imagery, semantic segmentation masks, and ego-vehicle speed in an optimum way
using attention mechanisms and a stack of recurrent neural networks. The
optimum architecture was obtained through exhaustive ablation and comparison
studies. Extensive comparative experiments on the JAAD pedestrian action
prediction benchmark demonstrate the effectiveness of the proposed method,
where state-of-the-art performance was achieved. Our code is open-source and
publicly available.
- Abstract(参考訳): 脆弱な道路利用者の行動を予測することは、ADS(Automated Driving Systems)を現実世界に展開するための必須条件である。
歩行者の横断意図は、特に都市交通においてリアルタイムで認識されるべきである。
最近の研究は、このタスクに視覚ベースのディープニューラルネットワークモデルを使用することの可能性を示している。
しかし、これらのモデルは堅牢ではなく、解決すべき問題がまだある。
第1に、対象歩行者とシーンとの相互作用を考慮したグローバル時空間コンテキストは、適切に活用されていない。
第2に、異なるセンサデータを利用するための最適戦略を徹底的に検討していない。
この研究は、歩行者横断意図予測のために、本質的に異なる時空間的特徴を融合させる新しいニューラルネットワークアーキテクチャを導入することで、上記の制限に対処する。
我々は,RGB画像のシーケンス,セマンティックセグメンテーションマスク,エゴ車速などの異なる現象を,アテンション機構とリカレントニューラルネットワークのスタックを用いて最適な方法で融合する。
最適構造は排他的アブレーションと比較研究により得られた。
JAAD歩行者行動予測ベンチマークにおける大規模比較実験により,提案手法の有効性が実証された。
私たちのコードはオープンソースで公開されています。
関連論文リスト
- Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Implicit Occupancy Flow Fields for Perception and Prediction in
Self-Driving [68.95178518732965]
自動運転車(SDV)は、周囲を認識でき、他の交通参加者の将来の行動を予測できなければならない。
既存の作業は、検出されたオブジェクトの軌跡が続くオブジェクト検出を実行するか、シーン全体の密度の高い占有とフローグリッドを予測するかのいずれかである。
これは、認識と将来の予測に対する統一されたアプローチを動機付け、単一のニューラルネットワークで時間とともに占有とフローを暗黙的に表現します。
論文 参考訳(メタデータ) (2023-08-02T23:39:24Z) - Learning Pedestrian Actions to Ensure Safe Autonomous Driving [12.440017892152417]
自動運転車は、歩行者の短期的かつ即時的な行動をリアルタイムで予測する能力を持つことが重要である。
本研究では,歩行者行動と軌跡予測のために,トランスフォーマーエンコーダデコーダ (TF-ed) アーキテクチャを用いた新しいマルチタスクシーケンスを提案する。
提案手法は,既存のLSTMエンコーダデコーダ (LSTM-ed) アーキテクチャを用いて動作と軌道予測を行う。
論文 参考訳(メタデータ) (2023-05-22T14:03:38Z) - Pedestrian Trajectory Prediction via Spatial Interaction Transformer
Network [7.150832716115448]
交通現場では、来るべき人々と出会うと、歩行者は突然回転したり、すぐに止まることがある。
このような予測不可能な軌道を予測するために、歩行者間の相互作用についての洞察を得ることができる。
本稿では,歩行者軌跡の相関関係を注意機構を用いて学習する空間的相互作用変換器(SIT)を提案する。
論文 参考訳(メタデータ) (2021-12-13T13:08:04Z) - TrouSPI-Net: Spatio-temporal attention on parallel atrous convolutions
and U-GRUs for skeletal pedestrian crossing prediction [1.911678487931003]
本研究では,歩行者の骨格の動態を二元交差意図にリンクさせることにより,都市交通環境における歩行者横断予測に対処する。
コンテクストフリーで軽量で軽量な予測器であるTrouSPI-Netを紹介する。
我々は、TrouSPI-Netを評価し、その性能を解析する。
論文 参考訳(メタデータ) (2021-09-02T13:54:02Z) - SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory
Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。
具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。
可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:17:42Z) - Spatio-Temporal Look-Ahead Trajectory Prediction using Memory Neural
Network [6.065344547161387]
本論文では,記憶神経ネットワークと呼ばれる新しい繰り返しニューラルネットワークを用いて,時空間的視線軌道予測の問題を解くことを試みる。
提案手法は計算量が少なく,LSTMやGRUを用いた他のディープラーニングモデルと比較すると,単純なアーキテクチャである。
論文 参考訳(メタデータ) (2021-02-24T05:02:19Z) - IntentNet: Learning to Predict Intention from Raw Sensor Data [86.74403297781039]
本論文では,LiDARセンサが生成する3次元点群と,環境の動的なマップの両方を利用するワンステージ検出器と予測器を開発した。
当社のマルチタスクモデルは、それぞれの別々のモジュールよりも高い精度を実現し、計算を節約します。
論文 参考訳(メタデータ) (2021-01-20T00:31:52Z) - Pedestrian Action Anticipation using Contextual Feature Fusion in
Stacked RNNs [19.13270454742958]
交差点における歩行者行動予測問題の解法を提案する。
提案手法では,シーン動的・視覚的特徴の両面から収集した情報を徐々にネットワークに融合する新しいRNNアーキテクチャを用いる。
論文 参考訳(メタデータ) (2020-05-13T20:59:37Z) - A Spatial-Temporal Attentive Network with Spatial Continuity for
Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。
まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。
第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文 参考訳(メタデータ) (2020-03-13T04:35:50Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。