論文の概要: TrouSPI-Net: Spatio-temporal attention on parallel atrous convolutions
and U-GRUs for skeletal pedestrian crossing prediction
- arxiv url: http://arxiv.org/abs/2109.00953v1
- Date: Thu, 2 Sep 2021 13:54:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-03 17:43:34.463755
- Title: TrouSPI-Net: Spatio-temporal attention on parallel atrous convolutions
and U-GRUs for skeletal pedestrian crossing prediction
- Title(参考訳): trouspi-net: 歩行者横断予測のための平行畳み込みとu-grusの時空間的注意
- Authors: Joseph Gesnouin, Steve Pechberti, Bogdan Stanciulescu and Fabien
Moutarde
- Abstract要約: 本研究では,歩行者の骨格の動態を二元交差意図にリンクさせることにより,都市交通環境における歩行者横断予測に対処する。
コンテクストフリーで軽量で軽量な予測器であるTrouSPI-Netを紹介する。
我々は、TrouSPI-Netを評価し、その性能を解析する。
- 参考スコア(独自算出の注目度): 1.911678487931003
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding the behaviors and intentions of pedestrians is still one of the
main challenges for vehicle autonomy, as accurate predictions of their
intentions can guarantee their safety and driving comfort of vehicles. In this
paper, we address pedestrian crossing prediction in urban traffic environments
by linking the dynamics of a pedestrian's skeleton to a binary crossing
intention. We introduce TrouSPI-Net: a context-free, lightweight, multi-branch
predictor. TrouSPI-Net extracts spatio-temporal features for different time
resolutions by encoding pseudo-images sequences of skeletal joints' positions
and processes them with parallel attention modules and atrous convolutions. The
proposed approach is then enhanced by processing features such as relative
distances of skeletal joints, bounding box positions, or ego-vehicle speed with
U-GRUs. Using the newly proposed evaluation procedures for two large public
naturalistic data sets for studying pedestrian behavior in traffic: JAAD and
PIE, we evaluate TrouSPI-Net and analyze its performance. Experimental results
show that TrouSPI-Net achieved 0.76 F1 score on JAAD and 0.80 F1 score on PIE,
therefore outperforming current state-of-the-art while being lightweight and
context-free.
- Abstract(参考訳): 歩行者の行動や意図を理解することは、車両の安全と運転の快適性を保証するため、自動車の自律性にとって依然として大きな課題の1つである。
本稿では,歩行者の骨格の動態を二元交差意図にリンクすることで,都市交通環境における歩行者の横断予測に対処する。
trouspi-net: コンテキストフリー、軽量、マルチブランチの予測ツール。
trouspi-netは、骨格関節の位置の擬似画像配列をエンコードして、様々な時間分解のための時空間的特徴を抽出する。
提案手法は, 骨格関節の相対距離, バウンディングボックス位置, u-grus による ego-vehicle speed などの処理により強化される。
JAAD と PIE の2つの大規模公共自然科学データセットの評価手法を用いて,TrouSPI-Net の評価を行い,その性能解析を行った。
実験の結果, trouspi-net は jaad で 0.76 f1 得点, pie で 0.80 f1 得点を達成した。
関連論文リスト
- Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Learning Pedestrian Actions to Ensure Safe Autonomous Driving [12.440017892152417]
自動運転車は、歩行者の短期的かつ即時的な行動をリアルタイムで予測する能力を持つことが重要である。
本研究では,歩行者行動と軌跡予測のために,トランスフォーマーエンコーダデコーダ (TF-ed) アーキテクチャを用いた新しいマルチタスクシーケンスを提案する。
提案手法は,既存のLSTMエンコーダデコーダ (LSTM-ed) アーキテクチャを用いて動作と軌道予測を行う。
論文 参考訳(メタデータ) (2023-05-22T14:03:38Z) - Local and Global Contextual Features Fusion for Pedestrian Intention
Prediction [2.203209457340481]
我々は歩行者と交通状況の両方の視覚的特徴を分析し分析する。
グローバルな文脈を理解するために、位置、動き、環境情報を利用する。
これらのマルチモダリティ機能は、効果的な意図学習のためにインテリジェントに融合されている。
論文 参考訳(メタデータ) (2023-05-01T22:37:31Z) - Pedestrian Stop and Go Forecasting with Hybrid Feature Fusion [87.77727495366702]
歩行者の立ち止まりと予測の新たな課題を紹介します。
都市交通における歩行者の立ち寄り行動を明示的に研究するためのベンチマークであるTransをリリースする。
歩行者の歩行動作に注釈を付けたいくつかの既存のデータセットから構築し、さまざまなシナリオや行動を実現する。
論文 参考訳(メタデータ) (2022-03-04T18:39:31Z) - Pedestrian Trajectory Prediction via Spatial Interaction Transformer
Network [7.150832716115448]
交通現場では、来るべき人々と出会うと、歩行者は突然回転したり、すぐに止まることがある。
このような予測不可能な軌道を予測するために、歩行者間の相互作用についての洞察を得ることができる。
本稿では,歩行者軌跡の相関関係を注意機構を用いて学習する空間的相互作用変換器(SIT)を提案する。
論文 参考訳(メタデータ) (2021-12-13T13:08:04Z) - Real Time Monocular Vehicle Velocity Estimation using Synthetic Data [78.85123603488664]
移動車に搭載されたカメラから車両の速度を推定する問題を考察する。
そこで本研究では,まずオフ・ザ・シェルフ・トラッカーを用いて車両バウンディングボックスを抽出し,その後,小型ニューラルネットワークを用いて車両速度を回帰する2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-16T13:10:27Z) - Predicting Pedestrian Crossing Intention with Feature Fusion and
Spatio-Temporal Attention [0.0]
歩行者の交差の意図は都市運転のためにリアルタイムで認識されるべきです。
最近の研究は、このタスクに視覚ベースのディープニューラルネットワークモデルを使用することの可能性を示している。
本研究は,歩行者横断意図予測において,本質的に異なる時間的特徴を融合するニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-04-12T14:10:25Z) - Safety-Oriented Pedestrian Motion and Scene Occupancy Forecasting [91.69900691029908]
我々は、個々の動きとシーン占有マップの両方を予測することを提唱する。
歩行者の相対的な空間情報を保存するScene-Actor Graph Neural Network (SA-GNN)を提案する。
2つの大規模な実世界のデータセットで、我々のシーン占有率予測が最先端のモーション予測手法よりも正確でより校正されていることを示した。
論文 参考訳(メタデータ) (2021-01-07T06:08:21Z) - PnPNet: End-to-End Perception and Prediction with Tracking in the Loop [82.97006521937101]
我々は、自動運転車の文脈において、共同認識と運動予測の問題に取り組む。
我々は,入力センサデータとしてエンド・ツー・エンドのモデルであるNetを提案し,各ステップのオブジェクト追跡とその将来レベルを出力する。
論文 参考訳(メタデータ) (2020-05-29T17:57:25Z) - FuSSI-Net: Fusion of Spatio-temporal Skeletons for Intention Prediction
Network [3.5581822321535785]
昼夜のシナリオでよく機能するエンドツーエンドの歩行者意図フレームワークを開発する。
我々のフレームワークは、人間のポーズの骨格的特徴と組み合わされた異物検出境界ボックスに依存している。
論文 参考訳(メタデータ) (2020-05-15T21:52:42Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。