論文の概要: Pedestrian Action Anticipation using Contextual Feature Fusion in
Stacked RNNs
- arxiv url: http://arxiv.org/abs/2005.06582v1
- Date: Wed, 13 May 2020 20:59:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 13:36:13.925905
- Title: Pedestrian Action Anticipation using Contextual Feature Fusion in
Stacked RNNs
- Title(参考訳): 重畳RNNにおける文脈特徴融合を用いた歩行者行動予測
- Authors: Amir Rasouli, Iuliia Kotseruba, John K. Tsotsos
- Abstract要約: 交差点における歩行者行動予測問題の解法を提案する。
提案手法では,シーン動的・視覚的特徴の両面から収集した情報を徐々にネットワークに融合する新しいRNNアーキテクチャを用いる。
- 参考スコア(独自算出の注目度): 19.13270454742958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the major challenges for autonomous vehicles in urban environments is
to understand and predict other road users' actions, in particular, pedestrians
at the point of crossing. The common approach to solving this problem is to use
the motion history of the agents to predict their future trajectories. However,
pedestrians exhibit highly variable actions most of which cannot be understood
without visual observation of the pedestrians themselves and their
surroundings. To this end, we propose a solution for the problem of pedestrian
action anticipation at the point of crossing. Our approach uses a novel stacked
RNN architecture in which information collected from various sources, both
scene dynamics and visual features, is gradually fused into the network at
different levels of processing. We show, via extensive empirical evaluations,
that the proposed algorithm achieves a higher prediction accuracy compared to
alternative recurrent network architectures. We conduct experiments to
investigate the impact of the length of observation, time to event and types of
features on the performance of the proposed method. Finally, we demonstrate how
different data fusion strategies impact prediction accuracy.
- Abstract(参考訳): 都市環境における自動運転車の重要な課題の1つは、他の道路利用者の行動、特に横断する地点の歩行者を理解し予測することである。
この問題を解決する一般的なアプローチは、エージェントの運動履歴を使って将来の軌道を予測することである。
しかし、歩行者は、歩行者自身とその周囲の視覚的な観察なしには理解できない、非常に多様な行動を示す。
この目的のために,交差点における歩行者行動予測問題の解法を提案する。
提案手法では,様々なソースから収集した情報(シーンダイナミクスと視覚特徴)を,異なる処理レベルで徐々にネットワークに融合させる,新たなRNNアーキテクチャを用いる。
実験により,提案アルゴリズムは,他の再帰的ネットワークアーキテクチャと比較して高い予測精度が得られることを示す。
提案手法の性能に及ぼす観察時間,イベント時間,特徴の種類の影響を調べる実験を行った。
最後に、異なるデータ融合戦略が予測精度に与える影響を実証する。
関連論文リスト
- Knowledge-aware Graph Transformer for Pedestrian Trajectory Prediction [15.454206825258169]
歩行者運動軌跡の予測は、自動運転車の経路計画と移動制御に不可欠である。
近年の深層学習に基づく予測手法は、主に軌跡履歴や歩行者間の相互作用などの情報を利用する。
本稿では,予測性能を向上させるためのグラフトランス構造を提案する。
論文 参考訳(メタデータ) (2024-01-10T01:50:29Z) - Implicit Occupancy Flow Fields for Perception and Prediction in
Self-Driving [68.95178518732965]
自動運転車(SDV)は、周囲を認識でき、他の交通参加者の将来の行動を予測できなければならない。
既存の作業は、検出されたオブジェクトの軌跡が続くオブジェクト検出を実行するか、シーン全体の密度の高い占有とフローグリッドを予測するかのいずれかである。
これは、認識と将来の予測に対する統一されたアプローチを動機付け、単一のニューラルネットワークで時間とともに占有とフローを暗黙的に表現します。
論文 参考訳(メタデータ) (2023-08-02T23:39:24Z) - Behavioral Intention Prediction in Driving Scenes: A Survey [70.53285924851767]
行動意図予測(BIP)は、人間の思考過程をシミュレートし、特定の行動の早期予測を満たす。
この作業は、利用可能なデータセット、重要な要因と課題、歩行者中心および車両中心のBIPアプローチ、BIP対応アプリケーションからのBIPの包括的なレビューを提供する。
論文 参考訳(メタデータ) (2022-11-01T11:07:37Z) - PedFormer: Pedestrian Behavior Prediction via Cross-Modal Attention
Modulation and Gated Multitask Learning [10.812772606528172]
本研究では,エゴ中心の視点から,歩行者の将来の軌跡や横断行動を予測するために,異なるデータモダリティに依存する新しい枠組みを提案する。
本モデルでは, トラジェクトリとアクション予測の精度を, それぞれ22%, 13%向上した。
論文 参考訳(メタデータ) (2022-10-14T15:12:00Z) - Pedestrian Stop and Go Forecasting with Hybrid Feature Fusion [87.77727495366702]
歩行者の立ち止まりと予測の新たな課題を紹介します。
都市交通における歩行者の立ち寄り行動を明示的に研究するためのベンチマークであるTransをリリースする。
歩行者の歩行動作に注釈を付けたいくつかの既存のデータセットから構築し、さまざまなシナリオや行動を実現する。
論文 参考訳(メタデータ) (2022-03-04T18:39:31Z) - Context-Aware Scene Prediction Network (CASPNet) [3.390468002706074]
我々は,新しい畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)に基づくアーキテクチャを用いて,すべての道路利用者の動きを共同で学習し,予測する。
我々の手法は予測ベンチマークで最先端の結果に到達する。
論文 参考訳(メタデータ) (2022-01-18T12:52:01Z) - Predicting Pedestrian Crossing Intention with Feature Fusion and
Spatio-Temporal Attention [0.0]
歩行者の交差の意図は都市運転のためにリアルタイムで認識されるべきです。
最近の研究は、このタスクに視覚ベースのディープニューラルネットワークモデルを使用することの可能性を示している。
本研究は,歩行者横断意図予測において,本質的に異なる時間的特徴を融合するニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-04-12T14:10:25Z) - Multi-Modal Hybrid Architecture for Pedestrian Action Prediction [14.032334569498968]
本研究では,歩行者の横断行動を予測するために,環境から取得したさまざまな情報ソースを組み込んだ新しいマルチモーダル予測アルゴリズムを提案する。
既存の2次元歩行者行動ベンチマークと新たに注釈付けされた3次元運転データセットを用いて,提案モデルが歩行者横断予測における最先端性能を達成することを示す。
論文 参考訳(メタデータ) (2020-11-16T15:17:58Z) - Implicit Latent Variable Model for Scene-Consistent Motion Forecasting [78.74510891099395]
本稿では,センサデータから直接複雑な都市交通のシーン一貫性のある動き予測を学習することを目的とする。
我々は、シーンを相互作用グラフとしてモデル化し、強力なグラフニューラルネットワークを用いてシーンの分散潜在表現を学習する。
論文 参考訳(メタデータ) (2020-07-23T14:31:25Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。