論文の概要: Synthetic Data Generation Framework, Dataset, and Efficient Deep Model
for Pedestrian Intention Prediction
- arxiv url: http://arxiv.org/abs/2401.06757v1
- Date: Fri, 12 Jan 2024 18:44:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 18:33:56.338121
- Title: Synthetic Data Generation Framework, Dataset, and Efficient Deep Model
for Pedestrian Intention Prediction
- Title(参考訳): 歩行者意図予測のための合成データ生成フレームワーク、データセットおよび効率的な深層モデル
- Authors: Muhammad Naveed Riaz, Maciej Wielgosz, Abel Garcia Romera, Antonio M.
Lopez
- Abstract要約: エゴ車の前で歩行者が横断するかどうかを知ることは、自動運転にとって不可欠だ。
これに対する要因は、さまざまなクロスクロスノンクロス(C/NC)シナリオを持つデータセットの欠如である。
Ped/NCビデオクリップのサンプルからなる合成データセットを生成するARCRUフレームワークを導入することで、この問題に対処する。
また,高速かつメモリフットプリントの少ないPedGNNというディープモデルを提案する。
- 参考スコア(独自算出の注目度): 0.08192907805418582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pedestrian intention prediction is crucial for autonomous driving. In
particular, knowing if pedestrians are going to cross in front of the
ego-vehicle is core to performing safe and comfortable maneuvers. Creating
accurate and fast models that predict such intentions from sequential images is
challenging. A factor contributing to this is the lack of datasets with diverse
crossing and non-crossing (C/NC) scenarios. We address this scarceness by
introducing a framework, named ARCANE, which allows programmatically generating
synthetic datasets consisting of C/NC video clip samples. As an example, we use
ARCANE to generate a large and diverse dataset named PedSynth. We will show how
PedSynth complements widely used real-world datasets such as JAAD and PIE, so
enabling more accurate models for C/NC prediction. Considering the onboard
deployment of C/NC prediction models, we also propose a deep model named
PedGNN, which is fast and has a very low memory footprint. PedGNN is based on a
GNN-GRU architecture that takes a sequence of pedestrian skeletons as input to
predict crossing intentions.
- Abstract(参考訳): 歩行者意図予測は自動運転に不可欠である。
特に、歩行者がエゴ車の前で横断するかどうかを知ることは、安全で快適な操作を行うための核心である。
このような意図をシーケンシャルな画像から予測する正確で高速なモデルを作成することは難しい。
この要因の1つは、様々な交差および非交差(c/nc)シナリオを持つデータセットの欠如である。
我々は、C/NCビデオクリップサンプルからなる合成データセットをプログラムで生成するARCANEというフレームワークを導入することで、この不足に対処する。
例えば、ARCANEを使用して、PedSynthという大規模で多様なデータセットを生成します。
PedSynthは、JAADやPIEなどの広く使われている現実世界のデータセットを補完し、より正確なC/NC予測モデルを可能にすることを示す。
C/NC予測モデルのオンボード展開を考慮すると、高速でメモリフットプリントが非常に少ないPedGNNというディープモデルも提案する。
PedGNNはGNN-GRUアーキテクチャに基づいており、横断意図を予測するために一連の歩行者骨格を入力として利用する。
関連論文リスト
- Navigating Uncertainty: The Role of Short-Term Trajectory Prediction in
Autonomous Vehicle Safety [3.3659635625913564]
我々は,CARLAシミュレータを用いた短期軌道予測タスクのためのデータセットを開発した。
このデータセットは広く、複雑なシナリオとして、歩行者が道路を横断し、車両が乗り越える、と考えられています。
畳み込みニューラルネットワーク(CNN)と長短期記憶(LSTM)を用いた終端から終端までの短期軌道予測モデルも開発されている。
論文 参考訳(メタデータ) (2023-07-11T14:28:33Z) - PerfSAGE: Generalized Inference Performance Predictor for Arbitrary Deep
Learning Models on Edge Devices [8.272409756443539]
本稿では、任意のDNNliteグラフ上の推論遅延、エネルギー、メモリフットプリントを予測する新しいグラフニューラルネットワークであるPerfSAGEについて述べる。
このデータセットを用いて、PerfSAGEをトレーニングし、すべてのターゲットとモデル検索空間にわたって平均絶対パーセンテージ誤差の5%で最先端の予測精度を示す実験結果を提供する。
論文 参考訳(メタデータ) (2023-01-26T08:59:15Z) - LOPR: Latent Occupancy PRediction using Generative Models [49.15687400958916]
LiDARの生成した占有グリッドマップ(L-OGM)は、頑丈な鳥の視線シーンを表現している。
本稿では,学習空間内での表現学習と予測という,占有率予測を分離する枠組みを提案する。
論文 参考訳(メタデータ) (2022-10-03T22:04:00Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - Pedestrian 3D Bounding Box Prediction [83.7135926821794]
我々は、自動運転車の複雑な動きの詳細をモデル化せずに、人間の合理的な推定値である3Dバウンディングボックスに焦点を当てる。
本稿では, 歩行者の3次元境界ボックス予測のための, 単純かつ効果的なモデルを提案する。
この方法は、繰り返しニューラルネットワークに基づくエンコーダ・デコーダアーキテクチャに従う。
論文 参考訳(メタデータ) (2022-06-28T17:59:45Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - SLPC: a VRNN-based approach for stochastic lidar prediction and
completion in autonomous driving [63.87272273293804]
VRNN(Variiational Recurrent Neural Networks)と呼ばれる生成モデルに基づく新しいLiDAR予測フレームワークを提案する。
提案手法は,フレーム内の奥行きマップを空間的に塗り替えることで,スパースデータを扱う際の従来のビデオ予測フレームワークの限界に対処できる。
VRNNのスパースバージョンとラベルを必要としない効果的な自己監督型トレーニング方法を紹介します。
論文 参考訳(メタデータ) (2021-02-19T11:56:44Z) - PePScenes: A Novel Dataset and Baseline for Pedestrian Action Prediction
in 3D [10.580548257913843]
nuScenesにフレーム毎の2D/3Dバウンディングボックスと動作アノテーションを追加して作成された新しい歩行者行動予測データセットを提案する。
また,歩行者横断行動予測のための様々なデータモダリティを組み込んだハイブリッドニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-12-14T18:13:44Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。