論文の概要: Graph2Kernel Grid-LSTM: A Multi-Cued Model for Pedestrian Trajectory
Prediction by Learning Adaptive Neighborhoods
- arxiv url: http://arxiv.org/abs/2007.01915v2
- Date: Wed, 8 Jul 2020 08:48:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 05:57:00.317662
- Title: Graph2Kernel Grid-LSTM: A Multi-Cued Model for Pedestrian Trajectory
Prediction by Learning Adaptive Neighborhoods
- Title(参考訳): graph2kernel grid-lstm:適応型近傍学習による歩行者追跡予測のためのマルチキュードモデル
- Authors: Sirin Haddad and Siew Kei Lam
- Abstract要約: 本稿では,歩行者地区がデザインに適応しうることを提案することによって,インタラクションモデリングの新しい視点を示す。
我々のモデルは、いくつかの公開テストされた監視ビデオに類似した特徴を照合する最先端のアプローチよりも優れています。
- 参考スコア(独自算出の注目度): 10.57164270098353
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pedestrian trajectory prediction is a prominent research track that has
advanced towards modelling of crowd social and contextual interactions, with
extensive usage of Long Short-Term Memory (LSTM) for temporal representation of
walking trajectories.
Existing approaches use virtual neighborhoods as a fixed grid for pooling
social states of pedestrians with tuning process that controls how social
interactions are being captured. This entails performance customization to
specific scenes but lowers the generalization capability of the approaches. In
our work, we deploy \textit{Grid-LSTM}, a recent extension of LSTM, which
operates over multidimensional feature inputs. We present a new perspective to
interaction modeling by proposing that pedestrian neighborhoods can become
adaptive in design. We use \textit{Grid-LSTM} as an encoder to learn about
potential future neighborhoods and their influence on pedestrian motion given
the visual and the spatial boundaries. Our model outperforms state-of-the-art
approaches that collate resembling features over several publicly-tested
surveillance videos. The experiment results clearly illustrate the
generalization of our approach across datasets that varies in scene features
and crowd dynamics.
- Abstract(参考訳): 歩行者軌跡予測は,歩行軌跡の時間的表現にLong Short-Term Memory (LSTM) を広範囲に用い,群集の社会的・文脈的相互作用のモデル化に向けた顕著な研究トラックである。
既存のアプローチでは、仮想地区を固定グリッドとして使用し、歩行者の社会的状態をプールし、社会的相互作用の捉え方を制御するチューニングプロセスを提供する。
これは特定のシーンにパフォーマンスをカスタマイズするが、アプローチの一般化能力は低下する。
本研究では,多次元特徴入力上で動作するLSTMの拡張であるtextit{Grid-LSTM}をデプロイする。
本稿では,歩行者近傍がデザインに適応可能となることを提案し,インタラクションモデリングの新しい視点を提案する。
エンコーダとして \textit{Grid-LSTM} を用いて, 視覚的境界と空間的境界を考慮し, 将来の歩行者運動への影響を学習する。
我々のモデルは、いくつかの公開テストされた監視ビデオに類似した特徴を照合する最先端のアプローチよりも優れています。
実験の結果は、シーンの特徴や群集のダイナミクスによって異なるデータセットにまたがるアプローチの一般化を明確に示している。
関連論文リスト
- Multi-Transmotion: Pre-trained Model for Human Motion Prediction [68.87010221355223]
マルチトランスモーション(Multi-Transmotion)は、モダリティ事前トレーニング用に設計された革新的なトランスフォーマーベースのモデルである。
提案手法は,下流タスクにおける各種データセット間の競合性能を示す。
論文 参考訳(メタデータ) (2024-11-04T23:15:21Z) - LG-Traj: LLM Guided Pedestrian Trajectory Prediction [9.385936248154987]
LG-Trajは歩行者の過去・保存軌道に現れる動きの手がかりを生成する新しい手法である。
これらの動きの手がかりは、歩行者の座標とともに、下層の表現をよりよく理解するのに役立つ。
本手法では,移動パターンをモデル化するモーションエンコーダと,歩行者間の社会的相互作用を捉えるソーシャルデコーダからなるトランスフォーマーアーキテクチャを用いる。
論文 参考訳(メタデータ) (2024-03-12T19:06:23Z) - Social-Transmotion: Promptable Human Trajectory Prediction [65.80068316170613]
Social-Transmotionは、多種多様な視覚的手がかりを利用して人間の行動を予測する、汎用トランスフォーマーベースのモデルである。
提案手法は,JTA,JRDB,歩行者,道路交通のサイクリスト,ETH-UCYなど,複数のデータセットで検証されている。
論文 参考訳(メタデータ) (2023-12-26T18:56:49Z) - PedFormer: Pedestrian Behavior Prediction via Cross-Modal Attention
Modulation and Gated Multitask Learning [10.812772606528172]
本研究では,エゴ中心の視点から,歩行者の将来の軌跡や横断行動を予測するために,異なるデータモダリティに依存する新しい枠組みを提案する。
本モデルでは, トラジェクトリとアクション予測の精度を, それぞれ22%, 13%向上した。
論文 参考訳(メタデータ) (2022-10-14T15:12:00Z) - LOPR: Latent Occupancy PRediction using Generative Models [49.15687400958916]
LiDARの生成した占有グリッドマップ(L-OGM)は、頑丈な鳥の視線シーンを表現している。
本稿では,学習空間内での表現学習と予測という,占有率予測を分離する枠組みを提案する。
論文 参考訳(メタデータ) (2022-10-03T22:04:00Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - TCL: Transformer-based Dynamic Graph Modelling via Contrastive Learning [87.38675639186405]
我々は,動的に進化するグラフを連続的に扱う,TCLと呼ばれる新しいグラフニューラルネットワークアプローチを提案する。
我々の知る限りでは、これは動的グラフ上の表現学習にコントラスト学習を適用する最初の試みである。
論文 参考訳(メタデータ) (2021-05-17T15:33:25Z) - SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory
Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。
具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。
可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:17:42Z) - Graph-SIM: A Graph-based Spatiotemporal Interaction Modelling for
Pedestrian Action Prediction [10.580548257913843]
本稿では,歩行者の横断行動を予測するための新しいグラフベースモデルを提案する。
既存のnuScenesデータセットに対して、3Dバウンディングボックスと歩行者行動アノテーションを提供する新しいデータセットを紹介します。
提案手法は,既存の手法と比較して,様々な指標を15%以上改善し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-12-03T18:28:27Z) - Multi-Modal Hybrid Architecture for Pedestrian Action Prediction [14.032334569498968]
本研究では,歩行者の横断行動を予測するために,環境から取得したさまざまな情報ソースを組み込んだ新しいマルチモーダル予測アルゴリズムを提案する。
既存の2次元歩行者行動ベンチマークと新たに注釈付けされた3次元運転データセットを用いて,提案モデルが歩行者横断予測における最先端性能を達成することを示す。
論文 参考訳(メタデータ) (2020-11-16T15:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。