論文の概要: Temporal Pyramid Network for Pedestrian Trajectory Prediction with
Multi-Supervision
- arxiv url: http://arxiv.org/abs/2012.01884v2
- Date: Fri, 4 Dec 2020 02:11:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 14:55:04.413121
- Title: Temporal Pyramid Network for Pedestrian Trajectory Prediction with
Multi-Supervision
- Title(参考訳): 多スーパービジョンによる歩行者軌道予測のための時間ピラミッドネットワーク
- Authors: Rongqin Liang, Yuanman Li, Xia Li, yi tang, Jiantao Zhou, Wenbin Zou
- Abstract要約: 本研究では,歩行者軌跡予測のための時間的ピラミッドネットワークを提案する。
我々の階層的なフレームワークは、上から下までよりリッチな時間情報を持つ特徴ピラミッドを構築し、様々なテンポでの動作をよりよく捉えます。
グローバルコンテキストの上位粗い特徴をリッチローカルコンテキストの下位細かい特徴に段階的にマージすることにより、この手法は軌道の長距離情報と短距離情報の両方を完全に活用することができる。
- 参考スコア(独自算出の注目度): 27.468166556263256
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting human motion behavior in a crowd is important for many
applications, ranging from the natural navigation of autonomous vehicles to
intelligent security systems of video surveillance. All the previous works
model and predict the trajectory with a single resolution, which is rather
inefficient and difficult to simultaneously exploit the long-range information
(e.g., the destination of the trajectory), and the short-range information
(e.g., the walking direction and speed at a certain time) of the motion
behavior. In this paper, we propose a temporal pyramid network for pedestrian
trajectory prediction through a squeeze modulation and a dilation modulation.
Our hierarchical framework builds a feature pyramid with increasingly richer
temporal information from top to bottom, which can better capture the motion
behavior at various tempos. Furthermore, we propose a coarse-to-fine fusion
strategy with multi-supervision. By progressively merging the top coarse
features of global context to the bottom fine features of rich local context,
our method can fully exploit both the long-range and short-range information of
the trajectory. Experimental results on several benchmarks demonstrate the
superiority of our method.
- Abstract(参考訳): 群衆の人間の動きを予測することは、自動運転車の自然なナビゲーションからビデオ監視のインテリジェントなセキュリティシステムまで、多くのアプリケーションにとって重要である。
従来のすべての作業は、1つの解像度で軌道をモデル化し予測するが、これは比較的非効率であり、移動行動の長距離情報(例えば、軌道の目的地)と短距離情報(例えば、ある時点での歩行方向と速度)を同時に利用することが困難である。
本稿では,スクイーズ変調と拡張変調による歩行者追跡予測のための時間的ピラミッドネットワークを提案する。
我々の階層的なフレームワークは、上から下までよりリッチな時間情報を持つ特徴ピラミッドを構築し、様々なテンポでの動作をよりよく捉えます。
さらに,マルチスーパービジョンを用いた粗大な核融合戦略を提案する。
グローバルコンテキストの上位粗い特徴をリッチローカルコンテキストの下位細かい特徴に段階的にマージすることにより、この手法は軌道の長距離情報と短距離情報の両方を完全に活用することができる。
いくつかのベンチマーク実験の結果,提案手法の優位性を示した。
関連論文リスト
- Deep Learning-Based Robust Multi-Object Tracking via Fusion of mmWave Radar and Camera Sensors [6.166992288822812]
複雑なトラフィックシナリオを通じて、より安全で効率的なナビゲーションを実現する上で、マルチオブジェクトトラッキングは重要な役割を果たす。
本稿では,自律走行システムにおける複数物体追跡の精度とロバスト性を高めるために,レーダデータとカメラデータを統合した新しいディープラーニング方式を提案する。
論文 参考訳(メタデータ) (2024-07-10T21:09:09Z) - Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。
現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。
本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文 参考訳(メタデータ) (2023-10-09T20:32:49Z) - MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。
実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-06-05T04:24:11Z) - MSTFormer: Motion Inspired Spatial-temporal Transformer with
Dynamic-aware Attention for long-term Vessel Trajectory Prediction [0.6451914896767135]
MSTFormer は Transformer に基づく動きインスパイアされた容器軌道予測手法である。
軌道の空間的特徴と運動特徴を記述するためのデータ拡張手法を提案する。
第2に,頻繁な動き変換を伴う軌道点に着目したマルチヘッド動的自己認識機構を提案する。
第三に、モデルの性能をさらに向上させるために、知識にインスパイアされた損失関数を構築する。
論文 参考訳(メタデータ) (2023-03-21T02:11:37Z) - MotionTrack: Learning Robust Short-term and Long-term Motions for
Multi-Object Tracking [56.92165669843006]
本研究では,短時間から長期間の軌跡を関連づける統合フレームワークで,堅牢な短期・長期動作を学習するMotionTrackを提案する。
密集した群集に対して,各ターゲットの複雑な動きを推定できる,短時間の軌跡から相互作用認識動作を学習するための新しい対話モジュールを設計する。
極端なオクルージョンのために、ターゲットの履歴軌跡から信頼できる長期動作を学習するための新しいRefind Moduleを構築し、中断された軌跡とそれに対応する検出とを関連付けることができる。
論文 参考訳(メタデータ) (2023-03-18T12:38:33Z) - PDFormer: Propagation Delay-Aware Dynamic Long-Range Transformer for
Traffic Flow Prediction [78.05103666987655]
空間時空間グラフニューラルネットワーク(GNN)モデルは、この問題を解決する最も有望な方法の1つである。
本稿では,交通流の正確な予測を行うために,遅延を意識した動的長距離トランスフォーマー(PDFormer)を提案する。
提案手法は,最先端の性能を達成するだけでなく,計算効率の競争力も発揮できる。
論文 参考訳(メタデータ) (2023-01-19T08:42:40Z) - Motion Transformer with Global Intention Localization and Local Movement
Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。
MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-09-27T16:23:14Z) - SDMTL: Semi-Decoupled Multi-grained Trajectory Learning for 3D human
motion prediction [5.581663772616127]
本研究では,未来の人間の動きを予測するために,新たなエンド・ツー・エンドネットワークであるセミ・デカップリング・マルチグラウンド・トラジェクティブ・ラーニング・ネットワークを提案する。
具体的には、細粒度や粗さを含む多粒度運動軌跡の時間的ダイナミクスを捉える。
階層的にBSMEを用いて多粒性軌道情報を学習し、各粒度における時間的進化方向の情報をキャプチャする。
論文 参考訳(メタデータ) (2020-10-11T01:29:21Z) - A Spatial-Temporal Attentive Network with Spatial Continuity for
Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。
まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。
第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文 参考訳(メタデータ) (2020-03-13T04:35:50Z) - Trajectron++: Dynamically-Feasible Trajectory Forecasting With
Heterogeneous Data [37.176411554794214]
人間の動きに関する推論は、安全で社会的に認識されたロボットナビゲーションにとって重要な前提条件である。
我々は,多種多様なエージェントの軌道を予測できるモジュール型グラフ構造化リカレントモデルであるTrajectron++を提案する。
実世界の軌道予測データセットにおいて,その性能を実証する。
論文 参考訳(メタデータ) (2020-01-09T16:47:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。