論文の概要: Social LSTM with Dynamic Occupancy Modeling for Realistic Pedestrian Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2511.09735v1
- Date: Fri, 14 Nov 2025 01:06:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.449424
- Title: Social LSTM with Dynamic Occupancy Modeling for Realistic Pedestrian Trajectory Prediction
- Title(参考訳): 動的職業モデルを用いた現実的歩行者軌道予測のための社会LSTM
- Authors: Ahmed Alia, Mohcine Chraibi, Armin Seyfried,
- Abstract要約: 本稿では,新しい動的空間損失関数を用いたソーシャルLSTMを改良した新しい深層学習モデルを提案する。
この損失関数は学習における社会的LSTMを導いており、群衆密度の異なる変位誤差を増大させることなく現実的な衝突を避けることができる。
提案したモデルは、ほとんどのテストセットにおいて、最先端のディープラーニングモデルよりも一貫して優れています。
- 参考スコア(独自算出の注目度): 2.1711205684359247
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In dynamic and crowded environments, realistic pedestrian trajectory prediction remains a challenging task due to the complex nature of human motion and the mutual influences among individuals. Deep learning models have recently achieved promising results by implicitly learning such patterns from 2D trajectory data. However, most approaches treat pedestrians as point entities, ignoring the physical space that each person occupies. To address these limitations, this paper proposes a novel deep learning model that enhances the Social LSTM with a new Dynamic Occupied Space loss function. This loss function guides Social LSTM in learning to avoid realistic collisions without increasing displacement error across different crowd densities, ranging from low to high, in both homogeneous and heterogeneous density settings. Such a function achieves this by combining the average displacement error with a new collision penalty that is sensitive to scene density and individual spatial occupancy. For efficient training and evaluation, five datasets were generated from real pedestrian trajectories recorded during the Festival of Lights in Lyon 2022. Four datasets represent homogeneous crowd conditions -- low, medium, high, and very high density -- while the fifth corresponds to a heterogeneous density distribution. The experimental findings indicate that the proposed model not only lowers collision rates but also enhances displacement prediction accuracy in each dataset. Specifically, the model achieves up to a 31% reduction in the collision rate and reduces the average displacement error and the final displacement error by 5% and 6%, respectively, on average across all datasets compared to the baseline. Moreover, the proposed model consistently outperforms several state-of-the-art deep learning models across most test sets.
- Abstract(参考訳): 動的で混み合った環境では、人間の動きの複雑な性質と個人間の相互影響のため、現実的な歩行者軌道予測は依然として難しい課題である。
ディープラーニングモデルは最近、2次元軌跡データからそのようなパターンを暗黙的に学習することで有望な結果を得た。
しかし、ほとんどのアプローチは歩行者をポイントエンティティとして扱い、各人が占有する物理的な空間を無視している。
このような制約に対処するため,新しい動的空間損失関数を用いたソーシャルLSTMを改良した新しい深層学習モデルを提案する。
この損失関数は学習における社会LSTMを導いており、等質密度と不均一密度の両方において、低から高までの様々な集団密度の変位誤差を増大させることなく、現実的な衝突を避けることができる。
このような関数は、平均変位誤差と、シーン密度と個々の空間占有度に敏感な新しい衝突ペナルティを組み合わせることで、これを実現できる。
効率的なトレーニングと評価のために、リヨン2022の光祭で記録された実際の歩行者軌跡から5つのデータセットが生成された。
4つのデータセットは、低、中、高、高密度の同質な群衆状態を表し、5番目は異質な密度分布に対応している。
実験結果から,提案モデルが衝突速度を下げるだけでなく,各データセットの変位予測精度を向上させることが示唆された。
具体的には, 衝突速度を最大で31%低減し, 平均変位誤差と最終変位誤差を, ベースラインと比較して平均で5%, 6%低減する。
さらに、提案したモデルは、ほとんどのテストセットにおいて、最先端のディープラーニングモデルよりも一貫して優れています。
関連論文リスト
- Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - 4D-VLA: Spatiotemporal Vision-Language-Action Pretraining with Cross-Scene Calibration [31.111439909825627]
既存の手法は通常、単純な観察を入力としてデータセットのアクション分布をモデル化する。
カオスの源泉への入力に、4D情報を効果的に統合する新しいアプローチである4D-VLAを提案する。
我々のモデルは既存の手法を常に上回り、より強い空間的理解と適応性を示す。
論文 参考訳(メタデータ) (2025-06-27T14:09:29Z) - Enhancing Monocular Height Estimation via Sparse LiDAR-Guided Correction [25.268217296287688]
合成データに基づいて学習した最先端のMHEモデルについて検討する。
このモデルは,過大評価や過小評価につながる要因である影の手がかりに大きく依存していることが判明した。
本稿では,不完全な大域的LiDAR測定と疎結合な補正パイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-11T08:54:09Z) - SSTP: Efficient Sample Selection for Trajectory Prediction [38.92588125424176]
既存の大規模データセット上での高度な軌道予測モデルのトレーニングは、時間と計算コストがかかる。
本稿では,軌道予測に適したコンパクトだが密度バランスのよいデータセットを構築するSSTPフレームワークを提案する。
実験の結果、SSTPはデータの半分しか使用せず、フルデータセットのトレーニングに匹敵するパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-09-25T22:00:11Z) - Towards Understanding and Mitigating Dimensional Collapse in Heterogeneous Federated Learning [112.69497636932955]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - Uncertainty Quantification Techniques for Space Weather Modeling:
Thermospheric Density Application [0.0]
熱圏密度を予測する非線形MLモデルを開発するための2つの手法を提案する。
ローカルおよびグローバルデータセットでトレーニングされたモデルの性能を示す。
精度の高い不確実性推定値を用いて,独立テストデータ上で11%の誤差を達成した。
論文 参考訳(メタデータ) (2022-01-06T14:17:50Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory
Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。
具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。
可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:17:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。