論文の概要: Social-Pose: Enhancing Trajectory Prediction with Human Body Pose
- arxiv url: http://arxiv.org/abs/2507.22742v1
- Date: Wed, 30 Jul 2025 14:58:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:18.270768
- Title: Social-Pose: Enhancing Trajectory Prediction with Human Body Pose
- Title(参考訳): ソーシャルパス:人体情報を用いた軌道予測の強化
- Authors: Yang Gao, Saeed Saadatnejad, Alexandre Alahi,
- Abstract要約: 本研究では,人体ポーズを用いた人体軌道予測の利点について検討した。
我々は,シーン内のすべての人間のポーズとその社会的関係を効果的にキャプチャするアテンションベースのポーズエンコーダであるSocial-poseを提案する。
- 参考スコア(独自算出の注目度): 70.59399670794171
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate human trajectory prediction is one of the most crucial tasks for autonomous driving, ensuring its safety. Yet, existing models often fail to fully leverage the visual cues that humans subconsciously communicate when navigating the space. In this work, we study the benefits of predicting human trajectories using human body poses instead of solely their Cartesian space locations in time. We propose `Social-pose', an attention-based pose encoder that effectively captures the poses of all humans in a scene and their social relations. Our method can be integrated into various trajectory prediction architectures. We have conducted extensive experiments on state-of-the-art models (based on LSTM, GAN, MLP, and Transformer), and showed improvements over all of them on synthetic (Joint Track Auto) and real (Human3.6M, Pedestrians and Cyclists in Road Traffic, and JRDB) datasets. We also explored the advantages of using 2D versus 3D poses, as well as the effect of noisy poses and the application of our pose-based predictor in robot navigation scenarios.
- Abstract(参考訳): 正確な人間の軌道予測は、自動運転にとって最も重要なタスクの1つであり、その安全性を保証する。
しかし、既存のモデルは、人間が空間をナビゲートする際に意識的にコミュニケーションする視覚的手がかりを十分に活用できないことが多い。
本研究では,人体ポーズを用いた人体軌道予測の利点について検討する。
本研究では,シーン中のすべての人間のポーズとその社会的関係を効果的にキャプチャするアテンションベースのポーズエンコーダ「Social-pose」を提案する。
提案手法は,様々な軌道予測アーキテクチャに組み込むことができる。
我々は,最先端モデル(LSTM, GAN, MLP, トランスフォーマーをベースとした)の広範な実験を行い, 合成(Joint Track Auto)と実(Human3.6M, Pedestrians and Cyclists in Road Traffic, JRDB)のデータセットに改良を加えた。
また、2D対3Dのポーズの利点や、ノイズのポーズの効果、ロボットナビゲーションのシナリオにおけるポーズベースの予測器の適用についても検討した。
関連論文リスト
- UPTor: Unified 3D Human Pose Dynamics and Trajectory Prediction for Human-Robot Interaction [0.688204255655161]
本研究では,グローバル座標フレームにおける全体ポーズと軌道キーポイントの予測手法を提案する。
我々は、市販の3次元ポーズ推定モジュール、グラフアテンションネットワーク、コンパクトで非自己回帰的なトランスフォーマーを使用する。
従来の研究と比較して、我々のアプローチはコンパクトでリアルタイムであり、全てのデータセットにわたる人間のナビゲーション動作を予測する上で正確であることを示す。
論文 参考訳(メタデータ) (2025-05-20T19:57:25Z) - Exploring 3D Human Pose Estimation and Forecasting from the Robot's Perspective: The HARPER Dataset [52.22758311559]
本研究では,ユーザとスポット間のダイアドインタラクションにおける3次元ポーズ推定と予測のための新しいデータセットであるHARPERを紹介する。
キーノーベルティは、ロボットの視点、すなわちロボットのセンサーが捉えたデータに焦点を当てることである。
HARPERの基盤となるシナリオには15のアクションが含まれており、そのうち10つはロボットとユーザの間の物理的接触を含んでいる。
論文 参考訳(メタデータ) (2024-03-21T14:53:50Z) - Social-Transmotion: Promptable Human Trajectory Prediction [65.80068316170613]
Social-Transmotionは、多種多様な視覚的手がかりを利用して人間の行動を予測する、汎用トランスフォーマーベースのモデルである。
提案手法は,JTA,JRDB,歩行者,道路交通のサイクリスト,ETH-UCYなど,複数のデータセットで検証されている。
論文 参考訳(メタデータ) (2023-12-26T18:56:49Z) - Robots That Can See: Leveraging Human Pose for Trajectory Prediction [30.919756497223343]
本研究では,人間中心環境における未来の軌道を予測するためのトランスフォーマーアーキテクチャを提案する。
結果として得られたモデルは、将来の人間の軌道予測に固有の不確実性を捉えている。
我々は,限られた履歴データを持つ新しいエージェントを誤りの主な要因として同定し,予測誤差を低減するために3次元骨格ポーズの相補的な性質を実証する。
論文 参考訳(メタデータ) (2023-09-29T13:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。