論文の概要: Modeling 3D Pedestrian-Vehicle Interactions for Vehicle-Conditioned Pose Forecasting
- arxiv url: http://arxiv.org/abs/2602.08962v1
- Date: Mon, 09 Feb 2026 17:58:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.410211
- Title: Modeling 3D Pedestrian-Vehicle Interactions for Vehicle-Conditioned Pose Forecasting
- Title(参考訳): 車載型ポース予測のための3次元歩行者と車両の相互作用のモデル化
- Authors: Guangxun Zhu, Xuan Liu, Nicolas Pugeault, Chongfeng Wei, Edmond S. L. Ho,
- Abstract要約: 歩行者運動の正確な予測は、複雑な都市環境における安全で信頼性の高い自動運転に不可欠である。
本稿では,周囲の車両情報を明示的に組み込んだ3次元歩行者ポーズ予測フレームワークを提案する。
- 参考スコア(独自算出の注目度): 13.375894985533838
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurately predicting pedestrian motion is crucial for safe and reliable autonomous driving in complex urban environments. In this work, we present a 3D vehicle-conditioned pedestrian pose forecasting framework that explicitly incorporates surrounding vehicle information. To support this, we enhance the Waymo-3DSkelMo dataset with aligned 3D vehicle bounding boxes, enabling realistic modeling of multi-agent pedestrian-vehicle interactions. We introduce a sampling scheme to categorize scenes by pedestrian and vehicle count, facilitating training across varying interaction complexities. Our proposed network adapts the TBIFormer architecture with a dedicated vehicle encoder and pedestrian-vehicle interaction cross-attention module to fuse pedestrian and vehicle features, allowing predictions to be conditioned on both historical pedestrian motion and surrounding vehicles. Extensive experiments demonstrate substantial improvements in forecasting accuracy and validate different approaches for modeling pedestrian-vehicle interactions, highlighting the importance of vehicle-aware 3D pose prediction for autonomous driving. Code is available at: https://github.com/GuangxunZhu/VehCondPose3D
- Abstract(参考訳): 歩行者運動の正確な予測は、複雑な都市環境における安全で信頼性の高い自動運転に不可欠である。
本研究では,周囲の車両情報を明示的に組み込んだ3次元歩行者ポーズ予測フレームワークを提案する。
これをサポートするために、Waymo-3DSkelMoデータセットを3次元車両境界ボックスで拡張し、マルチエージェント歩行者と車両の相互作用の現実的なモデリングを可能にする。
歩行者と車両の数を分類してシーンを分類するサンプリング手法を導入し、様々な相互作用の複雑さの訓練を容易にする。
提案するネットワークは、TBIFormerアーキテクチャを専用車両エンコーダと歩行者と車両の相互接続モジュールで適用し、歩行者と車両の特徴を融合させ、歴史的歩行者運動と周辺車両の両方で予測を行う。
大規模な実験により、予測精度が大幅に向上し、歩行者と車両の相互作用をモデル化するための様々なアプローチが検証された。
コードは、https://github.com/GuangxunZhu/VehCondPose3Dで入手できる。
関連論文リスト
- GeoDrive: 3D Geometry-Informed Driving World Model with Precise Action Control [50.67481583744243]
実世界モデルにロバストな3次元形状条件を明示的に統合したGeoDriveを紹介する。
車両の位置を編集することでレンダリングを強化するため,トレーニング中の動的編集モジュールを提案する。
動作精度と空間認識の両面で既存のモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-28T14:46:51Z) - Inverse++: Vision-Centric 3D Semantic Occupancy Prediction Assisted with 3D Object Detection [11.33083039877258]
3次元セマンティック占有予測は、自動運転車の周囲環境の詳細な幾何学的・意味的な情報を予測することを目的としている。
追加の3次元物体検出補助分岐を組み込んだ3次元監視信号を導入する。
IoUスコアは31.73%、mIoUスコアは20.91%である。
論文 参考訳(メタデータ) (2025-04-07T05:08:22Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - Pedestrian Environment Model for Automated Driving [54.16257759472116]
歩行者の位置とポーズ情報を含む環境モデルを提案する。
画像から人間のポーズ推定器を用いて骨格情報を抽出する。
位置の3D情報を得るために,車両の位置と合わせて連続するフレームからデータを集約する。
論文 参考訳(メタデータ) (2023-08-17T16:10:58Z) - HUM3DIL: Semi-supervised Multi-modal 3D Human Pose Estimation for
Autonomous Driving [95.42203932627102]
3Dの人間のポーズ推定は、自動運転車が歩行者の微妙で複雑な振る舞いを知覚し理解できるようにする新しい技術である。
提案手法は,これらの補完信号を半教師付き方式で効率的に利用し,既存の手法よりも大きなマージンで性能を向上する。
具体的には、LiDAR点を画素整列マルチモーダル特徴に埋め込み、トランスフォーマーの精細化段階を経る。
論文 参考訳(メタデータ) (2022-12-15T11:15:14Z) - CRAT-Pred: Vehicle Trajectory Prediction with Crystal Graph
Convolutional Neural Networks and Multi-Head Self-Attention [10.83642398981694]
CRAT-Predは、地図情報に依存しない軌道予測モデルである。
このモデルは非常に少ないモデルパラメータで最先端の性能を達成する。
さらに,車間の社会的相互作用を,測定可能なインタラクションスコアを表す重みによって学習できることを定量的に示す。
論文 参考訳(メタデータ) (2022-02-09T14:36:36Z) - Large Scale Interactive Motion Forecasting for Autonomous Driving : The
Waymo Open Motion Dataset [84.3946567650148]
10万枚以上のシーンが10Hzで20秒に渡り、私たちの新しいデータセットには1750kmの道路上の570時間以上のユニークなデータが含まれています。
高精度な3d自動ラベルシステムを用いて,道路エージェント毎に高品質な3dバウンディングボックスを生成する。
シングルエージェントとジョイントエージェントの相互作用運動予測モデルの両方を総合的に評価する新しいメトリクスセットを紹介します。
論文 参考訳(メタデータ) (2021-04-20T17:19:05Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。