論文の概要: JRDB-Pose3D: A Multi-person 3D Human Pose and Shape Estimation Dataset for Robotics
- arxiv url: http://arxiv.org/abs/2602.03064v1
- Date: Tue, 03 Feb 2026 03:46:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.22887
- Title: JRDB-Pose3D: A Multi-person 3D Human Pose and Shape Estimation Dataset for Robotics
- Title(参考訳): JRDB-Pose3D : ロボットのための多人数3次元人文と形状推定データセット
- Authors: Sandika Biswas, Kian Izadpanah, Hamid Rezatofighi,
- Abstract要約: JRDB-Pose3Dは、モバイルロボットプラットフォームから、屋内および屋外のマルチヒューマン環境をキャプチャする。
JRDB-Pose3Dには、平均して1フレームあたり5~10人のポーズがあり、最大35人の人物が同時に登場するシーンもある。
- 参考スコア(独自算出の注目度): 15.188501869677532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world scenes are inherently crowded. Hence, estimating 3D poses of all nearby humans, tracking their movements over time, and understanding their activities within social and environmental contexts are essential for many applications, such as autonomous driving, robot perception, robot navigation, and human-robot interaction. However, most existing 3D human pose estimation datasets primarily focus on single-person scenes or are collected in controlled laboratory environments, which restricts their relevance to real-world applications. To bridge this gap, we introduce JRDB-Pose3D, which captures multi-human indoor and outdoor environments from a mobile robotic platform. JRDB-Pose3D provides rich 3D human pose annotations for such complex and dynamic scenes, including SMPL-based pose annotations with consistent body-shape parameters and track IDs for each individual over time. JRDB-Pose3D contains, on average, 5-10 human poses per frame, with some scenes featuring up to 35 individuals simultaneously. The proposed dataset presents unique challenges, including frequent occlusions, truncated bodies, and out-of-frame body parts, which closely reflect real-world environments. Moreover, JRDB-Pose3D inherits all available annotations from the JRDB dataset, such as 2D pose, information about social grouping, activities, and interactions, full-scene semantic masks with consistent human- and object-level tracking, and detailed annotations for each individual, such as age, gender, and race, making it a holistic dataset for a wide range of downstream perception and human-centric understanding tasks.
- Abstract(参考訳): 現実世界のシーンは本質的に混み合っています。
したがって、近くのすべての人間の3Dポーズを推定し、時間とともに動きを追跡し、社会的・環境的な状況の中での活動を理解することは、自律運転、ロボット認識、ロボットナビゲーション、人間とロボットの相互作用など、多くのアプリケーションにとって不可欠である。
しかし、既存の3D人間のポーズ推定データセットのほとんどは、主に1人のシーンに焦点を当てているか、制御された実験室環境で収集されている。
このギャップを埋めるために,モバイルロボットプラットフォームから複数人の屋内環境と屋外環境をキャプチャするJRDB-Pose3Dを導入する。
JRDB-Pose3Dは複雑な動的なシーンに対してリッチな3Dポーズアノテーションを提供し、SMPLベースのポーズアノテーションと一貫性のあるボディシェイプパラメータ、個人毎のIDを時間とともに追跡する。
JRDB-Pose3Dには、平均して1フレームあたり5~10人のポーズがあり、最大35人の人物が同時に登場するシーンもある。
提案したデータセットは、頻繁なオクルージョン、乱れた体、現実世界の環境をよく反映するフレーム外の体の部分など、ユニークな課題を提示する。
さらに、JRDB-Pose3Dは、2Dポーズ、ソーシャルグループ、アクティビティ、インタラクションに関する情報、一貫した人間やオブジェクトレベルのトラッキングを備えたフルシーンのセマンティックマスク、年齢、性別、人種などの個人毎の詳細なアノテーションなど、JRDBデータセットから利用可能なすべてのアノテーションを継承し、幅広い下流認識や人間中心の理解タスクのための総合的なデータセットとなる。
関連論文リスト
- ParaHome: Parameterizing Everyday Home Activities Towards 3D Generative Modeling of Human-Object Interactions [10.364340631868322]
そこで我々は,人間と物体の動的3次元運動を,共通のホーム環境内で捉えるために設計したParaHomeシステムを紹介した。
我々のシステムは70台のRGBカメラとIMUベースのボディスーツやハンドモーションキャプチャーグローブなどのウェアラブルモーションキャプチャー装置を備えた多視点セットアップを備えている。
ParaHomeシステムを利用することで、38人の参加者とともに、207回のキャプチャで486分間のシーケンスを含む、新たな人間とオブジェクトのインタラクションデータセットを収集する。
論文 参考訳(メタデータ) (2024-01-18T18:59:58Z) - FreeMan: Towards Benchmarking 3D Human Pose Estimation under Real-World Conditions [25.42369471193405]
FreeManは、現実世界の条件下で収集された最初の大規模なマルチビューデータセットである。
8000のシーケンスから1100万フレームで構成され、異なる視点から見ることができます。
これらのシーケンスは、10の異なるシナリオにまたがって40の被験者をカバーし、それぞれ異なる照明条件を持つ。
論文 参考訳(メタデータ) (2023-09-10T16:42:11Z) - Full-Body Articulated Human-Object Interaction [61.01135739641217]
CHAIRSは16.2時間の多目的相互作用からなる大規模な動きキャプチャーされたf-AHOIデータセットである。
CHAIRSは、対話的なプロセス全体を通して、人間と明瞭なオブジェクトの両方の3Dメッシュを提供する。
HOIにおける幾何学的関係を学習することにより,人間のポーズ推定を利用した最初のモデルが考案された。
論文 参考訳(メタデータ) (2022-12-20T19:50:54Z) - JRDB-Pose: A Large-scale Dataset for Multi-Person Pose Estimation and
Tracking [6.789370732159177]
マルチパーソンポーズ推定と追跡のための大規模データセットであるJRDB-Poseを紹介する。
データセットには、屋内と屋外の混雑したチャレンジシーンが含まれています。
JRDB-Poseは、キーポイント単位のオクルージョンラベルと、シーン全体で一貫性のあるトラックIDを備えたヒューマンポーズアノテーションを提供する。
論文 参考訳(メタデータ) (2022-10-20T07:14:37Z) - BEHAVE: Dataset and Method for Tracking Human Object Interactions [105.77368488612704]
マルチビューのRGBDフレームとそれに対応する3D SMPLとオブジェクトをアノテートしたアノテートコンタクトに適合させる。
このデータを用いて、自然環境における人間と物体を、容易に使用可能なマルチカメラで共同で追跡できるモデルを学ぶ。
論文 参考訳(メタデータ) (2022-04-14T13:21:19Z) - EgoBody: Human Body Shape, Motion and Social Interactions from
Head-Mounted Devices [76.50816193153098]
EgoBodyは複雑な3Dシーンにおけるソーシャルインタラクションのための新しい大規模データセットである。
私たちはMicrosoft HoloLens2ヘッドセットを使って、RGB、奥行き、視線、頭と手のトラッキングなど、リッチなエゴセントリックなデータストリームを記録しています。
正確な3Dグラウンドトルースを得るため、マルチKinectリグでヘッドセットを校正し、多視点RGB-Dフレームに表現力のあるSMPL-Xボディーメッシュを適合させる。
論文 参考訳(メタデータ) (2021-12-14T18:41:28Z) - D3D-HOI: Dynamic 3D Human-Object Interactions from Videos [49.38319295373466]
本稿では,D3D-HOIについて紹介する。D3D-HOIは3次元オブジェクトのポーズ,形状,動きを,人間と物体の相互作用の時,地上の真理アノテーションを付加したモノクロビデオのデータセットである。
我々のデータセットは、様々な現実世界のシーンとカメラの視点から捉えた、いくつかの共通したオブジェクトで構成されている。
我々は、推定された3次元人間のポーズを利用して、物体の空間的レイアウトとダイナミクスをより正確に推定する。
論文 参考訳(メタデータ) (2021-08-19T00:49:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。