論文の概要: Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality
- arxiv url: http://arxiv.org/abs/2603.05993v1
- Date: Fri, 06 Mar 2026 07:54:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.98306
- Title: Moving Through Clutter: Scaling Data Collection and Benchmarking for 3D Scene-Aware Humanoid Locomotion via Virtual Reality
- Title(参考訳): Clutterを通して:バーチャルリアリティによる3Dシーン対応ヒューマノイドロコモーションのためのデータ収集とベンチマークのスケーリング
- Authors: Beichen Wang, Yuanjie Lu, Linji Wang, Liuchuan Yu, Xuesu Xiao,
- Abstract要約: 乱雑な環境下でのシーン認識型ヒューマノイド移動のためのフレームワークであるTruise Through Clutterを提示する。
我々のシステムは、制御可能なクラッタレベルを持つシーンを手続き的に生成し、エンボディに一貫性のある、全身の人間の動きをキャプチャする。
このフレームワークを用いて、145の多様な3次元乱れシーンに348のトラジェクトリのデータセットをコンパイルする。
- 参考スコア(独自算出の注目度): 8.649513677221037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in humanoid locomotion have enabled dynamic behaviors such as dancing, martial arts, and parkour, yet these capabilities are predominantly demonstrated in open, flat, and obstacle-free settings. In contrast, real-world environments such as homes, offices, and public spaces, are densely cluttered, three-dimensional, and geometrically constrained, requiring scene-aware whole-body coordination, precise balance control, and reasoning over spatial constraints imposed by furniture and household objects. However, humanoid locomotion in cluttered 3D environments remains underexplored, and no public dataset systematically couples full-body human locomotion with the scene geometry that shapes it. To address this gap, we present Moving Through Clutter (MTC), an opensource Virtual Reality (VR) based data collection and evaluation framework for scene-aware humanoid locomotion in cluttered environments. Our system procedurally generates scenes with controllable clutter levels and captures embodiment-consistent, whole-body human motion through immersive VR navigation, which is then automatically retargeted to a humanoid robot model. We further introduce benchmarks that quantify environment clutter level and locomotion performance, including stability and collision safety. Using this framework, we compile a dataset of 348 trajectories across 145 diverse 3D cluttered scenes. The dataset provides a foundation for studying geometry-induced adaptation in humanoid locomotion and developing scene-aware planning and control methods.
- Abstract(参考訳): 近年のヒューマノイド・ロコモーションの進歩により、ダンス、武道、パールなどのダイナミックな行動が可能になったが、これらの能力は主にオープンでフラットで障害物のない環境で実証されている。
対照的に、住宅、オフィス、公共空間のような現実世界の環境は密散し、立体的、幾何学的に制約を受けており、シーンを意識した全体調整、正確なバランス制御、家具や家庭用物によって課される空間的制約に対する推論を必要としている。
しかし、散らばった3D環境におけるヒューマノイドの移動は未解明のままであり、全身の人間の移動を、それを形作るシーン幾何学と体系的に結合する公開データセットは存在しない。
このギャップに対処するため、我々は、散在環境におけるシーン認識型ヒューマノイド移動のための、オープンソースのVR(Virtual Reality)ベースのデータ収集および評価フレームワーク、MTC(Transforming Through Clutter)を提示する。
我々のシステムは、制御可能なクラッタレベルのシーンをプロシージャ的に生成し、没入型VRナビゲーションによって体感に一貫性のある人体の動きをキャプチャし、自動的にヒューマノイドロボットモデルに再ターゲティングする。
さらに,環境クラッタレベルと移動性能を定量的に評価するベンチマークを導入する。
このフレームワークを用いて、145の多様な3次元乱れシーンに348のトラジェクトリのデータセットをコンパイルする。
このデータセットは、ヒューマノイド移動における幾何学による適応の研究と、シーン認識計画および制御方法の開発の基礎を提供する。
関連論文リスト
- EmbodMocap: In-the-Wild 4D Human-Scene Reconstruction for Embodied Agents [85.77432303199176]
EmbodMocapは2つの動くiPhoneを使ったポータブルで安価なデータ収集パイプラインである。
私たちのキーとなるアイデアは、二重RGB-Dシーケンスを共同で校正し、人間とシーンの両方を再構築することです。
収集したデータに基づいて、我々は3つの具体的AIタスクを強化した: モノクラーヒューマン・シーン・リコンストラクション(モノクラーヒューマン・シーン・リコンストラクション)、メトリックスケールで世界空間に整合した人間とシーンを出力するフィードフォワードモデル、物理ベースのキャラクターアニメーション。
論文 参考訳(メタデータ) (2026-02-26T16:53:41Z) - MeshMimic: Geometry-Aware Humanoid Motion Learning through 3D Scene Reconstruction [54.36564144414704]
MeshMimicは、3Dシーンの再構築とインテリジェンスを組み込んだ革新的なフレームワークで、ヒューマノイドロボットがビデオから直接「モーション・テライン」インタラクションを学習できるようにする。
現状の3次元視覚モデルを活用することで、我々のフレームワークは、人間の軌跡と基礎となる地形や物体の3次元幾何学の両方を正確にセグメント化し再構築する。
論文 参考訳(メタデータ) (2026-02-17T17:09:45Z) - HOSIG: Full-Body Human-Object-Scene Interaction Generation with Hierarchical Scene Perception [57.37135310143126]
HO SIGは階層的なシーン認識を通じて全体インタラクションを合成するための新しいフレームワークである。
我々のフレームワークは、自己回帰生成による運動長の無制限化をサポートし、手動による介入を最小限に抑える。
この研究は、シーン認識ナビゲーションとデクスタラスオブジェクト操作の間に重要なギャップを埋める。
論文 参考訳(メタデータ) (2025-06-02T12:08:08Z) - LocoVR: Multiuser Indoor Locomotion Dataset in Virtual Reality [8.035381442028076]
LocoVRは、130以上の屋内環境から収集された7000人以上の2人以上の軌跡のデータセットである。
評価の結果,ロコVRは人体軌道を利用した3つの室内作業において,モデル性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-10-09T00:45:02Z) - Revisit Human-Scene Interaction via Space Occupancy [55.67657438543008]
HSI(Human-Scene Interaction)の生成は、さまざまな下流タスクに不可欠な課題である。
本研究では,シーンとのインタラクションが,抽象的な物理的視点からシーンの空間占有と本質的に相互作用していることを論じる。
純粋な動きシーケンスを、見えないシーン占有と相互作用する人間の記録として扱うことで、動きのみのデータを大規模にペア化された人間-占有相互作用データベースに集約することができる。
論文 参考訳(メタデータ) (2023-12-05T12:03:00Z) - Synthesizing Diverse Human Motions in 3D Indoor Scenes [16.948649870341782]
そこで本研究では,仮想人間による3次元屋内シーンの映像化手法を提案する。
既存のアプローチは、キャプチャーされた人間の動きと、それらが相互作用する3Dシーンを含むトレーニングシーケンスに依存している。
仮想人間が3Dシーンをナビゲートし、現実的かつ自律的にオブジェクトと対話できる強化学習ベースのアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-21T09:22:24Z) - CIRCLE: Capture In Rich Contextual Environments [69.97976304918149]
そこで我々は,アクターが仮想世界において知覚し,操作する新たな動き獲得システムを提案する。
9つのシーンにわたる5人の被験者から10時間のフルボディ到達動作を含むデータセットであるCIRCLEを提示する。
このデータセットを用いて、シーン情報に基づいて人間の動きを生成するモデルを訓練する。
論文 参考訳(メタデータ) (2023-03-31T09:18:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。