論文の概要: 3D Generation for Embodied AI and Robotic Simulation: A Survey
- arxiv url: http://arxiv.org/abs/2604.26509v1
- Date: Wed, 29 Apr 2026 10:17:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.355229
- Title: 3D Generation for Embodied AI and Robotic Simulation: A Survey
- Title(参考訳): 身体的AIのための3D生成とロボットシミュレーション:サーベイ
- Authors: Tianwei Ye, Yifan Mao, Minwen Liao, Jian Liu, Chunchao Guo, Dazhao Du, Quanxin Shou, Fangqi Zhu, Song Guo,
- Abstract要約: Embodied AIとロボットシステムは、シミュレーションベースのトレーニングと実世界の展開のために、スケーラブルで多様な物理的基盤を持つ3Dコンテンツにますます依存している。
本調査では, エンボディドAIの3次元生成に関する最初の調査を行い, エンボディドシステムにおいて3次元生成が果たす3つの役割に関する文献を整理した。
- 参考スコア(独自算出の注目度): 19.441445845534158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embodied AI and robotic systems increasingly depend on scalable, diverse, and physically grounded 3D content for simulation-based training and real-world deployment. While 3D generative modeling has advanced rapidly, embodied applications impose requirements far beyond visual realism: generated objects must carry kinematic structure and material properties, scenes must support interaction and task execution, and the resulting content must bridge the gap between simulation and reality. This survey presents the first survey of 3D generation for embodied AI and organizes the literature around three roles that 3D generation plays in embodied systems. In \emph{Data Generator}, 3D generation produces simulation-ready objects and assets, including articulated, physically grounded, and deformable content for downstream interaction; in \emph{Simulation Environments}, it constructs interactive and task-oriented worlds, spanning structure-aware, controllable, and agentic scene generation; and in \emph{Sim2Real Bridge}, it supports digital twin reconstruction, data augmentation, and synthetic demonstrations for downstream robot learning and real-world transfer. We also show that the field is shifting from visual realism toward interaction readiness, and we identify the main bottlenecks, including limited physical annotations, the gap between geometric quality and physical validity, fragmented evaluation, and the persistent sim-to-real divide, that must be addressed for 3D generation to become a dependable foundation for embodied intelligence. Our project page is at https://3dgen4robot.github.io.
- Abstract(参考訳): Embodied AIとロボットシステムは、シミュレーションベースのトレーニングと実世界の展開のために、スケーラブルで多様な物理的基盤を持つ3Dコンテンツにますます依存している。
3D生成モデリングは急速に進歩しているが、具体化されたアプリケーションは視覚的リアリズムをはるかに超越した要件を課している: 生成されたオブジェクトは運動的構造と物質的特性を持ち、シーンは相互作用とタスク実行をサポートし、結果として生じるコンテンツはシミュレーションと現実のギャップを埋める必要がある。
本調査では, エンボディドAIの3次元生成に関する最初の調査を行い, エンボディドシステムにおいて3次元生成が果たす3つの役割に関する文献を整理した。
\emph{Data Generator} では、3D 生成は、ダウンストリームのインタラクションのための、明瞭で物理的に座屈した、変形可能なコンテンツを含むシミュレーション可能なオブジェクトやアセットを生成する; \emph{Simulation Environments} では、構造認識、制御可能、エージェント的なシーン生成にまたがる、インタラクティブでタスク指向の世界を構築する; \emph{Sim2Real Bridge} では、デジタルツインの再構築、データ拡張、下流ロボット学習と実世界の移動のための合成デモをサポートする。
また、フィールドが視覚的リアリズムから相互作用の即応性へとシフトしていることを示し、物理的アノテーションの制限、幾何学的品質と物理的妥当性のギャップ、断片化評価、そして3次元世代が具体化インテリジェンスの基礎となるためには、永続的なsim-to-realの分割など、主要なボトルネックを特定する。
私たちのプロジェクトページはhttps://3dgen4robot.github.ioです。
関連論文リスト
- URDF-Anything+: Autoregressive Articulated 3D Models Generation for Physical Simulation [45.4820195450296]
本稿では,視覚的観察から実行可能なオブジェクトモデルを直接生成する,エンドツーエンドの自動回帰フレームワークを提案する。
視覚的観察から構築された高忠実度デジタル双生児は、シミュレーションで訓練されたポリシーを、オンライン適応なしで実際のロボットに転送することができる。
論文 参考訳(メタデータ) (2026-03-14T16:23:44Z) - Beyond Pixel Histories: World Models with Persistent 3D State [50.4601060508243]
PERSISTは、潜伏した3Dシーンの進化をシミュレートする世界モデルの新たなパラダイムである。
既存の手法に比べて空間記憶,3次元整合性,長期安定性が大幅に向上した。
論文 参考訳(メタデータ) (2026-03-03T19:58:31Z) - Mirage2Matter: A Physically Grounded Gaussian World Model from Video [87.9732484393686]
我々は、グラフィック駆動の世界モデリングおよびシミュレーションフレームワークであるSimulate Anythingを紹介する。
実世界の環境を3次元ガウススプレイティング(3DGS)による写実的シーン表現に再構築する。
次に、生成モデルを利用して、物理的に現実的な表現を復元し、精度校正ターゲットを介してシミュレーション環境に統合する。
論文 参考訳(メタデータ) (2026-01-24T07:43:57Z) - PAT3D: Physics-Augmented Text-to-3D Scene Generation [47.18949891825537]
PAT3Dは3Dオブジェクトを生成し、それらの空間的関係を推測し、それらを階層的なシーンツリーに整理する。
微分可能な剛体シミュレータは、重力下での現実的な物体の相互作用を保証する。
実験により、PAT3Dは、物理的妥当性、意味的一貫性、視覚的品質において、従来のアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-11-26T23:23:58Z) - Seed3D 1.0: From Images to High-Fidelity Simulation-Ready 3D Assets [63.67760219308476]
シミュレーション可能な3Dアセットを単一画像から生成する基礎モデルであるSeed3D 1.0を提案する。
既存の3D生成モデルとは異なり、我々のシステムは正確な幾何学、よく整合したテクスチャ、リアルな物理的基盤を持つ資産を生産する。
論文 参考訳(メタデータ) (2025-10-22T18:16:32Z) - HoloScene: Simulation-Ready Interactive 3D Worlds from a Single Video [25.898073594115413]
HoloSceneはインタラクティブな3D再構成フレームワークである。
オブジェクトの幾何学、外観、物理的特性を階層的およびオブジェクト間関係と共に符号化する。
得られたデジタル双生児は、新しい視点から完全な正確な幾何学、物理的安定性、現実的なレンダリングを示す。
論文 参考訳(メタデータ) (2025-10-07T04:12:18Z) - EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence [8.987157387248317]
EmbodiedGenはインタラクティブな3Dワールドジェネレーションのための基盤となるプラットフォームだ。
高品質で、制御可能で、フォトリアリスティックな3Dアセットを低コストでスケーラブルに生成することができる。
論文 参考訳(メタデータ) (2025-06-12T11:43:50Z) - SIGHT: Synthesizing Image-Text Conditioned and Geometry-Guided 3D Hand-Object Trajectories [124.24041272390954]
手動物体の相互作用をモデル化することは、ロボットと具体化されたAIシステムを前進させる大きな可能性を秘めている。
SIGHTは、1つの画像から現実的で物理的に妥当な3Dハンドオブジェクトインタラクショントラジェクトリを生成することに焦点を当てた,新しいタスクである。
SIGHT-Fusionは,データベースから最もよく似た3Dオブジェクトメッシュを抽出し,この課題に対処する,新しい拡散型画像文条件付き生成モデルを提案する。
論文 参考訳(メタデータ) (2025-03-28T20:53:20Z) - Atlas3D: Physically Constrained Self-Supporting Text-to-3D for Simulation and Fabrication [50.541882834405946]
我々は,テキストから3Dへの自動的実装であるAtlas3Dを紹介する。
提案手法は,新しい微分可能シミュレーションに基づく損失関数と,物理的にインスパイアされた正規化を組み合わせたものである。
我々は、Atlas3Dの有効性を広範囲な生成タスクを通して検証し、シミュレーションと実環境の両方で結果の3Dモデルを検証する。
論文 参考訳(メタデータ) (2024-05-28T18:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。