論文の概要: A Principled Approach for Creating High-fidelity Synthetic Demonstrations for Imitation Learning
- arxiv url: http://arxiv.org/abs/2605.01232v1
- Date: Sat, 02 May 2026 04:09:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.654508
- Title: A Principled Approach for Creating High-fidelity Synthetic Demonstrations for Imitation Learning
- Title(参考訳): 模倣学習のための高忠実な合成デモ作成のための原理的アプローチ
- Authors: Moniruzzaman Akash, Momotaz Begum,
- Abstract要約: 3D Gaussian Splatting (3DGS)は、単一の専門家軌道と短いマルチビュースキャンから視覚的にリアルなデモ生成を可能にした。
既存の3DGSベースの合成パイプラインは通常、サンプリングベースのプランナーや軌道最適化を使って新しい動きを生成する。
本稿では,専門家の動作構造を明示的に保ちながら,多様なタスクのデモンストレーションを合成するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.5469452301122175
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in 3D Gaussian Splatting (3DGS) have enabled visually realistic demonstration generation from a single expert trajectory and a short multi-view scan. However, existing 3DGS-based synthesis pipelines typically generate new motions using sampling-based planners or trajectory optimization, which often deviate substantially from the expert's demonstrated path. While such deviations may be acceptable for tasks insensitive to motion shape, they discard subtle spatial and temporal structure that is critical for contact-rich and shape-sensitive manipulation, causing increased demonstration diversity to harm downstream policy learning. We argue that demonstration synthesis should treat the expert trajectory as a strong prior. Building on this principle, we propose a framework that synthesizes diverse task demonstrations while explicitly preserving expert motion structure. We model the expert trajectory using Dynamic Movement Primitives (DMPs) and retarget it to new goals, object configurations, and viewpoints within a reconstructed 3DGS scene, yielding phase-consistent, shape-preserving motion by construction. To safely realize this expert-preserving diversity in cluttered scenes, we introduce an analytic obstacle-aware DMP formulation that operates directly on the continuous density field induced by the 3DGS representation. This enables collision avoidance while minimally perturbing the nominal expert motion, unifying photorealistic rendering and geometric reasoning without additional scene representations. We evaluate our approach on a Spot mobile manipulator across three manipulation tasks with increasing sensitivity to trajectory fidelity. Compared to planner- and optimization-based synthesis, our method produces trajectories with lower deviation and collision rates and yields higher task success when training diffusion-based visuomotor policies.
- Abstract(参考訳): 近年の3Dガウススプラッティング(3DGS)の進歩により、単一の専門家軌道と短いマルチビュースキャンから視覚的にリアルなデモ生成が可能になった。
しかし、既存の3DGSベースの合成パイプラインは通常、サンプリングベースのプランナーや軌道最適化を使って新しい動きを生成する。
このような偏差は、運動形態に敏感なタスクには受け入れられるかもしれないが、接触に富み、形状に敏感な操作に不可欠な微妙な空間的・時間的構造を排除し、下流の政策学習を害するデモの多様性を増大させる。
実演合成は、専門家の軌跡を強大な先行として扱うべきであると論じる。
この原理に基づいて,専門家の動作構造を明示的に保存しつつ,多様なタスクのデモンストレーションを合成するフレームワークを提案する。
本研究では, 動的運動プリミティブ(DMP)を用いて専門家軌道をモデル化し, 再構成された3DGSシーン内の新たな目標, オブジェクト構成, 視点に再ターゲットし, 構成による位相整合, 形状保存運動を生成する。
乱れ場面におけるこの専門家保存の多様性を安全に実現するために,3DGS表現によって誘導される連続密度場を直接操作する,解析的障害物対応DMP定式化を導入する。
これにより、名目の専門家の動きを最小限に摂動させながら衝突回避が可能となり、写真リアリスティックなレンダリングと幾何学的推論を追加のシーン表現なしで統合する。
本研究では,3つの操作課題にまたがるスポット移動マニピュレータへのアプローチを評価し,トラジェクティブ忠実度に対する感度を高めた。
提案手法は, プランナーと最適化に基づく合成と比較して, 偏差や衝突率の低い軌道を生成し, 拡散に基づくビズモータポリシーの訓練において, 高いタスク成功率が得られる。
関連論文リスト
- MeshMimic: Geometry-Aware Humanoid Motion Learning through 3D Scene Reconstruction [54.36564144414704]
MeshMimicは、3Dシーンの再構築とインテリジェンスを組み込んだ革新的なフレームワークで、ヒューマノイドロボットがビデオから直接「モーション・テライン」インタラクションを学習できるようにする。
現状の3次元視覚モデルを活用することで、我々のフレームワークは、人間の軌跡と基礎となる地形や物体の3次元幾何学の両方を正確にセグメント化し再構築する。
論文 参考訳(メタデータ) (2026-02-17T17:09:45Z) - SceneReVis: A Self-Reflective Vision-Grounded Framework for 3D Indoor Scene Synthesis via Multi-turn RL [18.967658906855466]
現行のワンパス3Dシーン合成法は、議論的推論の欠如により、衝突などの空間幻覚に悩まされることが多い。
SceneReVisは、空間的衝突を明示的にインターセプトし解決するために反復的な診断と対処のループを利用する視覚的な自己回帰フレームワークである。
そこで我々は,2段階のトレーニングレシピを提案し,モデルからアクティブな空間プランナへと進化させた。
論文 参考訳(メタデータ) (2026-02-10T05:55:56Z) - IDSplat: Instance-Decomposed 3D Gaussian Splatting for Driving Scenes [25.939318593012484]
動的駆動シーンの再構築は、センサ・リアリスティック・シミュレーションによる自律システム開発に不可欠である。
我々は,動的シーンを明示的なインスタンス分解と学習可能なモーショントラジェクトリで再構成する,自己教師型3次元ガウススティングフレームワークIDSplatを提案する。
本手法は, インスタンスレベルの分解を維持しつつ, 競合する再構成品質を実現し, 再トレーニングを伴わずに, 多様なシーケンスやビュー密度を一般化する。
論文 参考訳(メタデータ) (2025-11-24T15:48:08Z) - WorldForge: Unlocking Emergent 3D/4D Generation in Video Diffusion Model via Training-Free Guidance [17.295532380360992]
WorldForgeは3つの密結合モジュールからなるトレーニング不要の推論時間フレームワークである。
我々のフレームワークはプラグアンドプレイとモデル非依存であり、様々な3D/4Dタスクに適用可能である。
論文 参考訳(メタデータ) (2025-09-18T16:40:47Z) - Zero-shot 3D-Aware Trajectory-Guided image-to-video generation via Test-Time Training [27.251232052868033]
Trajectory-Guided Image-to-Video (I2V) 生成は、ユーザが指定した動画を合成することを目的としている。
Zo3Tは軌道制御されたI2V生成における3次元リアリズムと運動精度を著しく向上させる。
論文 参考訳(メタデータ) (2025-09-08T14:21:45Z) - DGS-LRM: Real-Time Deformable 3D Gaussian Reconstruction From Monocular Videos [52.46386528202226]
Deformable Gaussian Splats Large Reconstruction Model (DGS-LRM)を紹介する。
動的シーンのモノクロポーズビデオから変形可能な3Dガウススプラットを予測する最初のフィードフォワード法である。
最先端のモノクロビデオ3D追跡手法と同等の性能を発揮する。
論文 参考訳(メタデータ) (2025-06-11T17:59:58Z) - EMoTive: Event-guided Trajectory Modeling for 3D Motion Estimation [59.33052312107478]
イベントカメラは、シーン変化に対する連続的適応ピクセルレベル応答による3次元モーション推定の可能性を提供する。
本稿では,イベント誘導パラメトリック曲線を用いた一様軌道をモデル化するイベントベースフレームワークであるEMoveについて述べる。
動作表現には,事象誘導下での空間的特徴と時間的特徴を融合する密度認識適応機構を導入する。
最終3次元運動推定は、パラメトリック軌道、流れ、深度運動場の多時間サンプリングによって達成される。
論文 参考訳(メタデータ) (2025-03-14T13:15:54Z) - T-3DGS: Removing Transient Objects for 3D Scene Reconstruction [83.05271859398779]
映像シーケンスにおける過渡的オブジェクトは、3Dシーン再構成の品質を著しく低下させる可能性がある。
我々は,ガウススプラッティングを用いた3次元再構成において,過渡的障害を頑健に除去する新しいフレームワークT-3DGSを提案する。
論文 参考訳(メタデータ) (2024-11-29T07:45:24Z) - Motion-aware 3D Gaussian Splatting for Efficient Dynamic Scene Reconstruction [89.53963284958037]
動的シーン再構築のための新しい動き認識拡張フレームワークを提案する。
具体的には,まず3次元ガウス運動と画素レベルの流れの対応性を確立する。
より厳密な最適化問題を示す先行的な変形に基づくパラダイムに対して,過渡対応変形補助モジュールを提案する。
論文 参考訳(メタデータ) (2024-03-18T03:46:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。