論文の概要: Grounding Generative Policies in Physics: Optimization-Guided Diffusion for Robot Control
- arxiv url: http://arxiv.org/abs/2606.24208v1
- Date: Tue, 23 Jun 2026 06:49:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.814653
- Title: Grounding Generative Policies in Physics: Optimization-Guided Diffusion for Robot Control
- Title(参考訳): 物理におけるグラウンド・ジェネレーティブ・ポリシー:ロボット制御のための最適化誘導拡散
- Authors: Sabrina Bodmer, René Zurbrügg, Tifanny Portela, Hao Ma, Alexandre Didier, Marco Hutter, Colin Jones, Melanie Zeilinger,
- Abstract要約: タスク空間のロボットポリシーでは、生成された把握、ウェイポイント、トラジェクトリは分散的に有効だが実現不可能である。
動作生成を物理的実現可能性に結合する推論時間最適化フレームワークを提案する。
本研究では,到達性と衝突回避制約とコントローラレベルの追従性制約を併用した動的操作によるデクスタラスグリップ合成法の評価を行った。
- 参考スコア(独自算出の注目度): 41.782471938706344
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models sample effectively from high-dimensional, multimodal distributions, but their outputs may violate deployment constraints. For task-space robot policies, generated grasps, waypoints, or trajectories can be distributionally valid yet infeasible, violating reachability, collision-avoidance, or closed-loop executability requirements. This embodiment gap limits zero-shot deployment across robots, even when the task-space behavior itself is transferable. We propose an inference-time optimization framework that couples the behavior generation to physical feasibility by formulating diffusion guidance as a constrained optimization problem. Our key insight is to replace the sampling perturbation in the backward process with an optimized correction, allowing hard constraints or soft penalties to be imposed during sampling without the need to retrain the diffusion model, while keeping samples close to the learned prior. We evaluate the method on dexterous grasp synthesis with reachability and collision-avoidance constraints, and dynamic manipulation with controller-level trackability constraints. Across settings and robot embodiments, optimization-guided denoising matches the feasibility of projection- and gradient-guidance baselines while better preserving grasp quality, and improving controller-level executability and task success, with task success improving by up to 20pp. on dexterous grasping and 23pp. on visuomotor manipulation over the best baseline.
- Abstract(参考訳): 拡散モデルは高次元マルチモーダル分布から効果的にサンプリングするが、その出力は配置制約に違反する可能性がある。
タスクスペースロボットポリシーでは、生成された把握、ウェイポイント、トラジェクトリは、分散的に有効でありながら、到達性、衝突回避、クローズドループ実行性要件に反する。
このエボディメントギャップは、タスク空間の振る舞い自体が転送可能である場合でも、ロボット間のゼロショットデプロイメントを制限する。
本稿では,拡散誘導を制約付き最適化問題として定式化することにより,振る舞い生成を物理的実現性に結合する推論時最適化フレームワークを提案する。
我々の重要な洞察は、後方プロセスにおけるサンプリングの摂動を最適化された修正に置き換えることであり、学習前のサンプルに近づきつつ、拡散モデルを再訓練することなくサンプリング中にハード制約やソフトペナルティを課すことである。
本研究では,到達性と衝突回避制約とコントローラレベルの追従性制約を併用した動的操作によるデクスタラスグリップ合成法の評価を行った。
設定やロボットの具体化全体にわたって、最適化誘導の認知はプロジェクションと勾配誘導のベースラインの実現可能性と一致し、把握品質を向上し、コントローラレベルの実行可能性とタスク成功を改善し、タスク成功率を最大20pp向上させる。
器用なつかみと23ppで
最高のベースラインでの バイスモータ操作についてです
関連論文リスト
- DiRecT: Safe Diffusion-Based Planning via Receding-Horizon Denoising [4.249024052507976]
最適制御(SOC)による拡散モデルからの制約付きサンプリングのためのトレーニング不要アルゴリズムであるDiRecTを導入する。
モデル予測制御にインスパイアされ、不利な制約付き SOC の定式化のために、リテーディング・ホライゾン・サロゲートを導出する。
実験により、DiRecTは既存の拡散ベースの計画ベースラインよりも、デプロイメントの安全性とタスクパフォーマンスを大幅に改善することが示された。
論文 参考訳(メタデータ) (2026-06-13T15:41:26Z) - Manifold-Constrained MPPI: Real-Time Sampling-Based Control Under Hard Constraints [8.747309323431802]
Manifold-Constrained MPPI (MC-MPPI) はリアルタイムサンプリングベースの制御フレームワークである。
MPPIの計算上の利点を保ちながら、多様体ベースの等式制約を強制する。
シミュレーションと実世界の両方の環境で14-DoFクローズドチェーンのデュアルアームシステムの実験は、MC-MPPIが安定して100Hzで動作することを示した。
論文 参考訳(メタデータ) (2026-05-24T01:57:18Z) - Language Generation as Optimal Control: Closed-Loop Diffusion in Latent Control Space [99.30250506439678]
本研究は,言語生成を最適制御問題として再検討する。
自己回帰モデルと拡散モデルを分析するための統一された理論的な視点を提供する。
論文 参考訳(メタデータ) (2026-05-14T08:13:43Z) - Sampling-Based Control via Entropy-Regularized Optimal Transport [18.278741443124655]
OT-MPCは、エントロピー規則化された最適輸送定式化によって制限を克服するサンプリングベースのアルゴリズムである。
我々は、Sinkhornアルゴリズムを用いて、クローズドな勾配のない更新を導出し、リアルタイムな性能を実現する。
論文 参考訳(メタデータ) (2026-05-04T02:07:15Z) - Adaptive Linear Path Model-Based Diffusion [52.84663832658799]
リニアパスモデルベース拡散(LP-MBD)を導入し、分散保存スケジュールをフローマッチング線形確率パスに置き換える。
また,適応型LP-MBD(ALP-MBD)を提案し,タスクの複雑さや環境条件に応じて拡散ステップやノイズレベルを調整する。
論文 参考訳(メタデータ) (2026-02-02T21:33:03Z) - Warm-Starting Collision-Free Model Predictive Control With Object-Centric Diffusion [38.363402738466334]
拡散型ウォームスタート条件と潜時オブジェクト中心のシーン表現を組み合わせることで、厳密な時間制限下での信頼性と効率的な動き生成が得られることを示す。
提案手法では,オブジェクト中心のスロットアテンション機構を用いて,システム状態,タスク,周囲に拡散トランスフォーマを設定できる。
サンプル軌道は、剛体力学と符号-距離衝突制約を強制する最適制御問題によって洗練される。
論文 参考訳(メタデータ) (2026-01-06T10:02:54Z) - HardFlow: Hard-Constrained Sampling for Flow-Matching Models via Trajectory Optimization [4.249024052507976]
本稿では,軌道最適化問題としてハードコントラストサンプリングを再構成する新しいフレームワークを提案する。
我々の重要な洞察は、数値的最適制御を利用してサンプリング軌道を操り、終端時刻に制約が正確に満たされるようにすることである。
このアルゴリズムは、制約満足度とサンプル品質の両方において、既存のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-11-11T16:33:57Z) - Diffusion Predictive Control with Constraints [51.91057765703533]
拡散予測制御(Diffusion predictive control with constraints,DPCC)は、拡散に基づく制御のアルゴリズムである。
DPCCは,新しいテスト時間制約を満たすために,既存の手法よりも優れた性能を示すロボットマニピュレータのシミュレーションを通して示す。
論文 参考訳(メタデータ) (2024-12-12T15:10:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。