論文の概要: Dynamic Neural Koopman Distillation for Real-Time Robot Control Using Diffusion Models
- arxiv url: http://arxiv.org/abs/2605.24924v1
- Date: Sun, 24 May 2026 08:03:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.513955
- Title: Dynamic Neural Koopman Distillation for Real-Time Robot Control Using Diffusion Models
- Title(参考訳): 拡散モデルを用いたリアルタイムロボット制御のための動的ニューラルクープマン蒸留
- Authors: Lei Zheng, Peiqi Yu, Zengqi Peng, Changliu Liu, Armin Lederer,
- Abstract要約: 本研究では,マルチステップ拡散推論を1つの前方通過に蒸留する動的ニューラルクープマン蒸留法を提案する。
提案手法を標準D4RL MuJoCoロコモーションベンチマークと物理キノバマニピュレータで評価した。
- 参考スコア(独自算出の注目度): 11.615273931053915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models excel at generating diverse and multimodal trajectories for robotic planning, yet their iterative denoising process introduces latency that is incompatible with high-frequency closed-loop control. To address this problem, we propose Dynamic Neural Koopman Distillation, a framework that distills multistep diffusion inference into a single forward pass while retaining the multimodal expressivity of the teacher model. Specifically, we introduce a Factorized Dynamic Koopman layer that models the denoising process through a factorized latent transition with state-dependent modal gains. We evaluate the proposed method on standard D4RL MuJoCo locomotion benchmarks and a physical Kinova manipulator, comparing against one-step baselines. The results show that our method significantly outperforms existing one-step distillation approaches on the reported locomotion tasks, and reduces the inference latency to the millisecond regime compared with the teacher policy. Hardware experiments further demonstrate that our method enables smooth and fast closed-loop execution while maintaining task success and comparable accuracy. A project page is available at https://fdkoopman.github.io/.
- Abstract(参考訳): 拡散モデルは、ロボット計画のための多様なマルチモーダル軌道を生成するのに優れているが、反復的なデノナイジングプロセスは、高周波クローズドループ制御と互換性のない遅延をもたらす。
この問題を解決するために,教師モデルのマルチモーダル表現性を維持しつつ,多段階拡散推論を単一の前方通過に蒸留する動的ニューラルクープマン蒸留法を提案する。
具体的には、状態依存型モーダルゲインによる因数分解潜在遷移をモデルとした分解動的クープマン層を提案する。
提案手法を標準D4RL MuJoCoロコモーションベンチマークと物理キノバマニピュレータで評価し, 1ステップのベースラインと比較した。
その結果,本手法は,報告した移動課題における既存の一段階蒸留手法よりも有意に優れており,教師の方針と比較してミリ秒間における推論遅延を低減できることがわかった。
さらにハードウェア実験により,タスク成功と同等の精度を維持しつつ,スムーズかつ高速なクローズドループ実行を可能にすることを示す。
プロジェクトページはhttps://fdkoopman.github.io/.com/で公開されている。
関連論文リスト
- Ada3Drift: Adaptive Training-Time Drifting for One-Step 3D Visuomotor Robotic Manipulation [53.750389076941396]
拡散に基づくビジュモータポリシーは反復的認知を通じて多モーダルな動作分布をキャプチャするが、その高い推論遅延はリアルタイムロボット制御を制限する。
Ada3Driftは,専門家のデモモードに対して予測された行動を引き付ける訓練時間ドリフト場を学習する。
Ada3Driftは、拡散ベースの代替よりも10倍の関数評価を必要としながら、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-12T14:36:53Z) - DyWeight: Dynamic Gradient Weighting for Few-Step Diffusion Sampling [18.524470249911232]
Dynamic Gradient Weighting (DyWeight)は、軽量で学習ベースのマルチステップソルバである。
DyWeightは、歴史的勾配を適応的に集約する制約のない時間変化パラメータを学習する。
CIFAR-10、FFHQ、AFHQv2、ImageNet64、LSUN-Bedroom、Stable Diffusion、FLUX.1-devの実験は、DyWeightが優れた視力と安定性を達成することを示した。
論文 参考訳(メタデータ) (2026-03-12T07:01:44Z) - From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation [18.70033095161235]
Indicit Likelihood Estimation (IMLE) を用いて条件付きフローマッチングの専門家を高速な単一ステップの学生に蒸留する枠組みを提案する。
双方向のチャンファー距離は、モードカバレッジと忠実度の両方を促進する設定レベルの目的を提供する。
統合認識エンコーダは、さらに多視点RGB、深度、点雲、プロプレセプションを幾何学的認識表現に統合する。
論文 参考訳(メタデータ) (2026-03-10T09:30:05Z) - One-Step Diffusion Model for Image Motion-Deblurring [85.76149042561507]
本稿では,脱臭過程を1段階に短縮する新しいフレームワークである脱臭拡散モデル(OSDD)を提案する。
拡散モデルにおける忠実度損失に対処するために,構造復元を改善する改良された変分オートエンコーダ(eVAE)を導入する。
提案手法は,実測値と非参照値の両方で高い性能を達成する。
論文 参考訳(メタデータ) (2025-03-09T09:39:57Z) - LazyDiT: Lazy Learning for the Acceleration of Diffusion Transformers [79.07412045476872]
拡散変換器は、様々な生成タスクの優越的なモデルとして登場してきた。
各拡散段階におけるモデル全体の実行は不要であることを示し、いくつかの計算は以前のステップの結果を遅延的に再利用することでスキップできることを示した。
遅延学習フレームワークを提案する。このフレームワークは,初期ステップからキャッシュされた結果を効率よく活用し,冗長な計算を省略する。
論文 参考訳(メタデータ) (2024-12-17T01:12:35Z) - One-Step Diffusion Policy: Fast Visuomotor Policies via Diffusion Distillation [80.71541671907426]
OneStep Diffusion Policy (OneDP)は、事前訓練された拡散政策から知識を単一ステップのアクションジェネレータに蒸留する新しいアプローチである。
OneDPはロボット制御タスクの応答時間を著しく短縮する。
論文 参考訳(メタデータ) (2024-10-28T17:54:31Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Learning Unstable Dynamics with One Minute of Data: A
Differentiation-based Gaussian Process Approach [47.045588297201434]
ガウス過程の微分可能性を利用して、真の連続力学の状態依存線形化近似を作成する方法を示す。
9次元セグウェイのような不安定なシステムのシステムダイナミクスを反復的に学習することで、アプローチを検証する。
論文 参考訳(メタデータ) (2021-03-08T05:08:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。