論文の概要: Muninn: Your Trajectory Diffusion Model But Faster
- arxiv url: http://arxiv.org/abs/2605.09999v1
- Date: Mon, 11 May 2026 05:21:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.542109
- Title: Muninn: Your Trajectory Diffusion Model But Faster
- Title(参考訳): Muninn: 軌道拡散モデルは速いが速い
- Authors: Gokul Puthumanaillam, Hao Jiang, Ruben Hernandez, Jose Fuentes, Paulo Padrao, Leonardo Bobadilla, Melkior Ornik,
- Abstract要約: 拡散に基づく軌道プランナーは、リッチでマルチモーダルなロボットの動きを合成できるが、反復的なデノベーションは、オンラインの計画と制御を違法に遅くする。
本研究では,モデルの再学習や軌道品質の犠牲を伴わずに,ロボットのリアルタイム使用に十分な速度で拡散型軌道プランナを構築するという課題に対処する。
Muninnは、タスクのパフォーマンスと安全性の指標を保ちながら、デノイザの評価を減らし、複数の軌道拡散モデルで最大4.6倍のウォールタイムのスピードアップを提供する。
- 参考スコア(独自算出の注目度): 4.221836692945716
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion-based trajectory planners can synthesize rich, multimodal robot motions, but their iterative denoising makes online planning and control prohibitively slow. Existing accelerations either modify the sampler or compress the network--sacrificing plan quality or requiring retraining without accounting for downstream control risk. We address the problem of making diffusion-based trajectory planners fast enough for real-time robot use without retraining the model or sacrificing trajectory quality, and in a way that works across diverse state-space diffusion architectures. Our key insight is that diffusion trajectory planners expose two signals we can exploit: a cheap probe of how their internal trajectory representation changes across steps, and analytic coefficients that describe how denoiser errors affect the sampler's state update. By calibrating the first signal against the second on offline runs, we obtain a per-step score that upper-bounds how far the final trajectory can deviate when we reuse a cached denoiser output, and we treat this bound as an uncertainty budget that we can spend over the denoising process. Building on this insight, we present Muninn, a training-free caching wrapper that tracks this uncertainty budget during sampling and, at each diffusion step, chooses between reusing a cached denoiser output when the predicted deviation is small and recomputing the denoiser when it is not. Across standard benchmarks Muninn delivers up to 4.6x wall-clock speedups across several trajectory diffusion models by reducing denoiser evaluations, while preserving task performance and safety metrics. Muninn further certifies that cached rollouts remain within a specified distance of their full-compute counterparts, and we validate these gains in real-time closed-loop navigation and manipulation hardware deployments. Project page: https://github.com/gokulp01/Muninn.
- Abstract(参考訳): 拡散に基づく軌道プランナーは、リッチでマルチモーダルなロボットの動きを合成できるが、反復的なデノベーションは、オンラインの計画と制御を違法に遅くする。
既存のアクセラレーションは、サンプルを変更するか、ネットワークを圧縮する - 計画品質を犠牲にするか、下流の制御リスクを考慮せずに再トレーニングを必要とする。
本研究では,モデルの再学習や軌道品質の犠牲を伴わずに,ロボットのリアルタイム利用に十分な速度で拡散に基づく軌道プランナを構築するという課題に対処する。
私たちの重要な洞察は、拡散軌道プランナーは、ステップ間で内部軌道表現がどのように変化するかの安価なプローブと、デノイザエラーがサンプリング者の状態更新にどのように影響するかを記述する分析係数の2つの信号を公開することである。
オフライン動作において第1の信号に対して第2の信号の校正を行うことにより、キャッシュド・デノイザ出力の再利用時に最終軌道がどの程度ずれるかを上界とするステップ毎のスコアを取得し、この境界をデノイザ処理に要する不確実な予算として扱う。
この知見に基づいて、トレーニング不要なキャッシュラッパーであるMuninnを紹介し、サンプリング中にこの不確実性の予算を追跡するとともに、各拡散ステップにおいて、予測偏差が小さいときにキャッシュデノイザ出力を再利用するか、そうでないときにデノイザを再計算するかを選択する。
標準ベンチマーク全体にわたって、Muninnは、タスクのパフォーマンスと安全性の指標を保ちながら、デノイザーの評価を減らし、複数の軌道拡散モデルにわたる最大4.6倍のウォールタイムのスピードアップを提供する。
Muninn氏はさらに、キャッシュされたロールアウトが完全な計算対象から指定された距離内にあることを証明し、リアルタイムのクローズドループナビゲーションとハードウェアデプロイメントにおけるこれらのメリットを検証する。
プロジェクトページ:https://github.com/gokulp01/Muninn.com
関連論文リスト
- Adaptive Spectral Feature Forecasting for Diffusion Sampling Acceleration [58.19554276924402]
スペクトル拡散特徴予測器(Spectrum)を提案する。
我々はFLUX.1で4.79$times$スピードアップ、Wan2.1-14Bで4.67$times$スピードアップを達成する。
論文 参考訳(メタデータ) (2026-03-02T08:59:11Z) - FlowConsist: Make Your Flow Consistent with Real Trajectory [99.22869983378062]
現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文 参考訳(メタデータ) (2026-02-06T03:24:23Z) - FlashDLM: Accelerating Diffusion Language Model Inference via Efficient KV Caching and Guided Diffusion [22.207275433870937]
拡散言語モデルは並列トークン生成と本質的に双方向性を提供する。
最先端拡散モデル(ドリーム7B、LLaDA 8Bなど)は推論が遅い。
我々は,トークンアンマキングを監督するために,軽量な事前学習型自己回帰モデルを用いた学習自由度法であるガイドド拡散を導入する。
論文 参考訳(メタデータ) (2025-05-27T17:39:39Z) - Improving Consistency Models with Generator-Augmented Flows [16.049476783301724]
一貫性モデルは、ニューラルネットワークの単一前方通過におけるスコアベース拡散の多段階サンプリングを模倣する。
それらは、一貫性の蒸留と一貫性のトレーニングの2つの方法を学ぶことができる。
本稿では,一貫性モデルから得られたノイズデータを対応する出力へ転送する新しい流れを提案する。
論文 参考訳(メタデータ) (2024-06-13T20:22:38Z) - Towards More Accurate Diffusion Model Acceleration with A Timestep Tuner [112.99126045081046]
数千のデノナイジングステップを用いて画像を生成するために定式化された拡散モデルは通常、遅い推論速度に悩まされる。
最小コストで特定の区間に対してより正確な積分方向を求めるのに役立つtextbftimestep tunerを提案する。
実験により,我々のプラグイン設計を効率的に訓練し,様々な最先端加速度法の推論性能を向上できることが示された。
論文 参考訳(メタデータ) (2023-10-14T02:19:07Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Truncated Diffusion Probabilistic Models and Diffusion-based Adversarial
Auto-Encoders [137.1060633388405]
拡散に基づく生成モデルは、逆拡散連鎖を推論してデータを生成する方法を学ぶ。
我々は、データが純粋なランダムノイズになるまで、より高速で安価にノイズを付加するアプローチを提案する。
提案手法は,拡散過程と学習可能な暗黙的前処理の両方によって付与された逆自動エンコーダとしてキャスト可能であることを示す。
論文 参考訳(メタデータ) (2022-02-19T20:18:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。