論文の概要: Streaming Diffusion Policy: Fast Policy Synthesis with Variable Noise Diffusion Models
- arxiv url: http://arxiv.org/abs/2406.04806v4
- Date: Fri, 11 Oct 2024 16:04:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-14 15:16:52.509175
- Title: Streaming Diffusion Policy: Fast Policy Synthesis with Variable Noise Diffusion Models
- Title(参考訳): ストリーム拡散政策:可変ノイズ拡散モデルによる高速ポリシー合成
- Authors: Sigmund H. Høeg, Yilun Du, Olav Egeland,
- Abstract要約: 拡散モデルはロボット模倣学習に急速に採用され、複雑なタスクを自律的に実行できるようになった。
近年の研究では、拡散過程の蒸留が政策合成の加速にどのように役立つかが研究されている。
本稿では,SDP(Streaming Diffusion Policy)を提案する。
- 参考スコア(独自算出の注目度): 24.34842113104745
- License:
- Abstract: Diffusion models have seen rapid adoption in robotic imitation learning, enabling autonomous execution of complex dexterous tasks. However, action synthesis is often slow, requiring many steps of iterative denoising, limiting the extent to which models can be used in tasks that require fast reactive policies. To sidestep this, recent works have explored how the distillation of the diffusion process can be used to accelerate policy synthesis. However, distillation is computationally expensive and can hurt both the accuracy and diversity of synthesized actions. We propose SDP (Streaming Diffusion Policy), an alternative method to accelerate policy synthesis, leveraging the insight that generating a partially denoised action trajectory is substantially faster than a full output action trajectory. At each observation, our approach outputs a partially denoised action trajectory with variable levels of noise corruption, where the immediate action to execute is noise-free, with subsequent actions having increasing levels of noise and uncertainty. The partially denoised action trajectory for a new observation can then be quickly generated by applying a few steps of denoising to the previously predicted noisy action trajectory (rolled over by one timestep). We illustrate the efficacy of this approach, dramatically speeding up policy synthesis while preserving performance across both simulated and real-world settings.
- Abstract(参考訳): 拡散モデルはロボット模倣学習に急速に採用され、複雑なデキスタラスなタスクを自律的に実行できるようになった。
しかし、アクション合成は遅いことが多く、反復的推論の多くのステップを必要とし、高速なリアクティブポリシーを必要とするタスクでモデルが使える範囲を制限する。
これを回避するために、近年の研究では、拡散過程の蒸留が政策合成の加速にどのように役立つかが研究されている。
しかし、蒸留は計算コストが高く、合成された作用の精度と多様性の両方を損なう可能性がある。
SDP(Streaming Diffusion Policy, ストリーミング拡散ポリシー)は, 部分分節化動作軌跡の生成が全出力動作軌跡よりもかなり高速であるという知見を生かして, 政策合成を高速化する代替手法である。
それぞれの観測において,本手法は雑音のレベルが変化し,即時動作はノイズフリーとなり,その後の動作はノイズレベルと不確実性が増大する部分的認知行動軌跡を出力する。
新しい観測のための部分分極化作用軌跡は、予め予測された雑音性作用軌跡に数ステップの分極を施すことで、迅速に生成することができる。
本手法の有効性を概説し、シミュレーションと実世界の双方で性能を保ちながら、ポリシー合成を劇的に高速化する。
関連論文リスト
- One-Step Diffusion Policy: Fast Visuomotor Policies via Diffusion Distillation [80.71541671907426]
OneStep Diffusion Policy (OneDP)は、事前訓練された拡散政策から知識を単一ステップのアクションジェネレータに蒸留する新しいアプローチである。
OneDPはロボット制御タスクの応答時間を著しく短縮する。
論文 参考訳(メタデータ) (2024-10-28T17:54:31Z) - Training-Free Adaptive Diffusion with Bounded Difference Approximation Strategy [44.09909260046396]
雑音発生過程における雑音予測のステップを削減するための適応拡散法を提案する。
提案手法は, 最大25倍の速度アップを達成し, 元の処理と同一の処理結果を生成するとともに, デノナイズ処理を著しく高速化することができる。
論文 参考訳(メタデータ) (2024-10-13T15:19:18Z) - RecMoDiffuse: Recurrent Flow Diffusion for Human Motion Generation [5.535590461577558]
RecMoDiffuseは時間モデリングのための新しい再帰拡散定式化である。
人間の動作の時間的モデリングにおけるRecMoDiffuseの有効性を実証する。
論文 参考訳(メタデータ) (2024-06-11T11:25:37Z) - SinSR: Diffusion-Based Image Super-Resolution in a Single Step [119.18813219518042]
拡散モデルに基づく超解像(SR)法は有望な結果を示す。
しかし、それらの実践的応用は、必要な推論ステップのかなりの数によって妨げられている。
本稿では,SinSRという単一ステップのSR生成を実現するための,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:21:29Z) - Towards More Accurate Diffusion Model Acceleration with A Timestep
Aligner [84.97253871387028]
数千のデノナイジングステップを用いて画像を生成するために定式化された拡散モデルは通常、遅い推論速度に悩まされる。
最小限のコストで特定の区間に対するより正確な積分方向を見つけるのに役立つ時間ステップ整合器を提案する。
実験により,我々のプラグイン設計を効率的に訓練し,様々な最先端加速度法の推論性能を向上できることが示された。
論文 参考訳(メタデータ) (2023-10-14T02:19:07Z) - Synthesizing Long-Term Human Motions with Diffusion Models via Coherent
Sampling [74.62570964142063]
テキスト・トゥ・モーション・ジェネレーションは注目されているが、既存の手法のほとんどは短期的な動きに限られている。
本稿では,2つのコヒーレントサンプリング手法を用いた過去の拡散モデルを用いた新しい手法を提案する。
提案手法は,ユーザの指示した長文ストリームによって制御された,構成的かつコヒーレントな3次元人間の動作を生成することができる。
論文 参考訳(メタデータ) (2023-08-03T16:18:32Z) - TEDi: Temporally-Entangled Diffusion for Long-Term Motion Synthesis [27.23431793291876]
運動系列の時間軸に段階的拡散の概念を適用することを提案する。
私たちのキーとなる考え方は、DDPMフレームワークを拡張して、時間的に異なるデノイングをサポートし、2つの軸を絡み合わせることです。
この新しいメカニズムは、キャラクターアニメーションや他のドメインへの応用により、長期動作合成のための新しいフレームワークへの道を開く。
論文 参考訳(メタデータ) (2023-07-27T17:48:44Z) - DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion [137.8749239614528]
そこで我々は,時間的行動検出(TAD)の新しい定式化を提案し,拡散を抑えるDiffTADを提案する。
入力されたランダムな時間的提案を考慮すれば、トリミングされていない長いビデオが与えられたアクションの提案を正確に得ることができる。
論文 参考訳(メタデータ) (2023-03-27T00:40:52Z) - Extracting Quantum Dynamical Resources: Consumption of Non-Markovianity
for Noise Reduction [0.0]
ノイズ抑制の鍵となるリソースは非マルコビアン性(あるいは時間的相関)であることを示す。
ノイズ低減のための最適パルス列を同定する2つの手法を提案する。
対応するツールは運用上の基盤の上に構築されており、現在の世代の量子デバイスで容易に実装できる。
論文 参考訳(メタデータ) (2021-10-06T09:31:34Z) - Noise Estimation for Generative Diffusion Models [91.22679787578438]
そこで本研究では,任意のステップの雑音パラメータを調整可能な,単純で汎用的な学習手法を提案する。
私たちのアプローチは計算コストが無視できるものです。
論文 参考訳(メタデータ) (2021-04-06T15:46:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。