論文の概要: DiffuserLite: Towards Real-time Diffusion Planning
- arxiv url: http://arxiv.org/abs/2401.15443v1
- Date: Sat, 27 Jan 2024 15:30:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 18:29:34.422361
- Title: DiffuserLite: Towards Real-time Diffusion Planning
- Title(参考訳): DiffuserLite: リアルタイム拡散計画に向けて
- Authors: Zibin Dong, Jianye Hao, Yifu Yuan, Fei Ni, Yitian Wang, Pengyi Li and
Yan Zheng
- Abstract要約: 高速かつ軽量な拡散計画フレームワークであるdiffuserLiteを紹介する。
diffuserLiteは、粗い粒度の軌道を生成するために計画精錬プロセス(PRP)を使用している。
以上の結果から,diffuserLiteは従来のフレームワークと比較して,ランタイムコストの0.88%しか発生せず,平均決定周波数が122ドルHzに達し,D4RLベンチマークの最先端性能に達することがわかった。
- 参考スコア(独自算出の注目度): 41.93877074387615
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Diffusion planning has been recognized as an effective decision-making
paradigm in various domains. The high-quality conditional generation capability
of long-horizon trajectories makes it a promising research direction. However,
existing diffusion planning methods suffer from low decision-making frequencies
because of the expensive iterative sampling cost. To address this issue, we
introduce DiffuserLite, a fast and lightweight diffusion planning framework.
DiffuserLite employs a planning refinement process (PRP) to generate
coarse-to-fine-grained trajectories, which significantly reduces the modeling
of redundant information and leads to notable increases in decision-making
frequency. Our experimental results demonstrate that DiffuserLite incurs only
$0.88\%$ of the runtime cost compared to previous frameworks, achieves an
average decision-making frequency of $122$Hz, and reaches state-of-the-art
performance on D4RL benchmarks. In addition, our clean DiffuserLite framework
can serve as a flexible plugin to enhance decision frequency in other diffusion
planning algorithms, providing a structural design reference for future works.
More details and visualizations are available at [project
website](https://diffuserlite.github.io/).
- Abstract(参考訳): 拡散計画は様々な分野において効果的な意思決定パラダイムとして認識されている。
長距離軌道の高品質条件生成能力は、有望な研究方向となる。
しかし,既存の拡散計画手法では,反復サンプリングコストがかかるため,意思決定頻度が低くなっている。
この問題に対処するために、高速で軽量な拡散計画フレームワークであるDiffuserLiteを紹介します。
DiffuserLiteは計画改善プロセス(PRP)を用いて粗粒度トラジェクトリを生成し、冗長な情報のモデリングを大幅に削減し、意思決定頻度を著しく向上させる。
実験の結果,DiffuserLiteは従来のフレームワークと比較して,ランタイムコストの0.88\%しか発生せず,平均決定周波数が122$Hzに達し,D4RLベンチマークで最先端のパフォーマンスを達成した。
さらに、我々のクリーンなDiffuserLiteフレームワークは、他の拡散計画アルゴリズムにおける決定頻度を高めるフレキシブルなプラグインとして機能し、将来の作業のための構造設計リファレンスを提供する。
詳細と可視化はプロジェクトのwebサイト(https://diffuserlite.github.io/)で確認できる。
関連論文リスト
- Diffusion-TS: Interpretable Diffusion for General Time Series Generation [6.639630994040322]
Diffusion-TSは、高品質な時系列サンプルを生成する新しい拡散ベースのフレームワークである。
各拡散ステップのノイズの代わりにサンプルを直接再構成するようにモデルを訓練し、フーリエに基づく損失項を組み合わせた。
その結果,Diffusion-TSは時系列の様々な現実的解析において最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2024-03-04T05:39:23Z) - Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous
Driving and Zero-Shot Instruction Following [22.907995159434037]
Reward-gradient guided denoisingは、微分可能報酬関数と拡散モデルによって捕捉されたデータ分布下での確率の両方を最大化する軌道を生成する。
そこで我々は,勾配のない最適化と軌道デノゲーションを組み合わせたDiffusionESを提案する。
DiffusionESは、自動運転のための確立されたクローズドループ計画ベンチマークであるnuPlan上で、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-02-09T17:18:33Z) - SpecSTG: A Fast Spectral Diffusion Framework for Probabilistic
Spatio-Temporal Traffic Forecasting [32.290102818872526]
交通時間グラフ(STG)学習の重要な応用は、伝統的に正確な点推定のための決定論的モデルに依存してきた。
交通データに固有の空間依存性や系統的パターンをよりよく活用するための新しいスペクトル拡散フレームワークであるSpecSTGを提案する。
本研究では,未来時系列のフーリエ表現を生成し,学習過程を空間情報に富んだスペクトル領域に変換する。
論文 参考訳(メタデータ) (2024-01-16T05:23:34Z) - Towards More Accurate Diffusion Model Acceleration with A Timestep
Aligner [84.97253871387028]
数千のデノナイジングステップを用いて画像を生成するために定式化された拡散モデルは通常、遅い推論速度に悩まされる。
最小限のコストで特定の区間に対するより正確な積分方向を見つけるのに役立つ時間ステップ整合器を提案する。
実験により,我々のプラグイン設計を効率的に訓練し,様々な最先端加速度法の推論性能を向上できることが示された。
論文 参考訳(メタデータ) (2023-10-14T02:19:07Z) - DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion [137.8749239614528]
そこで我々は,時間的行動検出(TAD)の新しい定式化を提案し,拡散を抑えるDiffTADを提案する。
入力されたランダムな時間的提案を考慮すれば、トリミングされていない長いビデオが与えられたアクションの提案を正確に得ることができる。
論文 参考訳(メタデータ) (2023-03-27T00:40:52Z) - ReDi: Efficient Learning-Free Diffusion Inference via Trajectory
Retrieval [68.7008281316644]
ReDiは学習不要なRetrievalベースの拡散サンプリングフレームワークである。
ReDi はモデル推論効率を 2 倍高速化することを示した。
論文 参考訳(メタデータ) (2023-02-05T03:01:28Z) - ProDiff: Progressive Fast Diffusion Model For High-Quality
Text-to-Speech [63.780196620966905]
本稿では,高品質テキスト合成のためのプログレッシブ高速拡散モデルであるProDiffを提案する。
ProDiffはクリーンデータを直接予測することでデノナイジングモデルをパラメータ化し、サンプリングを高速化する際の品質劣化を回避する。
評価の結果,高忠実度メル-スペクトログラムの合成にProDiffは2回しか要しないことがわかった。
ProDiffは1つのNVIDIA 2080Ti GPU上で、サンプリング速度をリアルタイムより24倍高速にする。
論文 参考訳(メタデータ) (2022-07-13T17:45:43Z) - Subspace Diffusion Generative Models [4.310834990284412]
スコアベースモデルは、高次元拡散過程を通じて、ノイズをデータにマッピングすることでサンプルを生成する。
データ分布がノイズに向かって進化するにつれて、射影による部分空間への拡散を制限する。
私たちのフレームワークは継続的拡散と完全に互換性があり、柔軟性を維持しています。
論文 参考訳(メタデータ) (2022-05-03T13:43:47Z) - Truncated Diffusion Probabilistic Models and Diffusion-based Adversarial
Auto-Encoders [137.1060633388405]
拡散に基づく生成モデルは、逆拡散連鎖を推論してデータを生成する方法を学ぶ。
我々は、データが純粋なランダムノイズになるまで、より高速で安価にノイズを付加するアプローチを提案する。
提案手法は,拡散過程と学習可能な暗黙的前処理の両方によって付与された逆自動エンコーダとしてキャスト可能であることを示す。
論文 参考訳(メタデータ) (2022-02-19T20:18:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。