Fugu-MT 論文翻訳(概要): DiffuserLite: Towards Real-time Diffusion Planning

論文の概要: DiffuserLite: Towards Real-time Diffusion Planning

arxiv url: http://arxiv.org/abs/2401.15443v1
Date: Sat, 27 Jan 2024 15:30:49 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-30 18:29:34.422361
Title: DiffuserLite: Towards Real-time Diffusion Planning
Title（参考訳）: DiffuserLite: リアルタイム拡散計画に向けて
Authors: Zibin Dong, Jianye Hao, Yifu Yuan, Fei Ni, Yitian Wang, Pengyi Li and Yan Zheng
Abstract要約: 高速かつ軽量な拡散計画フレームワークであるdiffuserLiteを紹介する。 diffuserLiteは、粗い粒度の軌道を生成するために計画精錬プロセス(PRP)を使用している。以上の結果から,diffuserLiteは従来のフレームワークと比較して,ランタイムコストの0.88%しか発生せず,平均決定周波数が122ドルHzに達し,D4RLベンチマークの最先端性能に達することがわかった。
参考スコア（独自算出の注目度）: 41.93877074387615
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Diffusion planning has been recognized as an effective decision-making paradigm in various domains. The high-quality conditional generation capability of long-horizon trajectories makes it a promising research direction. However, existing diffusion planning methods suffer from low decision-making frequencies because of the expensive iterative sampling cost. To address this issue, we introduce DiffuserLite, a fast and lightweight diffusion planning framework. DiffuserLite employs a planning refinement process (PRP) to generate coarse-to-fine-grained trajectories, which significantly reduces the modeling of redundant information and leads to notable increases in decision-making frequency. Our experimental results demonstrate that DiffuserLite incurs only $0.88\%$ of the runtime cost compared to previous frameworks, achieves an average decision-making frequency of $122$Hz, and reaches state-of-the-art performance on D4RL benchmarks. In addition, our clean DiffuserLite framework can serve as a flexible plugin to enhance decision frequency in other diffusion planning algorithms, providing a structural design reference for future works. More details and visualizations are available at [project website](https://diffuserlite.github.io/).
Abstract（参考訳）: 拡散計画は様々な分野において効果的な意思決定パラダイムとして認識されている。長距離軌道の高品質条件生成能力は、有望な研究方向となる。しかし,既存の拡散計画手法では,反復サンプリングコストがかかるため,意思決定頻度が低くなっている。この問題に対処するために、高速で軽量な拡散計画フレームワークであるDiffuserLiteを紹介します。 DiffuserLiteは計画改善プロセス(PRP)を用いて粗粒度トラジェクトリを生成し、冗長な情報のモデリングを大幅に削減し、意思決定頻度を著しく向上させる。実験の結果,DiffuserLiteは従来のフレームワークと比較して,ランタイムコストの0.88\%しか発生せず,平均決定周波数が122$Hzに達し,D4RLベンチマークで最先端のパフォーマンスを達成した。さらに、我々のクリーンなDiffuserLiteフレームワークは、他の拡散計画アルゴリズムにおける決定頻度を高めるフレキシブルなプラグインとして機能し、将来の作業のための構造設計リファレンスを提供する。詳細と可視化はプロジェクトのwebサイト(https://diffuserlite.github.io/)で確認できる。

関連論文リスト

Adaptive Spectral Feature Forecasting for Diffusion Sampling Acceleration [58.19554276924402]
スペクトル拡散特徴予測器(Spectrum)を提案する。我々はFLUX.1で4.79$times$スピードアップ、Wan2.1-14Bで4.67$times$スピードアップを達成する。
論文参考訳（メタデータ） (2026-03-02T08:59:11Z)
Improved Immiscible Diffusion: Accelerate Diffusion Training by Reducing Its Miscibility [62.272571285823595]
不和がいかに軽視し、効率を向上するかを示す。そこで本稿では,K-nearest neighbor (KNN) ノイズ選択や画像スケーリングなどの実装のファミリを提案する。この研究は、今後の高効率拡散訓練研究の新たな方向性を確立する。
論文参考訳（メタデータ） (2025-05-24T05:38:35Z)
Extendable Long-Horizon Planning via Hierarchical Multiscale Diffusion [62.91968752955649]
本稿では,学習データよりも長い軌道計画を行うための,拡張可能な長期計画支援エージェントの課題に対処する。より短いものを縫い合わせることで、より長い軌跡を反復的に生成する拡張法を提案する。 HM-ディフューザーは階層構造を用いてこれらの拡張軌道を訓練し、複数の時間スケールにわたるタスクを効率的に処理する。
論文参考訳（メタデータ） (2025-03-25T22:52:46Z)
What Makes a Good Diffusion Planner for Decision Making? [31.743124638746558]
我々は6000以上の拡散モデルのトレーニングと評価を行い、ガイド付きサンプリング、ネットワークアーキテクチャ、アクション生成、計画戦略などの重要なコンポーネントを特定した。拡散計画における従来の手法とは逆のデザイン選択によって、実際に性能が向上することが判明した。
論文参考訳（メタデータ） (2025-03-01T15:31:14Z)
Habitizing Diffusion Planning for Efficient and Effective Decision Making [41.128266491447334]
強力だが遅い拡散計画モデルを高速な意思決定モデルに変換するフレームワークであるHabiを紹介します。ラップトップのCPUを使っても、習慣化されたモデルは平均800Hz以上の意思決定周波数を達成できる。
論文参考訳（メタデータ） (2025-02-10T12:40:32Z)
Diffusion Meets Options: Hierarchical Generative Skill Composition for Temporally-Extended Tasks [12.239868705130178]
線形時間論理(LTL)によって規定された命令に基づいて計画の生成と更新を行うデータ駆動階層型フレームワークを提案する。提案手法は,オフラインの非専門家データセットから階層的強化学習を用いて,時間的タスクを選択肢の連鎖に分解する。バッチ生成における行列誘導後サンプリング手法を考案し,拡散生成オプションの速度と多様性を向上する。
論文参考訳（メタデータ） (2024-10-03T11:10:37Z)
One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文参考訳（メタデータ） (2024-08-14T11:47:22Z)
Diffusion Models as Optimizers for Efficient Planning in Offline RL [47.0835433289033]
拡散モデルはオフラインの強化学習タスクにおいて強い競争力を示している。本稿では,より高速な自己回帰モデルを提案する。これにより、能力を犠牲にすることなく、より効率的な計画を達成することができます。
論文参考訳（メタデータ） (2024-07-23T03:00:01Z)
Improved Noise Schedule for Diffusion Training [51.849746576387375]
本稿では,拡散モデルのトレーニングを強化するため,ノイズスケジュールを設計するための新しい手法を提案する。我々は,標準のコサインスケジュールよりもノイズスケジュールの方が優れていることを実証的に示す。
論文参考訳（メタデータ） (2024-07-03T17:34:55Z)
Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous Driving and Zero-Shot Instruction Following [21.81411085058986]
Reward-gradient guided denoisingは、微分可能報酬関数と拡散モデルによって捕捉されたデータ分布下での確率の両方を最大化する軌道を生成する。そこで我々は,勾配のない最適化と軌道デノゲーションを組み合わせたDiffusionESを提案する。 DiffusionESは、自動運転のための確立されたクローズドループ計画ベンチマークであるnuPlan上で、最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2024-02-09T17:18:33Z)
SpecSTG: A Fast Spectral Diffusion Framework for Probabilistic Spatio-Temporal Traffic Forecasting [29.55810183838032]
SpecSTGはトラフィック時間グラフ学習のための新しいスペクトル拡散フレームワークである。将来の時系列のフーリエ表現を生成し、学習プロセスを空間情報に富んだスペクトル領域に変換する。最先端技術と比較すると、SpecSTGはポイント推定において最大8%の改善を達成し、将来の不確実性を定量化するために最大0.78%の改善を達成している。
論文参考訳（メタデータ） (2024-01-16T05:23:34Z)
Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文参考訳（メタデータ） (2023-06-01T03:08:28Z)
Where to Diffuse, How to Diffuse, and How to Get Back: Automated Learning for Multivariate Diffusions [22.04182099405728]
拡散に基づく生成モデル(DBGM)は、ターゲット雑音分布に摂動データを変換し、この推論拡散過程を逆にしてサンプルを生成する。補助変数の数に対して、低いバウンドを最大化する方法を示す。次に,特定対象雑音分布の拡散をパラメータ化する方法を示す。
論文参考訳（メタデータ） (2023-02-14T18:57:04Z)
ProDiff: Progressive Fast Diffusion Model For High-Quality Text-to-Speech [63.780196620966905]
本稿では,高品質テキスト合成のためのプログレッシブ高速拡散モデルであるProDiffを提案する。 ProDiffはクリーンデータを直接予測することでデノナイジングモデルをパラメータ化し、サンプリングを高速化する際の品質劣化を回避する。評価の結果,高忠実度メル-スペクトログラムの合成にProDiffは2回しか要しないことがわかった。 ProDiffは1つのNVIDIA 2080Ti GPU上で、サンプリング速度をリアルタイムより24倍高速にする。
論文参考訳（メタデータ） (2022-07-13T17:45:43Z)
Diffusion-GAN: Training GANs with Diffusion [135.24433011977874]
GAN(Generative Adversarial Network)は、安定してトレーニングすることが難しい。フォワード拡散チェーンを利用してインスタンスノイズを生成する新しいGANフレームワークであるDiffusion-GANを提案する。我々は,Diffusion-GANにより,最先端のGANよりも高い安定性とデータ効率で,よりリアルな画像を生成することができることを示す。
論文参考訳（メタデータ） (2022-06-05T20:45:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。