論文の概要: What Makes a Good Diffusion Planner for Decision Making?
- arxiv url: http://arxiv.org/abs/2503.00535v1
- Date: Sat, 01 Mar 2025 15:31:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:23:09.833154
- Title: What Makes a Good Diffusion Planner for Decision Making?
- Title(参考訳): 意思決定に良い拡散プランナーは何か?
- Authors: Haofei Lu, Dongqi Han, Yifei Shen, Dongsheng Li,
- Abstract要約: 我々は6000以上の拡散モデルのトレーニングと評価を行い、ガイド付きサンプリング、ネットワークアーキテクチャ、アクション生成、計画戦略などの重要なコンポーネントを特定した。
拡散計画における従来の手法とは逆のデザイン選択によって、実際に性能が向上することが判明した。
- 参考スコア(独自算出の注目度): 31.743124638746558
- License:
- Abstract: Diffusion models have recently shown significant potential in solving decision-making problems, particularly in generating behavior plans -- also known as diffusion planning. While numerous studies have demonstrated the impressive performance of diffusion planning, the mechanisms behind the key components of a good diffusion planner remain unclear and the design choices are highly inconsistent in existing studies. In this work, we address this issue through systematic empirical experiments on diffusion planning in an offline reinforcement learning (RL) setting, providing practical insights into the essential components of diffusion planning. We trained and evaluated over 6,000 diffusion models, identifying the critical components such as guided sampling, network architecture, action generation and planning strategy. We revealed that some design choices opposite to the common practice in previous work in diffusion planning actually lead to better performance, e.g., unconditional sampling with selection can be better than guided sampling and Transformer outperforms U-Net as denoising network. Based on these insights, we suggest a simple yet strong diffusion planning baseline that achieves state-of-the-art results on standard offline RL benchmarks.
- Abstract(参考訳): 拡散モデルは最近、意思決定問題、特に拡散計画(英語版)として知られる行動計画の生成において大きな可能性を示している。
多くの研究が拡散計画の顕著な性能を実証しているが、優れた拡散計画立案者の鍵となる構成要素の背後にあるメカニズムはいまだ不明であり、既存の研究には非常に矛盾する設計選択である。
本研究では、オフライン強化学習(RL)環境での拡散計画に関する系統的な実証実験を通じてこの問題に対処し、拡散計画の本質的な構成要素に関する実践的な洞察を提供する。
我々は6000以上の拡散モデルの訓練と評価を行い、ガイド付きサンプリング、ネットワークアーキテクチャ、アクション生成、計画戦略などの重要なコンポーネントを特定した。
拡散計画における従来の手法とは対照的な設計選択は、例えば、選択による無条件サンプリングの方が、誘導サンプリングよりも優れた性能を示し、Transformerは、U-Netをデノナイズネットワークとして優れていることを示した。
これらの知見に基づき、標準的なオフラインRLベンチマークで最先端の結果を得るための、単純ながら強力な拡散計画ベースラインを提案する。
関連論文リスト
- Habitizing Diffusion Planning for Efficient and Effective Decision Making [41.128266491447334]
強力だが遅い拡散計画モデルを高速な意思決定モデルに変換するフレームワークであるHabiを紹介します。
ラップトップのCPUを使っても、習慣化されたモデルは平均800Hz以上の意思決定周波数を達成できる。
論文 参考訳(メタデータ) (2025-02-10T12:40:32Z) - Improved Noise Schedule for Diffusion Training [51.849746576387375]
本稿では,拡散モデルのトレーニングを強化するため,ノイズスケジュールを設計するための新しい手法を提案する。
我々は,標準のコサインスケジュールよりもノイズスケジュールの方が優れていることを実証的に示す。
論文 参考訳(メタデータ) (2024-07-03T17:34:55Z) - Diffusion Models in Low-Level Vision: A Survey [82.77962165415153]
拡散モデルに基づくソリューションは、優れた品質と多様性のサンプルを作成する能力で広く称賛されている。
本稿では,3つの一般化拡散モデリングフレームワークを提案し,それらと他の深層生成モデルとの相関関係について検討する。
医療、リモートセンシング、ビデオシナリオなど、他のタスクに適用された拡張拡散モデルについて要約する。
論文 参考訳(メタデータ) (2024-06-17T01:49:27Z) - DiffuserLite: Towards Real-time Diffusion Planning [39.93614402208524]
超高速で軽量な拡散計画フレームワークを導入し,計画修正プロセス(PRP)を用いて粗粒度軌道を生成する。
実験により、diffuserLiteは122.2Hzの判定周波数を実現し、D4RL, Robomimic, FinRLベンチマークで最先端の性能を達成した。
さらにdiffuserLiteは、他の拡散計画アルゴリズムの意思決定頻度を高めるための柔軟なプラグインとしても機能する。
論文 参考訳(メタデータ) (2024-01-27T15:30:49Z) - Simple Hierarchical Planning with Diffusion [54.48129192534653]
拡散に基づく生成法は、オフラインデータセットによる軌跡のモデリングに有効であることが証明されている。
階層型および拡散型プランニングの利点を組み合わせた高速かつ驚くほど効果的な計画手法である階層型ディフューザを導入する。
我々のモデルは、より高いレベルで「ジャンピー」な計画戦略を採用しており、より大きな受容場を持つことができるが、計算コストは低い。
論文 参考訳(メタデータ) (2024-01-05T05:28:40Z) - Guided Diffusion from Self-Supervised Diffusion Features [49.78673164423208]
ガイダンスは拡散モデルにおいて重要な概念として機能するが、その効果は追加のデータアノテーションや事前学習の必要性によって制限されることが多い。
本稿では,拡散モデルからガイダンスを抽出するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-14T11:19:11Z) - Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic
Detection of Infeasible Plans [25.326624139426514]
拡散に基づくプランニングは、長期のスパースリワードタスクにおいて有望な結果を示している。
しかし、生成モデルとしての性質のため、拡散モデルは実現可能な計画を生成することが保証されない。
本稿では,拡散モデルが生成する信頼できない計画を改善するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T10:35:42Z) - Phasic Content Fusing Diffusion Model with Directional Distribution
Consistency for Few-Shot Model Adaption [73.98706049140098]
本稿では,方向分布の整合性を損なう少数ショット拡散モデルを用いた新しいファシックコンテンツを提案する。
具体的には、ファシックコンテンツ融合を用いたファシックトレーニング戦略を設計し、tが大きければ、モデルがコンテンツやスタイル情報を学ぶのに役立てる。
最後に、ドメイン適応時の構造整合性を高めるクロスドメイン構造ガイダンス戦略を提案する。
論文 参考訳(メタデータ) (2023-09-07T14:14:11Z) - Motion Planning Diffusion: Learning and Planning of Robot Motions with Diffusion Models [14.171207239507789]
新しい計画問題の先駆者として軌道生成モデルを学習することが極めて望ましい。
本研究では,移動計画問題のブートストラッピングに先立って,学習拡散モデルを提案する。
本研究では,ロボット運動の高次元軌跡分布を符号化する拡散モデルについて検討した。
論文 参考訳(メタデータ) (2023-08-03T06:36:21Z) - On the Design Fundamentals of Diffusion Models: A Survey [9.183452635904278]
我々は,このレビューを,前処理,逆処理,サンプリング手順という3つの重要なコンポーネントに従って整理する。
これにより,各コンポーネントの分析,設計選択の適用性,拡散モデルの実装に関する今後の研究の恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-06-07T15:46:47Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。