論文の概要: Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic
Detection of Infeasible Plans
- arxiv url: http://arxiv.org/abs/2310.19427v1
- Date: Mon, 30 Oct 2023 10:35:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 20:46:45.060901
- Title: Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic
Detection of Infeasible Plans
- Title(参考訳): 不可能な平面の自動検出による信頼性挙動合成のための精製拡散プランナ
- Authors: Kyowoon Lee, Seongun Kim and Jaesik Choi
- Abstract要約: 拡散に基づくプランニングは、長期のスパースリワードタスクにおいて有望な結果を示している。
しかし、生成モデルとしての性質のため、拡散モデルは実現可能な計画を生成することが保証されない。
本稿では,拡散モデルが生成する信頼できない計画を改善するための新しい手法を提案する。
- 参考スコア(独自算出の注目度): 25.326624139426514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion-based planning has shown promising results in long-horizon,
sparse-reward tasks by training trajectory diffusion models and conditioning
the sampled trajectories using auxiliary guidance functions. However, due to
their nature as generative models, diffusion models are not guaranteed to
generate feasible plans, resulting in failed execution and precluding planners
from being useful in safety-critical applications. In this work, we propose a
novel approach to refine unreliable plans generated by diffusion models by
providing refining guidance to error-prone plans. To this end, we suggest a new
metric named restoration gap for evaluating the quality of individual plans
generated by the diffusion model. A restoration gap is estimated by a gap
predictor which produces restoration gap guidance to refine a diffusion
planner. We additionally present an attribution map regularizer to prevent
adversarial refining guidance that could be generated from the sub-optimal gap
predictor, which enables further refinement of infeasible plans. We demonstrate
the effectiveness of our approach on three different benchmarks in offline
control settings that require long-horizon planning. We also illustrate that
our approach presents explainability by presenting the attribution maps of the
gap predictor and highlighting error-prone transitions, allowing for a deeper
understanding of the generated plans.
- Abstract(参考訳): 拡散型計画法は, 軌道拡散モデルの訓練と補助誘導関数を用いたサンプル軌道の条件付けにより, 長期的, スパース・リワードタスクにおいて有望な結果を示した。
しかし、生成モデルとしての性質から、拡散モデルは実現可能な計画を生成することが保証されていないため、実行が失敗し、プランナーが安全クリティカルな応用に役立ちなくなる。
本研究では,拡散モデルが生み出す信頼できない計画を改善するための新しい手法を提案する。
そこで本研究では,拡散モデルにより生成された個別計画の品質を評価するための,新たな修復ギャップを提案する。
復元ギャップ誘導を生成するgap予測器により復元ギャップを推定し、拡散プランナーを精製する。
さらに,サブ・オプティカル・ギャップ・予測器から発生する敵対的精錬指導を防止し,実現不可能な計画のさらなる洗練を可能にするアトリビューション・マップ・レギュラライザを提案する。
提案手法は,長期計画を必要とするオフライン制御設定における3つのベンチマークの有効性を示す。
また,提案手法は,差分予測器の帰属マップを提示し,誤り発生遷移を強調することにより説明可能性を示し,生成した計画のより深い理解を可能にする。
関連論文リスト
- Dynamic Obstacle Avoidance through Uncertainty-Based Adaptive Planning with Diffusion [40.76697924496143]
本稿では,行動予測の不確実性に基づいた適応的生成計画手法を提案する。
本手法は, 衝突回避性能を維持しつつ, 頻繁で計算コストが高く, 冗長な再計画の必要性を最小限に抑える。
論文 参考訳(メタデータ) (2024-09-25T14:03:58Z) - Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Resisting Stochastic Risks in Diffusion Planners with the Trajectory Aggregation Tree [20.855596726996712]
トラジェクトリー・アグリゲーション・ツリー(TAT)は、歴史的および現在のトラジェクトリーに基づく動的ツリーのような構造である。
TATは、拡散プランナーの元々のトレーニングやサンプリングパイプラインを変更することなく、デプロイできる。
以上の結果から,信頼できない軌道からのリスクに抵抗し,100ドル以上の作業で拡散プランナーの性能向上を保証し,試料品質に対する許容許容限界を示し,3倍以上の加速で計画が可能であることが示唆された。
論文 参考訳(メタデータ) (2024-05-28T06:57:22Z) - Simple Hierarchical Planning with Diffusion [54.48129192534653]
拡散に基づく生成法は、オフラインデータセットによる軌跡のモデリングに有効であることが証明されている。
階層型および拡散型プランニングの利点を組み合わせた高速かつ驚くほど効果的な計画手法である階層型ディフューザを導入する。
我々のモデルは、より高いレベルで「ジャンピー」な計画戦略を採用しており、より大きな受容場を持つことができるが、計算コストは低い。
論文 参考訳(メタデータ) (2024-01-05T05:28:40Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - SafeDiffuser: Safe Planning with Diffusion Probabilistic Models [97.80042457099718]
拡散モデルに基づくアプローチは、データ駆動計画において有望であるが、安全保証はない。
我々は,拡散確率モデルが仕様を満たすことを保証するために,SafeDiffuserと呼ばれる新しい手法を提案する。
提案手法は,迷路経路の生成,足歩行ロボットの移動,空間操作など,安全な計画作業の一連のテストを行う。
論文 参考訳(メタデータ) (2023-05-31T19:38:12Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Counterfactual Plans under Distributional Ambiguity [12.139222986297263]
本研究では,モデルパラメータの分布を部分的に規定したモデル不確実性の下での対実計画について検討する。
まず,不確実性定量化ツールを提案する。
次に,有効性向上のための対策計画を調整するための補正方法を提案する。
論文 参考訳(メタデータ) (2022-01-29T03:41:47Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。