論文の概要: Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic
Detection of Infeasible Plans
- arxiv url: http://arxiv.org/abs/2310.19427v1
- Date: Mon, 30 Oct 2023 10:35:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 20:46:45.060901
- Title: Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic
Detection of Infeasible Plans
- Title(参考訳): 不可能な平面の自動検出による信頼性挙動合成のための精製拡散プランナ
- Authors: Kyowoon Lee, Seongun Kim and Jaesik Choi
- Abstract要約: 拡散に基づくプランニングは、長期のスパースリワードタスクにおいて有望な結果を示している。
しかし、生成モデルとしての性質のため、拡散モデルは実現可能な計画を生成することが保証されない。
本稿では,拡散モデルが生成する信頼できない計画を改善するための新しい手法を提案する。
- 参考スコア(独自算出の注目度): 25.326624139426514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion-based planning has shown promising results in long-horizon,
sparse-reward tasks by training trajectory diffusion models and conditioning
the sampled trajectories using auxiliary guidance functions. However, due to
their nature as generative models, diffusion models are not guaranteed to
generate feasible plans, resulting in failed execution and precluding planners
from being useful in safety-critical applications. In this work, we propose a
novel approach to refine unreliable plans generated by diffusion models by
providing refining guidance to error-prone plans. To this end, we suggest a new
metric named restoration gap for evaluating the quality of individual plans
generated by the diffusion model. A restoration gap is estimated by a gap
predictor which produces restoration gap guidance to refine a diffusion
planner. We additionally present an attribution map regularizer to prevent
adversarial refining guidance that could be generated from the sub-optimal gap
predictor, which enables further refinement of infeasible plans. We demonstrate
the effectiveness of our approach on three different benchmarks in offline
control settings that require long-horizon planning. We also illustrate that
our approach presents explainability by presenting the attribution maps of the
gap predictor and highlighting error-prone transitions, allowing for a deeper
understanding of the generated plans.
- Abstract(参考訳): 拡散型計画法は, 軌道拡散モデルの訓練と補助誘導関数を用いたサンプル軌道の条件付けにより, 長期的, スパース・リワードタスクにおいて有望な結果を示した。
しかし、生成モデルとしての性質から、拡散モデルは実現可能な計画を生成することが保証されていないため、実行が失敗し、プランナーが安全クリティカルな応用に役立ちなくなる。
本研究では,拡散モデルが生み出す信頼できない計画を改善するための新しい手法を提案する。
そこで本研究では,拡散モデルにより生成された個別計画の品質を評価するための,新たな修復ギャップを提案する。
復元ギャップ誘導を生成するgap予測器により復元ギャップを推定し、拡散プランナーを精製する。
さらに,サブ・オプティカル・ギャップ・予測器から発生する敵対的精錬指導を防止し,実現不可能な計画のさらなる洗練を可能にするアトリビューション・マップ・レギュラライザを提案する。
提案手法は,長期計画を必要とするオフライン制御設定における3つのベンチマークの有効性を示す。
また,提案手法は,差分予測器の帰属マップを提示し,誤り発生遷移を強調することにより説明可能性を示し,生成した計画のより深い理解を可能にする。
関連論文リスト
- Simple Hierarchical Planning with Diffusion [54.48129192534653]
拡散に基づく生成法は、オフラインデータセットによる軌跡のモデリングに有効であることが証明されている。
階層型および拡散型プランニングの利点を組み合わせた高速かつ驚くほど効果的な計画手法である階層型ディフューザを導入する。
我々のモデルは、より高いレベルで「ジャンピー」な計画戦略を採用しており、より大きな受容場を持つことができるが、計算コストは低い。
論文 参考訳(メタデータ) (2024-01-05T05:28:40Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - SafeDiffuser: Safe Planning with Diffusion Probabilistic Models [97.80042457099718]
拡散モデルに基づくアプローチは、データ駆動計画において有望であるが、安全保証はない。
我々は,拡散確率モデルが仕様を満たすことを保証するために,SafeDiffuserと呼ばれる新しい手法を提案する。
提案手法は,迷路経路の生成,足歩行ロボットの移動,空間操作など,安全な計画作業の一連のテストを行う。
論文 参考訳(メタデータ) (2023-05-31T19:38:12Z) - Planning with Occluded Traffic Agents using Bi-Level Variational
Occlusion Models [37.09462631862042]
閉鎖された交通機関との推論は、自動運転車の計画にとって大きなオープンな課題である。
近年のディープラーニングモデルでは、近隣の可視エージェントの挙動に基づいた隠蔽エージェントの予測に顕著な結果が示されている。
まず, 隠蔽剤の位置を予測し, 隠蔽剤の軌跡を推定する2段階生成モデルであるBi-level Variational Occlusion Models (BiVO)を提案する。
論文 参考訳(メタデータ) (2022-10-26T09:39:31Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Counterfactual Plans under Distributional Ambiguity [12.139222986297263]
本研究では,モデルパラメータの分布を部分的に規定したモデル不確実性の下での対実計画について検討する。
まず,不確実性定量化ツールを提案する。
次に,有効性向上のための対策計画を調整するための補正方法を提案する。
論文 参考訳(メタデータ) (2022-01-29T03:41:47Z) - Differentiable Spatial Planning using Transformers [87.90709874369192]
本研究では、長距離空間依存を計画して行動を生成する障害マップを与えられた空間計画変換器(SPT)を提案する。
エージェントが地上の真理マップを知らない環境では、エンド・ツー・エンドのフレームワークで事前訓練されたSPTを利用する。
SPTは、操作タスクとナビゲーションタスクの両方のすべてのセットアップにおいて、最先端の差別化可能なプランナーよりも優れています。
論文 参考訳(メタデータ) (2021-12-02T06:48:16Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。