Fugu-MT 論文翻訳(概要): Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic Detection of Infeasible Plans

論文の概要: Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic Detection of Infeasible Plans

arxiv url: http://arxiv.org/abs/2310.19427v1
Date: Mon, 30 Oct 2023 10:35:42 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-01 20:46:45.060901
Title: Refining Diffusion Planner for Reliable Behavior Synthesis by Automatic Detection of Infeasible Plans
Title（参考訳）: 不可能な平面の自動検出による信頼性挙動合成のための精製拡散プランナ
Authors: Kyowoon Lee, Seongun Kim and Jaesik Choi
Abstract要約: 拡散に基づくプランニングは、長期のスパースリワードタスクにおいて有望な結果を示している。しかし、生成モデルとしての性質のため、拡散モデルは実現可能な計画を生成することが保証されない。本稿では,拡散モデルが生成する信頼できない計画を改善するための新しい手法を提案する。
参考スコア（独自算出の注目度）: 25.326624139426514
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Diffusion-based planning has shown promising results in long-horizon, sparse-reward tasks by training trajectory diffusion models and conditioning the sampled trajectories using auxiliary guidance functions. However, due to their nature as generative models, diffusion models are not guaranteed to generate feasible plans, resulting in failed execution and precluding planners from being useful in safety-critical applications. In this work, we propose a novel approach to refine unreliable plans generated by diffusion models by providing refining guidance to error-prone plans. To this end, we suggest a new metric named restoration gap for evaluating the quality of individual plans generated by the diffusion model. A restoration gap is estimated by a gap predictor which produces restoration gap guidance to refine a diffusion planner. We additionally present an attribution map regularizer to prevent adversarial refining guidance that could be generated from the sub-optimal gap predictor, which enables further refinement of infeasible plans. We demonstrate the effectiveness of our approach on three different benchmarks in offline control settings that require long-horizon planning. We also illustrate that our approach presents explainability by presenting the attribution maps of the gap predictor and highlighting error-prone transitions, allowing for a deeper understanding of the generated plans.
Abstract（参考訳）: 拡散型計画法は, 軌道拡散モデルの訓練と補助誘導関数を用いたサンプル軌道の条件付けにより, 長期的, スパース・リワードタスクにおいて有望な結果を示した。しかし、生成モデルとしての性質から、拡散モデルは実現可能な計画を生成することが保証されていないため、実行が失敗し、プランナーが安全クリティカルな応用に役立ちなくなる。本研究では,拡散モデルが生み出す信頼できない計画を改善するための新しい手法を提案する。そこで本研究では,拡散モデルにより生成された個別計画の品質を評価するための,新たな修復ギャップを提案する。復元ギャップ誘導を生成するgap予測器により復元ギャップを推定し、拡散プランナーを精製する。さらに,サブ・オプティカル・ギャップ・予測器から発生する敵対的精錬指導を防止し,実現不可能な計画のさらなる洗練を可能にするアトリビューション・マップ・レギュラライザを提案する。提案手法は,長期計画を必要とするオフライン制御設定における3つのベンチマークの有効性を示す。また,提案手法は,差分予測器の帰属マップを提示し,誤り発生遷移を強調することにより説明可能性を示し,生成した計画のより深い理解を可能にする。

関連論文リスト

Aligning Latent Spaces with Flow Priors [72.24305287508474]
本稿では,学習可能な潜在空間を任意の目標分布に整合させるための新しいフレームワークを提案する。特に,提案手法は計算コストの高い確率評価を排除し,最適化時のODE解決を回避する。
論文参考訳（メタデータ） (2025-06-05T16:59:53Z)
Local Manifold Approximation and Projection for Manifold-Aware Diffusion Planning [23.945423041112036]
Local Manifold Approximation and Projection (LoMAP) は、オフラインデータセットから近似した低ランクのサブスペースにガイドされたサンプルを投影するトレーニング不要の手法である。階層型拡散プランナにLoMAPを組み込むことにより,さらなる性能向上が期待できることを示す。
論文参考訳（メタデータ） (2025-06-01T07:16:39Z)
Latent Diffusion Planning for Imitation Learning [78.56207566743154]
Latent Diffusion Planning (LDP) は、プランナーと逆ダイナミクスモデルからなるモジュラーアプローチである。行動予測からプランニングを分離することにより、LDPは最適なデータと行動自由データのより密集した監視信号の恩恵を受けることができる。シミュレーションされた視覚ロボット操作タスクにおいて、LDPは最先端の模倣学習アプローチより優れている。
論文参考訳（メタデータ） (2025-04-23T17:53:34Z)
What Makes a Good Diffusion Planner for Decision Making? [31.743124638746558]
我々は6000以上の拡散モデルのトレーニングと評価を行い、ガイド付きサンプリング、ネットワークアーキテクチャ、アクション生成、計画戦略などの重要なコンポーネントを特定した。拡散計画における従来の手法とは逆のデザイン選択によって、実際に性能が向上することが判明した。
論文参考訳（メタデータ） (2025-03-01T15:31:14Z)
Certified Guidance for Planning with Deep Generative Models [1.391198481393699]
計画目標を満たす可能性の高いアウトプットに向けて, 生産プロセスの舵取りとして, 様々なガイダンス戦略が導入されている。提案手法では,特定の仕様を確率1で満たすことが保証された新しいモデルに,生成モデルを再学習することなく修正する手法である認証ガイダンスを導入する。本研究の結果は,認定されていない既存の指導方法とは異なり,常に正しい生成モデルを生成することを確認した。
論文参考訳（メタデータ） (2025-01-22T11:46:28Z)
Dynamic Obstacle Avoidance through Uncertainty-Based Adaptive Planning with Diffusion [40.76697924496143]
本稿では,行動予測の不確実性に基づいた適応的生成計画手法を提案する。本手法は, 衝突回避性能を維持しつつ, 頻繁で計算コストが高く, 冗長な再計画の必要性を最小限に抑える。
論文参考訳（メタデータ） (2024-09-25T14:03:58Z)
Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文参考訳（メタデータ） (2024-05-29T01:32:17Z)
Resisting Stochastic Risks in Diffusion Planners with the Trajectory Aggregation Tree [20.855596726996712]
トラジェクトリー・アグリゲーション・ツリー(TAT)は、歴史的および現在のトラジェクトリーに基づく動的ツリーのような構造である。 TATは、拡散プランナーの元々のトレーニングやサンプリングパイプラインを変更することなく、デプロイできる。以上の結果から,信頼できない軌道からのリスクに抵抗し,100ドル以上の作業で拡散プランナーの性能向上を保証し,試料品質に対する許容許容限界を示し,3倍以上の加速で計画が可能であることが示唆された。
論文参考訳（メタデータ） (2024-05-28T06:57:22Z)
Simple Hierarchical Planning with Diffusion [54.48129192534653]
拡散に基づく生成法は、オフラインデータセットによる軌跡のモデリングに有効であることが証明されている。階層型および拡散型プランニングの利点を組み合わせた高速かつ驚くほど効果的な計画手法である階層型ディフューザを導入する。我々のモデルは、より高いレベルで「ジャンピー」な計画戦略を採用しており、より大きな受容場を持つことができるが、計算コストは低い。
論文参考訳（メタデータ） (2024-01-05T05:28:40Z)
Planning as In-Painting: A Diffusion-Based Embodied Task Planning Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。 In-paintingとしての計画」というタスク非依存の手法を提案する。提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-12-02T10:07:17Z)
SafeDiffuser: Safe Planning with Diffusion Probabilistic Models [97.80042457099718]
拡散モデルに基づくアプローチは、データ駆動計画において有望であるが、安全保証はない。我々は,拡散確率モデルが仕様を満たすことを保証するために,SafeDiffuserと呼ばれる新しい手法を提案する。提案手法は,迷路経路の生成,足歩行ロボットの移動,空間操作など,安全な計画作業の一連のテストを行う。
論文参考訳（メタデータ） (2023-05-31T19:38:12Z)
PDPP: Projected Diffusion for Procedure Planning in Instructional Videos [18.984980596601513]
本研究では,現在の視覚的観察と目的を考慮に入れた計画(一連の行動)の実現を目的とした指導ビデオにおけるプロシージャ計画の課題について検討する。以前の研究は、これをシーケンスモデリングの問題とみなし、中間的な視覚観察または言語指示を監督として活用した。自己回帰的に計画することによる中間的監視アノテーションやエラーの蓄積を回避するため,拡散型フレームワークを提案する。
論文参考訳（メタデータ） (2023-03-26T10:50:16Z)
Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文参考訳（メタデータ） (2022-05-20T07:02:03Z)
Counterfactual Plans under Distributional Ambiguity [12.139222986297263]
本研究では,モデルパラメータの分布を部分的に規定したモデル不確実性の下での対実計画について検討する。まず,不確実性定量化ツールを提案する。次に,有効性向上のための対策計画を調整するための補正方法を提案する。
論文参考訳（メタデータ） (2022-01-29T03:41:47Z)
Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文参考訳（メタデータ） (2020-10-26T16:00:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。