論文の概要: Efficient Diffusion Planning with Temporal Diffusion
- arxiv url: http://arxiv.org/abs/2511.21054v1
- Date: Wed, 26 Nov 2025 04:45:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:58.969602
- Title: Efficient Diffusion Planning with Temporal Diffusion
- Title(参考訳): 時間的拡散を考慮した効率的な拡散計画法
- Authors: Jiaming Guo, Rui Zhang, Zerun Li, Yunkai Gao, Shaohui Peng, Siming Lan, Xing Hu, Zidong Du, Xishan Zhang, Ling Li,
- Abstract要約: 拡散計画はオフラインデータから高性能なポリシーを学ぶための有望な方法である。
以前の作業は、計画とパフォーマンスの現実の相違を避けるために、各ステップで新しい計画を生成する。
本稿では,時間次元に偏極ステップを分散させることにより決定効率を向上させる時間拡散プランナ(TDP)を提案する。
- 参考スコア(独自算出の注目度): 25.738333851334414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion planning is a promising method for learning high-performance policies from offline data. To avoid the impact of discrepancies between planning and reality on performance, previous works generate new plans at each time step. However, this incurs significant computational overhead and leads to lower decision frequencies, and frequent plan switching may also affect performance. In contrast, humans might create detailed short-term plans and more general, sometimes vague, long-term plans, and adjust them over time. Inspired by this, we propose the Temporal Diffusion Planner (TDP) which improves decision efficiency by distributing the denoising steps across the time dimension. TDP begins by generating an initial plan that becomes progressively more vague over time. At each subsequent time step, rather than generating an entirely new plan, TDP updates the previous one with a small number of denoising steps. This reduces the average number of denoising steps, improving decision efficiency. Additionally, we introduce an automated replanning mechanism to prevent significant deviations between the plan and reality. Experiments on D4RL show that, compared to previous works that generate new plans every time step, TDP improves the decision-making frequency by 11-24.8 times while achieving higher or comparable performance.
- Abstract(参考訳): 拡散計画はオフラインデータから高性能なポリシーを学ぶための有望な方法である。
計画と現実の相違がパフォーマンスに与える影響を避けるため、前の作業では各ステップで新しい計画を生成する。
しかし、これは計算オーバーヘッドが大きくなり、決定頻度が低下し、頻繁に計画の変更が性能に影響を及ぼす可能性がある。
対照的に、人間は詳細な短期計画を作成し、より一般的に、時には曖昧で長期計画を作成し、時間とともに調整する。
そこで本研究では,時間次元をまたいだデノナイジングステップの分散による意思決定効率の向上を目的とした時間拡散プランナを提案する。
TDPは、時間とともに徐々に曖昧になる初期計画を生成することから始まる。
その後のステップごとに、完全に新しいプランを生成するのではなく、TDPは、少数のデノベーションステップで前のステップを更新します。
これにより、デノベーションステップの平均数が減少し、意思決定効率が向上します。
さらに,計画と現実の間に大きなずれを生じさせないよう,自動的な計画変更機構を導入する。
D4RLの実験では、TDPは、毎回新しい計画を生成する以前の研究と比べて、意思決定の頻度を11~24.8倍改善し、より高いまたは同等のパフォーマンスを達成した。
関連論文リスト
- Mixed-Density Diffuser: Efficient Planning with Non-uniform Temporal Resolution [1.1172382217477128]
トラジェクトリのステップをスキップするトレーニングモデルは、追加やメモリ計算コストなしで長期的な依存関係をキャプチャするのに役立つ。
我々は、この時間密度閾値は時間的地平線を越えて不均一であり、計画された軌道の一部がより密に計画されるべきであると仮定する。
論文 参考訳(メタデータ) (2025-10-27T05:45:59Z) - DeepPlanner: Scaling Planning Capability for Deep Research Agents via Advantage Shaping [74.34061104176554]
我々は、ディープリサーチエージェントの計画能力を効果的に向上するエンドツーエンドのRLフレームワークであるDeepPlannerを提案する。
提案手法は,高エントロピートークンの大幅な更新を割り当てるエントロピーに基づく用語を用いてトークンレベルの優位性を形作るとともに,計画集約ロールアウトに対するサンプルレベルの優位性を選択的に向上させる。
論文 参考訳(メタデータ) (2025-10-14T20:47:05Z) - Real-Time Iteration Scheme for Diffusion Policy [23.124189676943757]
本稿では,RTI(Real-Time Iteration)スキームにインスパイアされた新しい手法を導入し,推論を高速化する。
本稿では,ロボット操作における把握などの離散的な動作を効果的に扱うためのスケーリング手法を提案する。
提案方式は蒸留や政策の再設計を必要とせず,実行時の計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2025-08-07T13:49:00Z) - Extendable Long-Horizon Planning via Hierarchical Multiscale Diffusion [62.91968752955649]
本稿では,学習データよりも長い軌道計画を行うための,拡張可能な長期計画支援エージェントの課題に対処する。
より短いものを縫い合わせることで、より長い軌跡を反復的に生成する拡張法を提案する。
HM-ディフューザーは階層構造を用いてこれらの拡張軌道を訓練し、複数の時間スケールにわたるタスクを効率的に処理する。
論文 参考訳(メタデータ) (2025-03-25T22:52:46Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Tree-Planner: Efficient Close-loop Task Planning with Large Language Models [63.06270302774049]
Tree-Plannerは、大きな言語モデルでタスクプランニングを3つの異なるフェーズに再構成する。
Tree-Plannerは高い効率を維持しながら最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-10-12T17:59:50Z) - The Update-Equivalence Framework for Decision-Time Planning [78.44953498421854]
本稿では,サブゲームの解決ではなく,更新等価性に基づく意思決定時計画のための代替フレームワークを提案する。
ミラー降下に基づく完全協調型ゲームに対する有効音声探索アルゴリズムと、磁気ミラー降下に基づく対戦型ゲームに対する探索アルゴリズムを導出する。
論文 参考訳(メタデータ) (2023-04-25T20:28:55Z) - Efficient Belief Space Planning in High-Dimensional State Spaces using
PIVOT: Predictive Incremental Variable Ordering Tactic [11.878820609988693]
我々は,不確実性の下でのオンライン意思決定の問題点を考察し,信頼空間における計画として定式化する。
このアプローチを PIVOT: Predictive Incremental Variable Ordering Tactic と呼ぶ。
この戦術を適用することで、状態推論の効率も向上する。
論文 参考訳(メタデータ) (2021-12-29T07:30:47Z) - Efficient Temporal Piecewise-Linear Numeric Planning with Lazy
Consistency Checking [4.834203844100679]
本稿では,プランナがLP整合性チェックを可能な限り遅延的に計算できる手法を提案する。
また,時間依存ゴールチェックをより選択的に行うアルゴリズムを提案する。
結果として得られるプランナーは、より効率的であるだけでなく、最先端の時間数値とハイブリッドプランナーよりも優れています。
論文 参考訳(メタデータ) (2021-05-21T07:36:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。