論文の概要: Closed-Loop Action Chunks with Dynamic Corrections for Training-Free Diffusion Policy
- arxiv url: http://arxiv.org/abs/2603.01953v1
- Date: Mon, 02 Mar 2026 15:04:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.92907
- Title: Closed-Loop Action Chunks with Dynamic Corrections for Training-Free Diffusion Policy
- Title(参考訳): 動的補正を施した閉ループ動作チャンクの学習自由拡散政策への応用
- Authors: Pengyuan Wu, Pingrui Zhang, Zhigang Wang, Dong Wang, Bin Zhao, Xuelong Li,
- Abstract要約: 我々は,チャンクベースのアクション生成とリアルタイム修正を統合した動的クローズドループ拡散ポリシーフレームワークDCDPを提案する。
動的PushTシミュレーションでは、DCDPは5%の計算しか必要とせず、再トレーニングなしに適応性を19%改善する。
- 参考スコア(独自算出の注目度): 52.106797722292896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion-based policies have achieved remarkable results in robotic manipulation but often struggle to adapt rapidly in dynamic scenarios, leading to delayed responses or task failures. We present DCDP, a Dynamic Closed-Loop Diffusion Policy framework that integrates chunk-based action generation with real-time correction. DCDP integrates a self-supervised dynamic feature encoder, cross-attention fusion, and an asymmetric action encoder-decoder to inject environmental dynamics before action execution, achieving real-time closed-loop action correction and enhancing the system's adaptability in dynamic scenarios. In dynamic PushT simulations, DCDP improves adaptability by 19\% without retraining while requiring only 5\% additional computation. Its modular design enables plug-and-play integration, achieving both temporal coherence and real-time responsiveness in dynamic robotic scenarios, including real-world manipulation tasks. The project page is at: https://github.com/wupengyuan/dcdp
- Abstract(参考訳): 拡散ベースのポリシーは、ロボット操作において顕著な成果を上げたが、しばしば動的シナリオにおける迅速な適応に苦慮し、応答の遅れやタスクの失敗につながった。
我々は,チャンクベースのアクション生成とリアルタイム修正を統合した動的クローズドループ拡散ポリシーフレームワークDCDPを提案する。
DCDPは、自己監督型動的特徴エンコーダ、クロスアテンション融合、非対称アクションエンコーダを統合して、アクション実行前に環境ダイナミクスを注入し、リアルタイム閉ループ動作補正を実現し、動的シナリオにおけるシステムの適応性を高める。
動的PushTシミュレーションでは、DCDPは5倍の計算しか必要とせず、再トレーニングなしに適応性を19倍改善する。
モジュール設計により、プラグ・アンド・プレイの統合が可能になり、現実世界の操作タスクを含む動的なロボットシナリオにおいて、時間的コヒーレンスとリアルタイムの応答性の両方を達成することができる。
プロジェクトページは以下の通り。
関連論文リスト
- DCoPilot: Generative AI-Empowered Policy Adaptation for Dynamic Data Center Operations [9.210347753567092]
DCoPilotは動的DC動作における生成制御ポリシのためのハイブリッドフレームワークである。
i) ストレステストを行うシミュレーションスケールアップ、(ii) メタポリシー蒸留、(ii) ハイパーネットワークがSLAとシーン埋め込みを条件としたポリシー重みを出力するように訓練され、(iii) オンライン適応により、更新された仕様に応じてゼロショットポリシー生成を可能にする。
論文 参考訳(メタデータ) (2026-02-02T14:18:52Z) - DDP-WM: Disentangled Dynamics Prediction for Efficient World Models [79.53092337527382]
本稿では,DDP-WMについて紹介する。DDP-WMはDDP-WM(Distangled Dynamics Prediction)の原理に基づく新しい世界モデルである。
DDP-WMは、効率的な履歴処理と動的ローカライゼーションを統合したアーキテクチャにより、この分解を実現する。
実験により、DDP-WMは様々なタスクにおいて、大幅な効率と性能を達成することが示された。
論文 参考訳(メタデータ) (2026-02-02T08:04:25Z) - CHDP: Cooperative Hybrid Diffusion Policies for Reinforcement Learning in Parameterized Action Space [9.192754462575218]
ハイブリッド行動空間問題を解決するために,textbfCooperative Hybrid Diffusion Policies (CHDP) フレームワークを提案する。
CHDPは、それぞれ離散的および連続的な拡散ポリシーを利用する2つの協調エージェントを採用している。
挑戦的なハイブリッドアクションベンチマークでは、CHDPは最先端の手法を最大19.3%の成功率で上回っている。
論文 参考訳(メタデータ) (2026-01-09T09:50:47Z) - TS-DP: Reinforcement Speculative Decoding For Temporal Adaptive Diffusion Policy Acceleration [64.32072516882947]
拡散ポリシーは、具体的制御が優れているが、高い推論遅延と計算コストに悩まされている。
時間認識強化に基づく投機的拡散政策(TS-DP)を提案する。
TS-DPは94%以上のドラフトで最大4.17倍高速な推論を実現し、推論周波数は25Hzに達した。
論文 参考訳(メタデータ) (2025-12-13T07:53:14Z) - Bidirectional Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression [97.66080040613726]
特徴空間における動きを暗黙的にモデル化する双方向特徴整合運動変換(Bi-FMT)フレームワークを提案する。
Bi-FMTは、時間的に一貫した潜在表現を生成するために、過去と将来の両方のフレームで機能を調整する。
圧縮効率とランタイムの両方において, Bi-FMT が D-DPCC と AdaDPCC を上回っていることを示す。
論文 参考訳(メタデータ) (2025-09-18T03:51:06Z) - Deep Reactive Policy: Learning Reactive Manipulator Motion Planning for Dynamic Environments [35.192151100313836]
ディープ・リアクティブ・ポリシー(Deep Reactive Policy)は、様々な動的環境でのリアクティブ・モーション・ジェネレーションのために設計された、ヴィジュオ・モーター・ニューラル・モーション・ポリシーである。
IMPACTは、トランスフォーマーをベースとしたニューラルモーションポリシーで、1000万の生成された専門家の軌道で事前訓練されている。
DCP-RMP(DCP-RMP)を用いて,インジェクション時間におけるIMPACTの動的障害物回避を強化した。
論文 参考訳(メタデータ) (2025-09-08T17:59:35Z) - ReCoM: Realistic Co-Speech Motion Generation with Recurrent Embedded Transformer [58.49950218437718]
音声に同期した高忠実で一般化可能な人体動作を生成するための効率的なフレームワークであるReCoMを提案する。
Recurrent Embedded Transformer (RET)は、動的埋め込み正規化(DER)をViT(Vit)コアアーキテクチャに統合する。
モデルロバスト性を高めるため,ノイズ抵抗とクロスドメイン一般化の二重性を持つモデルに,提案したDER戦略を取り入れた。
論文 参考訳(メタデータ) (2025-03-27T16:39:40Z) - One-Step Diffusion Policy: Fast Visuomotor Policies via Diffusion Distillation [80.71541671907426]
OneStep Diffusion Policy (OneDP)は、事前訓練された拡散政策から知識を単一ステップのアクションジェネレータに蒸留する新しいアプローチである。
OneDPはロボット制御タスクの応答時間を著しく短縮する。
論文 参考訳(メタデータ) (2024-10-28T17:54:31Z) - Value Iteration in Continuous Actions, States and Time [99.00362538261972]
連続状態と動作に対する連続的適合値反復(cFVI)アルゴリズムを提案する。
非線形制御アフィンダイナミクスに対して最適なポリシを導出することができる。
物理システムのビデオは、urlhttps://sites.google.com/view/value-iteration.comで入手できる。
論文 参考訳(メタデータ) (2021-05-10T21:40:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。