論文の概要: Tube Diffusion Policy: Reactive Visual-Tactile Policy Learning for Contact-rich Manipulation
- arxiv url: http://arxiv.org/abs/2604.23609v1
- Date: Sun, 26 Apr 2026 08:48:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.460675
- Title: Tube Diffusion Policy: Reactive Visual-Tactile Policy Learning for Contact-rich Manipulation
- Title(参考訳): チューブ拡散政策:コンタクトリッチマニピュレーションのための反応性視覚触覚ポリシー学習
- Authors: Teng Xue, Alberto Rigo, Bingjian Huang, Jiayi Shen, Zhengtong Xu, Nick Colonnese, Amirhossein H. Memar,
- Abstract要約: Tube Diffusion Policy (TDP) は、チューブベースのフィードバック制御で模倣学習をブリッジする新しい視覚触覚ポリシー学習フレームワークである。
TDPは、名目アクションチャンクの周りに観測条件付きフィードバックフローを学習し、実行中に高速で適応的な反応を可能にするアクションチューブを形成する。
- 参考スコア(独自算出の注目度): 11.359539466233137
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Contact-rich manipulation is central to many everyday human activities, requiring continuous adaptation to contact uncertainty and external disturbances through multi-modal perception, particularly vision and tactile feedback. While imitation learning has shown strong potential for learning complex manipulation behaviors, most existing approaches rely on action chunking, which fundamentally limits their ability to react to unforeseen observations during execution. This limitation becomes especially critical in contact-rich scenarios, where physical uncertainty and high-frequency tactile feedback demand rapid, reactive control. To address this challenge, we propose Tube Diffusion Policy (TDP), a novel reactive visual-tactile policy learning framework that bridges diffusion-based imitation learning with tube-based feedback control. By leveraging the expressive power of generative models, TDP learns an observation-conditioned feedback flow around nominal action chunks, forming an action tube that enables fast and adaptive reactions during execution. We evaluate TDP on the widely used Push-T benchmark and three additional challenging visual-tactile dexterous manipulation tasks. Across all benchmarks, TDP consistently outperforms state-of-the-art imitation learning baselines. Two real-world experiments further validate its robust reactivity under contact uncertainty and external disturbances. Moreover, the step-wise correction mechanism enabled by action tube significantly reduces the required denoising steps, making TDP well suited for real-time, high-frequency feedback control in contact-rich manipulation.
- Abstract(参考訳): コンタクトリッチな操作は多くの日常的な人間の活動の中心であり、コンタクトの不確実性や外乱への継続的な適応を必要とする。
模倣学習は複雑な操作行動を学ぶ強力な可能性を示しているが、既存のほとんどのアプローチはアクションチャンキングに依存しており、実行中に予期せぬ観察に反応する能力を根本的に制限している。
この制限は、物理的不確実性と高周波触覚フィードバックが迅速な反応性制御を要求するような、コンタクトリッチなシナリオにおいて特に重要となる。
この課題に対処するために、拡散に基づく模倣学習をチューブベースのフィードバック制御でブリッジする、リアクティブな視覚触覚ポリシー学習フレームワークであるTDP(Tube Diffusion Policy)を提案する。
生成モデルの表現力を活用することで、TDPは名目アクションチャンク周辺の観察条件付きフィードバックフローを学習し、実行中に高速かつ適応的な反応を可能にするアクションチューブを形成する。
我々は、広く使われているPush-TベンチマークでTDPを評価し、さらに3つの挑戦的な視覚触覚のデキスタラスな操作タスクについて検討した。
すべてのベンチマークにおいて、TDPは一貫して最先端の模倣学習ベースラインを上回っている。
2つの実世界の実験は、接触不確実性および外乱下での堅牢な反応性をさらに検証した。
さらに、動作管により可能となるステップワイド補正機構は、必要なデノナイジングステップを著しく低減し、接触リッチな操作におけるリアルタイムで高周波なフィードバック制御に適したTDPを実現する。
関連論文リスト
- TouchGuide: Inference-Time Steering of Visuomotor Policies via Touch Guidance [53.35296919674763]
TouchGuideは、低次元のアクション空間内でモダリティを融合させる、クロス政治的なビズオ触覚融合パラダイムである。
TouchGuideは、事前訓練された拡散またはフローマッチングビズモータポリシーをガイドする2つの段階で動作する。
高品質で費用対効果の高いデータによるTouchGuideトレーニングを容易にするために,データ収集システムであるTacUMIを導入する。
論文 参考訳(メタデータ) (2026-01-28T04:22:47Z) - ImplicitRDP: An End-to-End Visual-Force Diffusion Policy with Structural Slow-Fast Learning [52.86018040861575]
本稿では,単一のネットワークに視覚計画と反応力制御を統合した,一貫したエンドツーエンドの視覚力拡散政策を提案する。
本稿では,非同期な視覚と力のトークンを同時に処理するための因果的注意力を利用した構造的スローフォールストラーニングを紹介する。
コンタクトリッチタスクの実験では、ImplicitRDPは視覚のみのベースラインと階層的なベースラインの両方で著しく優れていた。
論文 参考訳(メタデータ) (2025-12-11T18:59:46Z) - Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation [58.95799126311524]
人間は視覚と触覚を使って、外的変化に対する迅速な応答や接触力の適応制御のような非常に反応性の高い能力で、コンタクトリッチなタスクを達成できる。
既存の視覚模倣学習アプローチは、複雑な振る舞いをモデル化するためにアクションチャンキングに依存している。
本稿では,Augmented Realityを通じてリアルタイム触覚フィードバックを提供する,低コスト遠隔操作システムであるTactARを紹介する。
論文 参考訳(メタデータ) (2025-03-04T18:58:21Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。