論文の概要: Real-Time Robot Execution with Masked Action Chunking
- arxiv url: http://arxiv.org/abs/2601.20130v1
- Date: Tue, 27 Jan 2026 23:48:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.968325
- Title: Real-Time Robot Execution with Masked Action Chunking
- Title(参考訳): Masked Action Chunkingによるリアルタイムロボット実行
- Authors: Haoxuan Wang, Gengyu Zhang, Yan Yan, Yuzhang Shang, Ramana Rao Kompella, Gaowen Liu,
- Abstract要約: ロボットのようなサイバー物理システムにはリアルタイム実行が不可欠である。
近年,リアルタイムロボット操作のためのシステムレベルのパラダイムとして,非同期推論が登場している。
本稿では,マスクされたアクションチャンキングによって事前訓練されたポリシーの修正を学習するREMACを提案する。
- 参考スコア(独自算出の注目度): 38.37108371991901
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-time execution is essential for cyber-physical systems such as robots. These systems operate in dynamic real-world environments where even small delays can undermine responsiveness and compromise performance. Asynchronous inference has recently emerged as a system-level paradigm for real-time robot manipulation, enabling the next action chunk to be predicted while the current one is being executed. While this approach achieves real-time responsiveness, naive integration often results in execution failure. Previous methods attributed this failure to inter-chunk discontinuity and developed test-time algorithms to smooth chunk boundaries. In contrast, we identify another critical yet overlooked factor: intra-chunk inconsistency, where the robot's executed action chunk partially misaligns with its current perception. To address this, we propose REMAC, which learns corrective adjustments on the pretrained policy through masked action chunking, enabling the policy to remain resilient under mismatches between intended actions and actual execution during asynchronous inference. In addition, we introduce a prefix-preserved sampling procedure to reinforce inter-chunk continuity. Overall, our method delivers more reliable policies without incurring additional latency. Extensive experiments in both simulation and real-world settings demonstrate that our method enables faster task execution, maintains robustness across varying delays, and consistently achieves higher completion rates.
- Abstract(参考訳): ロボットのようなサイバー物理システムにはリアルタイム実行が不可欠である。
これらのシステムは、小さな遅延でも応答性を損なうことができ、性能を損なうような、動的な実環境で動作する。
非同期推論は、最近リアルタイムロボット操作のためのシステムレベルのパラダイムとして登場し、現在のロボットの実行中に次のアクションチャンクを予測することができる。
このアプローチはリアルタイムの応答性を実現するが、直感的な統合はしばしば実行に失敗する。
以前の手法では、この失敗はチャンク間の不連続性によるものとされ、スムーズなチャンク境界に対するテストタイムアルゴリズムが開発された。
これとは対照的に、ロボットが実行した動作が、現在の知覚と部分的に相違する、チャンク内不整合(in-chunk inconsistency)という、重要で見過ごされがちな要因を識別する。
この問題を解決するために、マスクされたアクションチャンキングにより事前訓練されたポリシーの修正調整を学ぶREMACを提案し、非同期推論中に意図されたアクションと実際の実行とのミスマッチの下でポリシーをレジリエントに維持する。
さらに,チャンク間連続性を補強するプレフィックス保存サンプリング手法を導入する。
全体として、我々の手法は、追加のレイテンシーを発生させることなく、より信頼性の高いポリシーを提供する。
シミュレーションと実世界の双方での大規模な実験により、我々の手法はタスク実行を高速化し、様々な遅延をまたいで堅牢性を維持し、常に高い完了率を達成することを示した。
関連論文リスト
- FASTER: Rethinking Real-Time Flow VLAs [82.58822112377923]
VLA(Vision-Language-Action)モデルを物理世界に展開するには、リアルタイム実行が不可欠である。
反応時間は、TTFA(Time to First Action)と実行地平線によって決定される一様分布に従っていることを示す。
即時反応のための高速動作サンプリング(FASTER)を提案し,この問題を克服する。
論文 参考訳(メタデータ) (2026-03-19T17:51:37Z) - Closed-Loop Action Chunks with Dynamic Corrections for Training-Free Diffusion Policy [52.106797722292896]
我々は,チャンクベースのアクション生成とリアルタイム修正を統合した動的クローズドループ拡散ポリシーフレームワークDCDPを提案する。
動的PushTシミュレーションでは、DCDPは5%の計算しか必要とせず、再トレーニングなしに適応性を19%改善する。
論文 参考訳(メタデータ) (2026-03-02T15:04:18Z) - ARTIS: Agentic Risk-Aware Test-Time Scaling via Iterative Simulation [72.78362530982109]
ARTIS(Agenic Risk-Aware Test-Time Scaling via Iterative Simulation)は、コミットメントから探索を分離するフレームワークである。
LLMをベースとした簡易シミュレータは, 希少かつ高インパクトな障害モードの捕捉に苦慮していることを示す。
本稿では,障害発生行動の忠実度を強調するリスク認識ツールシミュレータを提案する。
論文 参考訳(メタデータ) (2026-02-02T06:33:22Z) - CoLA-Flow Policy: Temporally Coherent Imitation Learning via Continuous Latent Action Flow Matching for Robotic Manipulation [4.726851899243877]
LG-Flow Policyは、連続的な潜在アクション空間でフローマッチングを実行する軌道レベルの模倣学習フレームワークである。
動作シーケンスを時間的に規則化された潜在軌道に符号化し、明示的な潜在空間の流れを学習することにより、提案手法は低レベル制御ノイズからグローバルな運動構造を分離する。
論文 参考訳(メタデータ) (2026-01-30T15:36:43Z) - Improving Generative Behavior Cloning via Self-Guidance and Adaptive Chunking [29.920087317401396]
ジェネレーティブ・ビヘイビア・クローン(Generative Behavior Cloning)は、ロボット学習のためのシンプルで効果的なフレームワークである。
拡散政策の一貫性と反応性を高めるための2つの新しい手法を提案する。
提案手法は,多種多様なシミュレーションおよび実世界のロボット操作タスクにおいて,GBCの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2025-10-14T11:16:34Z) - Adaptive Reinforcement Learning for Unobservable Random Delays [46.04329493317009]
本稿では,エージェントが観測不能かつ時間変化の遅れを適応的に処理できる汎用フレームワークを提案する。
具体的には、エージェントは予測不可能な遅延とネットワーク越しに送信される失われたアクションパケットの両方を処理するために、将来のアクションのマトリックスを生成する。
提案手法は,幅広いベンチマーク環境において,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-06-17T11:11:37Z) - SHIELD: Secure Hypernetworks for Incremental Expansion Learning Defense [0.0]
本稿では,逐次的タスク間で堅牢な連続学習を可能にする新しいフレームワークを提案する。
提案手法であるShielDは,コンパクトなタスク埋め込みのみを前提とした共有ハイパーネットワークにより,タスク固有のモデルパラメータを生成する。
より堅牢性を高めるために,我々は,MixUpポイントを中心とした$ell_infty$ボールとして表現された仮想例をブレンドする,新しいトレーニング戦略であるInterval MixUpを紹介した。
論文 参考訳(メタデータ) (2025-06-09T21:43:56Z) - Real-Time Execution of Action Chunking Flow Policies [49.1574468325115]
本稿では,アクションインタラクションシステムの非同期実行を可能にする新しい推論時アルゴリズムを提案する。
これは、再トレーニングなしでボックスから実行する拡散またはVLAベースのシステムに適用できる。
その結果、RTCは高速で、性能が高く、推論操作に対して一意に堅牢であることがわかった。
論文 参考訳(メタデータ) (2025-06-09T01:01:59Z) - Bidirectional Decoding: Improving Action Chunking via Guided Test-Time Sampling [51.38330727868982]
動作チャンキングが学習者と実証者の間の分岐にどのように影響するかを示す。
動作チャンキングをクローズドループ適応でブリッジするテスト時間推論アルゴリズムである双方向デコーディング(BID)を提案する。
提案手法は、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させる。
論文 参考訳(メタデータ) (2024-08-30T15:39:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。