論文の概要: A Latency-Aware Framework for Visuomotor Policy Learning on Industrial Robots
- arxiv url: http://arxiv.org/abs/2602.14255v1
- Date: Sun, 15 Feb 2026 17:53:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.478235
- Title: A Latency-Aware Framework for Visuomotor Policy Learning on Industrial Robots
- Title(参考訳): 産業用ロボットにおけるビジュモータ政策学習のための遅延認識フレームワーク
- Authors: Daniel Ruan, Salma Mozaffari, Sigrid Adriaenssens, Arash Adel,
- Abstract要約: 本稿では,産業用ロボットアームにビジュモータポリシを展開するための遅延対応フレームワークを提案する。
我々は、有限水平、ポリシー予測されたアクションシーケンスをスケジュールする遅延対応実行戦略を導入する。
その結果,遅延対応実行はスムーズな動作,適合した接触動作,一貫したタスク進行を維持できることがわかった。
- 参考スコア(独自算出の注目度): 0.8749675983608171
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Industrial robots are increasingly deployed in contact-rich construction and manufacturing tasks that involve uncertainty and long-horizon execution. While learning-based visuomotor policies offer a promising alternative to open-loop control, their deployment on industrial platforms is challenged by a large observation-execution gap caused by sensing, inference, and control latency. This gap is significantly greater than on low-latency research robots due to high-level interfaces and slower closed-loop dynamics, making execution timing a critical system-level issue. This paper presents a latency-aware framework for deploying and evaluating visuomotor policies on industrial robotic arms under realistic timing constraints. The framework integrates calibrated multimodal sensing, temporally consistent synchronization, a unified communication pipeline, and a teleoperation interface for demonstration collection. Within this framework, we introduce a latency-aware execution strategy that schedules finite-horizon, policy-predicted action sequences based on temporal feasibility, enabling asynchronous inference and execution without modifying policy architectures or training. We evaluate the framework on a contact-rich industrial assembly task while systematically varying inference latency. Using identical policies and sensing pipelines, we compare latency-aware execution with blocking and naive asynchronous baselines. Results show that latency-aware execution maintains smooth motion, compliant contact behavior, and consistent task progression across a wide range of latencies while reducing idle time and avoiding instability observed in baseline methods. These findings highlight the importance of explicitly handling latency for reliable closed-loop deployment of visuomotor policies on industrial robots.
- Abstract(参考訳): 産業用ロボットは、不確実性や長距離実行を含む、コンタクトリッチな建設および製造タスクにますます配備されている。
学習ベースのビジュモータポリシは、オープンループコントロールに代わる有望な代替手段を提供する一方で、産業プラットフォームへのデプロイメントは、センシング、推論、制御遅延によって引き起こされる、大規模な監視と実行のギャップに悩まされている。
このギャップは、高レベルのインターフェースと遅いクローズドループダイナミクスのため、低レイテンシの研究ロボットよりもはるかに大きいため、実行タイミングがシステムレベルの重要な問題となっている。
本稿では,産業用ロボットアームの振動子ポリシーを現実的なタイミング制約下で展開し,評価するための遅延対応フレームワークを提案する。
このフレームワークは、校正されたマルチモーダルセンシング、時間的に一貫した同期、統一された通信パイプライン、デモコレクションのための遠隔操作インターフェースを統合する。
本フレームワークでは,時間的実現可能性に基づいて,有限水平かつポリシ予測されたアクションシーケンスをスケジュールする遅延対応実行戦略を導入し,ポリシーアーキテクチャやトレーニングを変更することなく,非同期推論と実行を可能にする。
提案手法は,スケジュール遅延を体系的に変化させながら,接触に富む産業用組立作業におけるフレームワークの評価を行う。
同一のポリシーとパイプラインを検知することで、レイテンシを意識した実行とブロッキングと単純な非同期ベースラインを比較します。
その結果, 遅延認識実行はスムーズな動作, 適合した接触動作, および広範囲の待ち時間にわたる一貫したタスク進行を維持でき, アイドル時間を短縮し, ベースライン法で観測された不安定性を回避することができることがわかった。
これらの結果は,産業用ロボットにおけるビジュモータポリシーの信頼性の高いクローズドループ展開における遅延処理の重要性を浮き彫りにした。
関連論文リスト
- FASTER: Rethinking Real-Time Flow VLAs [82.58822112377923]
VLA(Vision-Language-Action)モデルを物理世界に展開するには、リアルタイム実行が不可欠である。
反応時間は、TTFA(Time to First Action)と実行地平線によって決定される一様分布に従っていることを示す。
即時反応のための高速動作サンプリング(FASTER)を提案し,この問題を克服する。
論文 参考訳(メタデータ) (2026-03-19T17:51:37Z) - Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks [6.447439020088275]
AIのブレークスルーは、大規模言語モデル(LLM)ベースのアプリケーションの爆発を加速させた。
センスモデルは、その強力な能力、スケーラビリティ、微調整の容易さ、さまざまなタスクにおける汎用性のために、引き続き支配的です。
本稿では,ノード内並列化方式に着目した2つの代表的高密度LLMの負荷について検討する。
論文 参考訳(メタデータ) (2026-03-05T21:33:24Z) - Latency-aware Human-in-the-Loop Reinforcement Learning for Semantic Communications [2.9668257052955176]
本稿では,人間のフィードバック,セマンティック・ユーティリティ,遅延制御を組み込んだ時間制約付き人間間強化学習フレームワークを提案する。
人間のフィードバックによる意味適応をマルコフ決定過程として定式化する。
我々は,T-HITL-RLがユーザ毎のタイミング制約を一貫して満たし,ベースラインスケジューラの報酬を上回り,リソース消費を安定させることを示す。
論文 参考訳(メタデータ) (2026-02-17T15:07:41Z) - AsyncVLA: An Asynchronous VLA for Fast and Robust Navigation on the Edge [49.66156306240961]
高レイテンシは制御ループを壊し、リアルタイムデプロイメントでは安全でない強力なモデルをレンダリングする。
リアクティブ実行からセマンティック推論を分離する非同期制御フレームワークであるAsyncVLAを提案する。
AsyncVLAは、最先端のベースラインよりも40%高い成功率を達成する。
論文 参考訳(メタデータ) (2026-02-13T21:31:19Z) - LatencyPrism: Online Non-intrusive Latency Sculpting for SLO-Guaranteed LLM Inference [1.280379756275477]
我々は,最初のゼロ侵入型マルチプラットフォーム遅延推論システムPrismを提示する。
パイプライン全体のレイテンシの彫刻を分解し、予測異常を積極的に警告し、コードやサービスの再起動を必要とせずにSLOへの準拠を保証することを目的としている。
我々は、根本原因分析に関する広範な実験と調査を行い、Prismの能力を実証する。
論文 参考訳(メタデータ) (2026-01-14T07:46:59Z) - ImplicitRDP: An End-to-End Visual-Force Diffusion Policy with Structural Slow-Fast Learning [52.86018040861575]
本稿では,単一のネットワークに視覚計画と反応力制御を統合した,一貫したエンドツーエンドの視覚力拡散政策を提案する。
本稿では,非同期な視覚と力のトークンを同時に処理するための因果的注意力を利用した構造的スローフォールストラーニングを紹介する。
コンタクトリッチタスクの実験では、ImplicitRDPは視覚のみのベースラインと階層的なベースラインの両方で著しく優れていた。
論文 参考訳(メタデータ) (2025-12-11T18:59:46Z) - CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。
提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2025-08-15T07:49:22Z) - Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。