論文の概要: Closing the Loop in Teleoperation: Episode-Level Data Quality Assessment and Feedback for High-Quality Demonstration Collection
- arxiv url: http://arxiv.org/abs/2605.26349v1
- Date: Mon, 25 May 2026 21:52:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.478295
- Title: Closing the Loop in Teleoperation: Episode-Level Data Quality Assessment and Feedback for High-Quality Demonstration Collection
- Title(参考訳): 遠隔操作におけるループの閉鎖:エピソードレベルデータ品質評価と高品質実証収集へのフィードバック
- Authors: Gokul Narayanan, Yash Shahapurkar, Melih Erdogan, Brian Zhu, Eugen Solowjow,
- Abstract要約: 本稿では,ロボットテレメトリとセマンティック・タスク・プログレスを基盤として,遠隔操作のループを閉じるフレームワークを提案する。
バイナリ成功や障害フィードバックとは異なり、提案システムでは、エピソードが最適以下である理由を説明し、次のトライアルで修正すべき特定の振る舞いを強調している。
- 参考スコア(独自算出の注目度): 3.424028268271705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial automation is at a pivotal moment, as Physical AI is driving a transition from rigid, hand-engineered automation systems toward more flexible and adaptive systems. This shift has created a growing demand for large-scale, real-world robot demonstration data, making teleoperation an increasingly important mechanism for data collection. However, high-quality teleoperated demonstrations remain difficult to obtain in practice, as novice operators often produce episodes that are task-successful but suboptimal for downstream use due to inefficient motion, repeated corrections, or operation near robot joint limits. We present a Data Quality Assessment and Feedback (DQAF) framework that closes the loop in teleoperation by providing immediate post-episode feedback grounded in semantic task progress and robot telemetry. The framework extracts quality relevant signals such as sub-task progress, motion smoothness, stalls, kinematic limits and converts them into structured quality assessments and actionable natural-language feedback. Unlike binary success or failure feedback, the proposed system explains why an episode is suboptimal and highlights specific behaviors to correct in the next trial. We evaluate the framework through a diagnostic validation study and a pilot user study. In the validation study, the system is compared with a human reviewer during dataset curation, producing rejection reasons and actionable feedback for improvement. In the pilot study with three novice operators across two manipulation tasks, the operator who received the systems immediate, automated post-episode feedback improved faster than those who did not, producing higher-quality demonstrations sooner.
- Abstract(参考訳): 産業自動化は重要な瞬間であり、フィジカルAIは厳格で手動の自動化システムから、より柔軟で適応的なシステムへの移行を推進している。
このシフトは、大規模で現実世界のロボットのデモデータに対する需要を増大させ、遠隔操作がデータ収集の重要なメカニズムとしてますます重要になっている。
しかし,非効率な動作や繰り返し補正,ロボット関節の限界付近での操作などにより,初歩的な操作者が下流での作業に適さないエピソードをしばしば生み出すため,高品質な遠隔操作型実演の入手は依然として困難である。
本稿では,セマンティックタスクの進捗とロボットテレメトリを基盤として,遠隔操作のループを閉じるデータ品質評価フィードバック(DQAF)フレームワークを提案する。
このフレームワークは、サブタスクの進行、動きの滑らかさ、停止、運動制限などの品質関連信号を抽出し、構造化された品質評価と実行可能な自然言語フィードバックに変換する。
バイナリ成功や障害フィードバックとは異なり、提案システムでは、エピソードが最適以下である理由を説明し、次のトライアルで修正すべき特定の振る舞いを強調している。
本研究では,診断検証研究とパイロットユーザ研究を通じて,その枠組みを評価する。
検証実験では、データセットのキュレーション中に人間レビュアーと比較し、拒絶理由と改善のための実用的なフィードバックを生成する。
2つの操作タスクにまたがる3つの初心者オペレータによるパイロットスタディでは、システムを直接受信したオペレーターは、自動的なエピソード後フィードバックが、そうでないオペレーターよりも早く改善され、高品質なデモがより早く作成された。
関連論文リスト
- The Role of Embodiment in Intuitive Whole-Body Teleoperation for Mobile Manipulation [20.65893345441958]
最小限の物理的および認知的要求と組み合わさった強い実施感は、長期にわたってデータ品質を維持するのに役立つ。
我々は、没入型バーチャルリアリティと、ロボットの視野を従来のスクリーンベースで可視化する2つの視覚的フィードバックメカニズムを評価する。
以上の結果から,VRをフィードバックモダリティとして利用すると,タスク完了時間,認知作業量,テレオペレータの取り組みが増加することが示唆された。
論文 参考訳(メタデータ) (2025-09-03T11:25:36Z) - On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - VITAL: Interactive Few-Shot Imitation Learning via Visual Human-in-the-Loop Corrections [10.49712834719005]
イミテーション・ラーニング(IL)はロボット工学において強力なアプローチとして登場し、ロボットは人間の行動を模倣することで新しいスキルを身につけることができる。
その可能性にもかかわらず、ILのデータ収集プロセスは、ロジスティックな困難と高品質なデモンストレーションの獲得に伴う高コストのため、依然として重要な課題である。
本稿では,シミュレーションにおけるデータ拡張を通じて,少数の実演から大規模データ生成を提案する。
論文 参考訳(メタデータ) (2024-07-30T23:29:47Z) - Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.65867987106428]
本稿では,人間とロボットの協調学習システムについて紹介する。
これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。
これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文 参考訳(メタデータ) (2024-06-29T03:37:29Z) - DiAReL: Reinforcement Learning with Disturbance Awareness for Robust
Sim2Real Policy Transfer in Robot Control [0.0]
遅延マルコフ決定プロセスは、最近コミットされたアクションの有限時間ウィンドウでエージェントの状態空間を拡大することでマルコフ特性を満たす。
本稿では,遅延した環境下での乱れ増進型マルコフ決定プロセスを導入し,政治強化学習アルゴリズムのトレーニングにおける乱れ推定を取り入れた新しい表現法を提案する。
論文 参考訳(メタデータ) (2023-06-15T10:11:38Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。