論文の概要: How Visible Are Silent Manipulation Failures? An Observability Study of False-Success Detection in Simulated Robot Episodes
- arxiv url: http://arxiv.org/abs/2606.03134v1
- Date: Tue, 02 Jun 2026 04:22:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.757655
- Title: How Visible Are Silent Manipulation Failures? An Observability Study of False-Success Detection in Simulated Robot Episodes
- Title(参考訳): サイレントマニピュレーション障害の可視性について : 模擬ロボットエピソードにおける虚偽検出の可観測性の検討
- Authors: Aarav Bedi,
- Abstract要約: ロボット操作の模倣学習ポリシーは、トレーニングエピソードに付随する成功ラベルの品質を継承する。
ロボットが実際にタスクの結果が間違っていた場合、成功として記録するエピソードだ。
本研究では,2つのALOHAタスクのシミュレーションテストベッドを構築し,ラベル編集ではなく環境摂動による障害を誘導し,検出者が決して見ることのない特権的シミュレータ状態によって各エピソードをラベル付けし,ロボットがフラグ付けしたエピソードのみを成功に維持する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imitation-learning policies for robot manipulation inherit the quality of the success labels attached to their training episodes, and those labels are usually produced by the robot's own success check. A particularly damaging error is the false success: an episode the robot logs as a success when the task outcome was actually wrong. We ask a narrow but practical question about these episodes. Once an episode has already been flagged as a success, how much of the information needed to overturn that label is present in proprioception, and how much requires vision? We build a simulated testbed on two bimanual ALOHA tasks, induce failures through environment perturbations rather than label edits, label every episode by privileged simulator state that the detector never sees, and keep only episodes the robot flagged as successful. We then compare detectors restricted to proprioception against a vision-based detector. We find that recoverability spans a wide range: in cube transfer the false successes are almost fully recoverable from joint data alone, while in peg insertion proprioception recovers only part of them and a vision detector closes most of the gap. We also show that the proprioceptive separability we measure rests on velocity differences far below any realistic sensor noise floor, so it is best read as an optimistic upper bound that a noiseless simulator inflates. We release the generation and evaluation pipeline.
- Abstract(参考訳): ロボット操作の模倣学習ポリシーは、トレーニングエピソードに付随する成功ラベルの品質を継承し、これらのラベルは通常、ロボット自身の成功チェックによって生成される。
ロボットが実際にタスクの結果が間違っていた場合、成功として記録するエピソードだ。
我々はこれらのエピソードについて狭義の実践的な質問をする。
ひとたびエピソードがすでに成功と宣言されたら、そのラベルを覆すのに必要な情報のうち、どの程度がプロバイオセプションに存在するのか、そして、どのくらいのビジョンが必要なのか?
本研究では,2つのALOHAタスクのシミュレーションテストベッドを構築し,ラベル編集よりも環境摂動による障害を誘発し,検出者が決して見ることのない特権的シミュレータ状態によって各エピソードをラベル付けし,ロボットがフラグ付けしたエピソードのみを成功に維持する。
次に、プロプレセプションに制限された検出器を、視覚ベースの検出器と比較する。
立方体移動では、偽の成功は関節データのみからほぼ完全に回復可能であるのに対し、ペグ挿入の受容では、その一部のみが回復し、視覚検出器がギャップの大部分を閉じている。
また, 実感的なセンサノイズフロアよりもはるかに低い速度差で, ノイズのないシミュレーターが膨らむような楽観的な上界として読むのがよい。
生成と評価のパイプラインをリリースします。
関連論文リスト
- Impact of Different Failures on a Robot's Perceived Reliability [9.607560620828718]
ロボットの認識信頼性(PR)に及ぼす各種障害の影響について検討する。
失敗直後の成功は、先行する失敗のない成功とPRに同じ影響を及ぼすことを示す。
以上の結果から,人間とロボットのインタラクションにおいて,どのロボットの障害がより高い修理を必要とするのか,そしてロボットの成功によっていかに信頼が回復できるかが明らかになった。
論文 参考訳(メタデータ) (2026-03-09T18:27:53Z) - RoboCurate: Harnessing Diversity with Action-Verified Neural Trajectory for Robot Learning [47.25770917635344]
本稿では,アノテートされた動作の質を評価し,フィルタする新しい合成ロボットデータ生成フレームワークであるRoboCurateを紹介する。
具体的には、RoboCurateはシミュレータで予測されたアクションをリプレイし、動作の一貫性を測定してアクション品質を評価する。
我々は,RoboCurateが生成したデータに対して,実データのみを使用する場合と比較して,成功率を大幅に向上することを示した。
論文 参考訳(メタデータ) (2026-02-21T07:33:24Z) - Guardian: Detecting Robotic Planning and Execution Errors with Vision-Language Models [53.20969621498248]
本稿では,多種多様な計画および実行障害を生成するために,軌道を手続き的に乱す自動ロボット故障合成手法を提案する。
RLBench-Fail, BridgeDataV2-Fail, UR5-Failの3つの新しい故障検出ベンチマークを構築した。
次に、詳細な障害推論と検出のためのマルチビューイメージを備えたVLMであるGuardianをトレーニングします。
論文 参考訳(メタデータ) (2025-12-01T17:57:27Z) - When a Robot is More Capable than a Human: Learning from Constrained Demonstrators [4.015444385806047]
デモンストレーションから学んだ専門家は、審美的な教育、ジョイスティックコントロール、シム・トゥ・リアル・トランスファーといったインターフェースを使って、ロボットに複雑なタスクを教えることができる。
これらのインターフェースは、間接的な制御、セットアップの制限、ハードウェアの安全性による最適な動作を示す専門家の能力をしばしば制限する。
ロボットは、制約のある専門家が示したものよりも優れたポリシーを学べるだろうか?
我々は、エージェントが専門家の行動の直接の模倣を越えて、より短くより効率的な軌道を探索できるようにすることで、この問題に対処する。
論文 参考訳(メタデータ) (2025-10-10T07:48:12Z) - ILeSiA: Interactive Learning of Robot Situational Awareness from Camera Input [13.374743857520487]
本稿では,カメラ入力とラベリングフレームを安全あるいは危険として利用することで,ロボットの状況認識を教えることに焦点を当てる。
提案手法は,新しい断層の1つの例のみを用いて,既知の断層と新しい断層の両方を確実に検出することができる。
本手法により,次世代のコボットを,容易にセットアップ可能な視覚的リスクアセスメントで迅速に展開することが可能となる。
論文 参考訳(メタデータ) (2024-09-30T10:31:27Z) - Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation [65.46610405509338]
我々は、ゼロショットロボット操作を可能にする汎用的な目標条件ポリシーを学習することを目指している。
私たちのフレームワークであるTrack2Actは、ゴールに基づいて将来のタイムステップで画像内のポイントがどのように動くかを予測する。
学習したトラック予測を残留ポリシーと組み合わせることで,多種多様な汎用ロボット操作が可能となることを示す。
論文 参考訳(メタデータ) (2024-05-02T17:56:55Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Examining Audio Communication Mechanisms for Supervising Fleets of
Agricultural Robots [2.76240219662896]
我々は、agbotをフィールドに配置し、ランダムに障害に遭遇し、オペレーターに助けを求めるシミュレーションプラットフォームを開発した。
アグボットがエラーを報告すると、どのロボットが失敗したか、どんな障害が発生したかを伝える様々な音声通信機構がテストされる。
ユーザによる3つの音声通信方式: イヤーコン, 単文コマンド, フル文コミュニケーション。
論文 参考訳(メタデータ) (2022-08-22T17:19:20Z) - Where is my hand? Deep hand segmentation for visual self-recognition in
humanoid robots [129.46920552019247]
本稿では、画像からロボットの手を切り離すための畳み込みニューラルネットワーク(CNN)を提案する。
ヒューマノイドロボットVizzyの手のセグメンテーションのために,Mask-RCNNネットワークを微調整した。
論文 参考訳(メタデータ) (2021-02-09T10:34:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。