論文の概要: Introspective Visuomotor Control: Exploiting Uncertainty in Deep
Visuomotor Control for Failure Recovery
- arxiv url: http://arxiv.org/abs/2103.11881v1
- Date: Mon, 22 Mar 2021 14:17:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 22:34:58.039837
- Title: Introspective Visuomotor Control: Exploiting Uncertainty in Deep
Visuomotor Control for Failure Recovery
- Title(参考訳): introspective Visuomotor Control:Deep Visuomotor Controlにおける不確かさの爆発
- Authors: Chia-Man Hung, Li Sun, Yizhe Wu, Ioannis Havoutis, Ingmar Posner
- Abstract要約: 新たな不確実性に基づく障害事例の検出と復旧手法を提案する。
12%のプッシュ,15%のピック・アンド・リーチ,22%のピック・アンド・プレイスでタスク成功率が向上した。
- 参考スコア(独自算出の注目度): 22.934244453277348
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: End-to-end visuomotor control is emerging as a compelling solution for robot
manipulation tasks. However, imitation learning-based visuomotor control
approaches tend to suffer from a common limitation, lacking the ability to
recover from an out-of-distribution state caused by compounding errors. In this
paper, instead of using tactile feedback or explicitly detecting the failure
through vision, we investigate using the uncertainty of a policy neural
network. We propose a novel uncertainty-based approach to detect and recover
from failure cases. Our hypothesis is that policy uncertainties can implicitly
indicate the potential failures in the visuomotor control task and that robot
states with minimum uncertainty are more likely to lead to task success. To
recover from high uncertainty cases, the robot monitors its uncertainty along a
trajectory and explores possible actions in the state-action space to bring
itself to a more certain state. Our experiments verify this hypothesis and show
a significant improvement on task success rate: 12% in pushing, 15% in
pick-and-reach and 22% in pick-and-place.
- Abstract(参考訳): ロボット操作タスクのための魅力的なソリューションとして、エンドツーエンドの視覚運動制御が登場している。
しかし、模倣学習に基づくヴィスモータ制御アプローチは、エラーの複合化による分散状態から回復する能力に欠ける、共通の制限に苦しむ傾向がある。
本稿では,触覚フィードバックや視覚による障害を明示的に検出する代わりに,政策ニューラルネットワークの不確実性を用いて検討する。
我々は,障害事例の検出と復旧のための新しい不確実性に基づく手法を提案する。
我々の仮説は、政策の不確実性は、自覚的制御タスクの潜在的な失敗を暗黙的に示し、最小の不確実性を持つロボット状態がタスクの成功につながる可能性が高いというものである。
高い不確実性から回復するため、ロボットは軌道に沿って不確実性を監視し、より特定の状態に到達するための状態動作空間における可能な動作を探索する。
この仮説を検証し,12%のプッシュ,15%のピック・アンド・リーチ,22%のピック・アンド・プレイスでタスク成功率を大幅に改善した。
関連論文リスト
- Adaptive Motion Generation Using Uncertainty-Driven Foresight Prediction [2.2120851074630177]
環境の不確実性は、現実のロボットタスクを実行する際には、長年、扱いにくい特徴だった。
本稿では,動的内部シミュレーションを用いたフォレスト予測を用いた既存の予測学習に基づくロボット制御手法を拡張した。
その結果,提案モデルではドアとの相互作用により動作が適応的に分岐し,従来の手法では安定に分岐しなかった。
論文 参考訳(メタデータ) (2024-10-01T15:13:27Z) - Model-Based Uncertainty in Value Functions [89.31922008981735]
MDP上の分布によって引き起こされる値の分散を特徴付けることに重点を置いている。
従来の作業は、いわゆる不確実性ベルマン方程式を解くことで、値よりも後方の分散を境界にしている。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式を提案する。
論文 参考訳(メタデータ) (2023-02-24T09:18:27Z) - Asking for Help: Failure Prediction in Behavioral Cloning through Value
Approximation [8.993237527071756]
本稿では,行動クローン化政策と協調して,状態値関数を学習する手法である行動クローン値近似(BCVA)を導入する。
我々は,ラッチドア開口の移動操作課題にBCVAを適用し,BCVAの有効性を実証した。
論文 参考訳(メタデータ) (2023-02-08T20:56:23Z) - Failure Detection for Motion Prediction of Autonomous Driving: An
Uncertainty Perspective [12.17821905210185]
運動予測は安全で効率的な自動運転に不可欠である。
複雑な人工知能モデルの説明不可能性と不確実性は予測不可能な失敗につながる可能性がある。
不確実性の観点からの動作予測のための故障検出の枠組みを提案する。
論文 参考訳(メタデータ) (2023-01-11T12:01:08Z) - Empirical Estimates on Hand Manipulation are Recoverable: A Step Towards
Individualized and Explainable Robotic Support in Everyday Activities [80.37857025201036]
ロボットシステムの鍵となる課題は、他のエージェントの振る舞いを理解することである。
正しい推論の処理は、(衝突)因子が実験的に制御されない場合、特に困難である。
人に関する観察研究を行うために必要なツールをロボットに装備することを提案する。
論文 参考訳(メタデータ) (2022-01-27T22:15:56Z) - Surveillance Evasion Through Bayesian Reinforcement Learning [78.79938727251594]
ランダム終端の強度が全く不明な2次元連続経路計画問題を考える。
これらのオブザーバーの監視強度は未知であり、反復的な経路計画を通じて学ぶ必要がある。
論文 参考訳(メタデータ) (2021-09-30T02:29:21Z) - Balancing detectability and performance of attacks on the control
channel of Markov Decision Processes [77.66954176188426]
マルコフ決定過程(MDPs)の制御チャネルにおける最適ステルス毒素攻撃の設計問題について検討する。
この研究は、MDPに適用された敵国・毒殺攻撃や強化学習(RL)手法に対する研究コミュニティの最近の関心に動機づけられている。
論文 参考訳(メタデータ) (2021-09-15T09:13:10Z) - Residual Error: a New Performance Measure for Adversarial Robustness [85.0371352689919]
ディープラーニングの広く普及を制限する大きな課題は、敵の攻撃に対する脆弱さである。
本研究は,ディープニューラルネットワークの対角強靭性を評価するための新しい性能尺度である残留誤差の概念を提示する。
画像分類を用いた実験結果から,提案手法の有効性と有効性を示した。
論文 参考訳(メタデータ) (2021-06-18T16:34:23Z) - Temporal Difference Uncertainties as a Signal for Exploration [76.6341354269013]
強化学習における探索の効果的なアプローチは、最適な政策に対するエージェントの不確実性に依存することである。
本稿では,評価値のバイアスや時間的に矛盾する点を強調した。
本稿では,時間差誤差の分布の導出に依存する値関数の不確かさを推定する手法を提案する。
論文 参考訳(メタデータ) (2020-10-05T18:11:22Z) - Driving Through Ghosts: Behavioral Cloning with False Positives [42.31740099795908]
本稿では,不完全な知覚を保守的でないまま安全に活用できる行動クローニング手法を提案する。
本稿では,物体知覚システムの雑音出力を符号化する,新しい確率論的鳥眼ビューセマンティックグリッドを提案する。
そして、専門家によるデモンストレーションを利用して、この確率的表現を用いて模擬駆動ポリシーを学ぶ。
論文 参考訳(メタデータ) (2020-08-29T12:10:23Z) - Model Uncertainty Quantification for Reliable Deep Vision Structural
Health Monitoring [2.5126058470073263]
本稿では,深部視覚構造型健康モニタリングモデルに対するベイズ推定を提案する。
不確かさはモンテカルロのドロップアウトサンプリングを用いて定量化することができる。
き裂, 局部損傷同定, 橋梁部品検出の3つの独立したケーススタディについて検討した。
論文 参考訳(メタデータ) (2020-04-10T17:54:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。