論文の概要: A Human-in-the-Loop Confidence-Aware Failure Recovery Framework for Modular Robot Policies
- arxiv url: http://arxiv.org/abs/2602.10289v2
- Date: Fri, 13 Mar 2026 18:34:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.347319
- Title: A Human-in-the-Loop Confidence-Aware Failure Recovery Framework for Modular Robot Policies
- Title(参考訳): モジュール型ロボット政策のためのヒューマン・イン・ザ・ループ信頼度を考慮した故障復旧フレームワーク
- Authors: Rohan Banerjee, Krishna Palempalli, Bohan Yang, Jiaying Fang, Alif Abdullah, Tom Silver, Sarah Dean, Tapomayukh Bhattacharjee,
- Abstract要約: モジュール型ロボットポリシーのためのヒューマン・イン・ザ・ループ障害復旧フレームワークを提案する。
本フレームワークは,モジュールレベルの不確実性の推定と人的介入コストのモデルを統合する。
モジュールセレクタは、最も障害の原因となるモジュールを特定し、クエリアルゴリズムは、人間の入力を要請するか、自律的に行動するかを決定する。
- 参考スコア(独自算出の注目度): 9.373849523667733
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Robots operating in unstructured human environments inevitably encounter failures, especially in robot caregiving scenarios. While humans can often help robots recover, excessive or poorly targeted queries impose unnecessary cognitive and physical workload on the human partner. We present a human-in-the-loop failure-recovery framework for modular robotic policies, where a policy is composed of distinct modules such as perception, planning, and control, any of which may fail and often require different forms of human feedback. Our framework integrates calibrated estimates of module-level uncertainty with models of human intervention cost to decide which module to query and when to query the human. It separates these two decisions: a module selector identifies the module most likely responsible for failure, and a querying algorithm determines whether to solicit human input or act autonomously. We evaluate several module-selection strategies and querying algorithms in controlled synthetic experiments, revealing trade-offs between recovery efficiency, robustness to system and user variables, and user workload. Finally, we deploy the framework on a robot-assisted bite acquisition system and demonstrate, in studies involving individuals with both emulated and real mobility limitations, that it improves recovery success while reducing the workload imposed on users. Our results highlight how explicitly reasoning about both robot uncertainty and human effort can enable more efficient and user-centered failure recovery in collaborative robots. Supplementary materials and videos can be found at: http://emprise.cs.cornell.edu/modularhil
- Abstract(参考訳): 構造のない人間の環境で動作しているロボットは、特にロボットの介護シナリオにおいて、必然的に障害に遭遇する。
人間は、しばしばロボットの回復を助けるが、過度に、あるいは不適切なターゲットのクエリは、人間のパートナーに不必要な認知的および身体的負荷を課す。
本稿では、モジュール型ロボットポリシーのためのヒューマン・イン・ザ・ループの障害復旧フレームワークを提案する。
本フレームワークは,モジュールレベルの不確実性のキャリブレーションを人為的介入コストモデルと統合し,どのモジュールを問合せし,いつ人間に問合せを行うかを決定する。
モジュールセレクタは、最も障害の原因となるモジュールを特定し、クエリアルゴリズムは、人間の入力を要請するか、自律的に行動するかを決定する。
制御された合成実験において,モジュール選択戦略とクエリアルゴリズムを評価し,リカバリ効率,システム変数とユーザ変数の堅牢性,ユーザ負荷のトレードオフを明らかにする。
最後に、ロボットによる噛み取りシステムにフレームワークを配置し、エミュレートと実際のモビリティの制限のある個人を対象とした研究において、ユーザへの負担を軽減しつつ、回復の成功を改善することを実証する。
この結果から,ロボットの不確実性と人的作業の両方に対する推論が,協調作業ロボットにおいてより効率的かつユーザ中心の障害回復を可能にすることが示唆された。
追加資料やビデオは以下の通り。
関連論文リスト
- A Causal Approach to Predicting and Improving Human Perceptions of Social Navigation Robots [0.9134244356393665]
Causal Networkは、人々がモバイルロボットの能力をどのように認識し、ナビゲーション中にその意図をどう解釈するかを予測するように設計されている。
低能力ロボット行動の知覚能力は,統計的に83%向上した。
論文 参考訳(メタデータ) (2026-03-11T20:39:11Z) - Human-Humanoid Robots Cross-Embodiment Behavior-Skill Transfer Using Decomposed Adversarial Learning from Demonstration [9.42179962375058]
本稿では,デジタル人間モデルを共通プロトタイプとして使用することにより,データのボトルネックを低減するための転送可能なフレームワークを提案する。
このモデルは、人間による実演から、敵対的な模倣を通して行動プリミティブを学習し、複雑なロボット構造を機能的な構成要素に分解する。
本フレームワークは,多種多様な構成のヒューマノイドロボット5体を用いて検証した。
論文 参考訳(メタデータ) (2024-12-19T18:41:45Z) - Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.616995671367704]
そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。
その結果,現在最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的学習アプローチはロバストな低レベルポリシーに支えられた場合,優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2024-03-15T17:45:44Z) - Formal Modelling for Multi-Robot Systems Under Uncertainty [11.21074891465253]
我々は不確実性下でのマルチロボットシステムのフォーマリズムのモデル化についてレビューする。
計画、強化学習、モデルチェック、シミュレーションにどのように使用できるかについて議論する。
論文 参考訳(メタデータ) (2023-05-26T15:23:35Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。