論文の概要: Failure-Aware Bimanual Teleoperation via Conservative Value Guided Assistance
- arxiv url: http://arxiv.org/abs/2602.01092v1
- Date: Sun, 01 Feb 2026 08:16:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.060716
- Title: Failure-Aware Bimanual Teleoperation via Conservative Value Guided Assistance
- Title(参考訳): 保守的価値誘導支援による障害対応双方向遠隔操作
- Authors: Peng Zhou, Zhongxuan Li, Jinsong Wu, Jiaming Qi, Jun Hu, David Navarro-Alarcon, Jia Pan, Lihua Xie, Shiyao Zhang, Zeqing Zhang,
- Abstract要約: 本稿では,双方向遠隔操作のための価値誘導型障害対応フレームワークを提案する。
継続的な人的権威を保ちながら、従順な触覚支援を提供する。
- 参考スコア(独自算出の注目度): 39.30346313362978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Teleoperation of high-precision manipulation is con-strained by tight success tolerances and complex contact dy-namics, which make impending failures difficult for human operators to anticipate under partial observability. This paper proposes a value-guided, failure-aware framework for bimanual teleoperation that provides compliant haptic assistance while pre-serving continuous human authority. The framework is trained entirely from heterogeneous offline teleoperation data containing both successful and failed executions. Task feasibility is mod-eled as a conservative success score learned via Conservative Value Learning, yielding a risk-sensitive estimate that remains reliable under distribution shift. During online operation, the learned success score regulates the level of assistance, while a learned actor provides a corrective motion direction. Both are integrated through a joint-space impedance interface on the master side, yielding continuous guidance that steers the operator away from failure-prone actions without overriding intent. Experimental results on contact-rich manipulation tasks demonstrate improved task success rates and reduced operator workload compared to conventional teleoperation and shared-autonomy baselines, indicating that conservative value learning provides an effective mechanism for embedding failure awareness into bilateral teleoperation. Experimental videos are available at https://www.youtube.com/watch?v=XDTsvzEkDRE
- Abstract(参考訳): 高精度操作の遠隔操作は、厳密な成功耐性と複雑な接触ダイナミクスによって制約される。
本稿では,継続的な人的権威を維持しつつ,協調的な触覚支援を提供する双方向遠隔操作のための価値誘導型障害対応フレームワークを提案する。
このフレームワークは、成功と失敗の両方を含む不均一なオフライン遠隔操作データから完全にトレーニングされている。
タスク実現性は、保守的な価値学習を通じて得られた保守的な成功スコアとして、分散シフトの下で信頼性が保たれるリスクに敏感な見積もりとして、モデレートされる。
オンライン操作中、学習した成功スコアは援助のレベルを調節し、学習したアクターは矯正的な動きの方向を提供する。
どちらもマスタ側のジョイントスペースインピーダンスインターフェースを通じて統合されており、インテントをオーバーライドすることなく、オペレーターが障害を起こしやすいアクションから遠ざけるための継続的ガイダンスを提供する。
コンタクトリッチな操作タスクの実験結果から,従来の遠隔操作や共有自律型ベースラインと比較して,タスク成功率の向上と作業負荷の削減が示され,保守的価値学習が障害認識を双方向遠隔操作に組み込むための効果的なメカニズムであることが示唆された。
実験ビデオはhttps://www.youtube.com/watch?
v=XDTsvzEkDRE
関連論文リスト
- Efficient and Reliable Teleoperation through Real-to-Sim-to-Real Shared Autonomy [15.968475455457947]
微粒で接触に富んだ遠隔操作は、現実世界の操作タスクでは遅く、エラーが発生し、信頼性が低いままである。
本稿では,人間の遠隔操作を学習された矯正行動で強化する,リアルからシミュレート・トゥ・リアルな共有自律フレームワークを提案する。
本研究では,初級演算子のタスク成功と経験演算子の実行効率を向上することを示す。
論文 参考訳(メタデータ) (2026-03-17T18:01:43Z) - Towards Human-Like Manipulation through RL-Augmented Teleoperation and Mixture-of-Dexterous-Experts VLA [62.16042475700567]
本稿では,遠隔操作データ収集を簡易化する共有自律型アシスタントIMCopilotを紹介する。
我々は、不均一な力と触覚モーダルを予め訓練されたVLAバックボーンにシームレスに統合するアーキテクチャであるMoDE-VLAを提案する。
我々は,複雑度を増大させる4つの課題に対するアプローチの有効性を検証し,厳密な接触量の多い課題におけるベースラインよりも2倍の成功率の向上を実証した。
論文 参考訳(メタデータ) (2026-03-09T09:02:30Z) - Force-Aware Residual DAgger via Trajectory Editing for Precision Insertion with Impedance Control [7.670131142516991]
TER-DAggerは、コンタクトリッチな操作のための力覚的模倣学習フレームワークである。
実験により、TER-DAggerは行動クローニング、ヒト誘導補正、リトレーニング、微調整ベースラインと比較して平均成功率を37%以上改善することが示された。
論文 参考訳(メタデータ) (2026-03-04T13:18:05Z) - Hierarchical Vision Language Action Model Using Success and Failure Demonstrations [60.82332413442677]
階層型視覚-言語-アクションモデルであるVINEを導入し,高レベル推論を低レベル制御から分離する。
システム2は、2Dシーングラフの抽象化を介して、実現可能性誘導木探索を行う。
システム1はエージェントのコアスキルを変更することなく、低レベルのアクションを実行する。
論文 参考訳(メタデータ) (2025-12-03T15:58:38Z) - Fast Bilateral Teleoperation and Imitation Learning Using Sensorless Force Control via Accurate Dynamics Model [1.6019538204169677]
この研究は、力覚フィードバックによる高速遠隔操作が、力覚のない低コストマニピュレータでも実現可能であることを示した。
本手法は,正確に同定されたマニピュレータ力学に基づいて非線形項補償,速度,外力推定を統合する。
4チャンネルの双方向制御によって収集されたデータを用いて、学習ポリシーの入力と出力の両方に力情報を統合することで、模倣学習のパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2025-07-08T16:54:34Z) - RoboEval: Where Robotic Manipulation Meets Structured and Scalable Evaluation [32.080769025457926]
本稿では,現在の双方向操作ポリシーの限界を明らかにするために,シミュレーションベンチマークと構造化評価フレームワークであるRoboEvalを提案する。
RoboEvalは、空間、物理的、コーディネート機能に体系的に挑戦する、階層化されたセマンティックな基礎付けられた一連のタスクを導入した。
行動メトリクスは、タスクメトリックペアの半数以上の成功と相関し、バイナリ成功が飽和しても情報的であり続ける。
論文 参考訳(メタデータ) (2025-07-01T05:33:16Z) - Intelligent Mode-switching Framework for Teleoperation [15.606478556021733]
遠隔操作のためのインテリジェントなモードスイッチングフレームワークを提案する。
オペレータ側に深層強化学習エージェントを配置し、自律モードと遠隔操作モードをシームレスに切り替える。
提案手法は,タスク完了確率を向上し,最大50%の通信負荷削減を実現することができることを示す。
論文 参考訳(メタデータ) (2024-02-08T20:38:35Z) - Adversarial Imitation Learning with Trajectorial Augmentation and
Correction [61.924411952657756]
本稿では,拡張軌道の成功を保った新しい拡張手法を提案する。
我々は, 合成専門家を用いた模倣エージェントの訓練を行うために, 逆データ拡張模倣アーキテクチャを開発した。
実験により,我々のデータ拡張戦略は,敵対的模倣の精度と収束時間を向上できることが示された。
論文 参考訳(メタデータ) (2021-03-25T14:49:32Z) - Bridging the Imitation Gap by Adaptive Insubordination [88.35564081175642]
教官が特権情報にアクセスして意思決定を行う場合、この情報は模倣学習中に疎外されることを示す。
本稿では,このギャップに対処するため,適応的不規則化(ADVISOR)を提案する。
ADVISORは、トレーニング中の模倣と報酬に基づく強化学習損失を動的に重み付け、模倣と探索をオンザフライで切り替えることを可能にする。
論文 参考訳(メタデータ) (2020-07-23T17:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。