論文の概要: A Unified Multi-Layer Framework for Skill Acquisition from Imperfect Human Demonstrations
- arxiv url: http://arxiv.org/abs/2604.08341v1
- Date: Thu, 09 Apr 2026 15:13:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.983991
- Title: A Unified Multi-Layer Framework for Skill Acquisition from Imperfect Human Demonstrations
- Title(参考訳): 不完全な人間デモからのスキル獲得のための統一型多層フレームワーク
- Authors: Zi-Qi Yang, Mehrdad R. Kermani,
- Abstract要約: 現在の技術教育のためのヒューマンロボットインタラクション(HRI)システムは断片化されている。
文献における既存のアプローチは、同時に効率的で直感的で、普遍的に安全な結束的なフレームワークを提供していません。
本稿では,Demonstration からの堅牢で忠実な学習を可能にする新しい階層化制御フレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.8260466406864575
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Current Human-Robot Interaction (HRI) systems for skill teaching are fragmented, and existing approaches in the literature do not offer a cohesive framework that is simultaneously efficient, intuitive, and universally safe. This paper presents a novel, layered control framework that addresses this fundamental gap by enabling robust, compliant Learning from Demonstration (LfD) built upon a foundation of universal robot compliance. The proposed approach is structured in three progressive and interconnected stages. First, we introduce a real-time LfD method that learns both the trajectory and variable impedance from a single demonstration, significantly improving efficiency and reproduction fidelity. To ensure high-quality and intuitive {kinesthetic teaching}, we then present a null-space optimization strategy that proactively manages singularities and provides a consistent interaction feel during human demonstration. Finally, to ensure generalized safety, we introduce a foundational null-space compliance method that enables the entire robot body to compliantly adapt to post-learning external interactions without compromising main task performance. This final contribution transforms the system into a versatile HRI platform, moving beyond end-effector (EE)-specific applications. We validate the complete framework through comprehensive comparative experiments on a 7-DOF KUKA LWR robot. The results demonstrate a safer, more intuitive, and more efficient unified system for a wide range of human-robot collaborative tasks.
- Abstract(参考訳): 現在の技術教育のためのヒューマンロボットインタラクション(HRI)システムは断片化されており、文献の既存のアプローチでは、同時に効率的で直感的で、普遍的に安全な結束的なフレームワークを提供していない。
本稿では,ロボットの普遍的コンプライアンスを基盤として構築された,ロバストでコンプライアンスの取れた学習(LfD)を実現することによって,この基本的なギャップに対処する新しい階層化制御フレームワークを提案する。
提案手法は, 進行的および相互接続的な3段階に構成されている。
まず,1つの実演から軌道と可変インピーダンスの両方を学習し,効率と再現率を大幅に向上させるリアルタイムLfD法を提案する。
高品質で直感的な「美学教育」を確実にするために、我々は、特異点を積極的に管理し、人間の実演中に一貫した相互作用感を提供するヌル空間最適化戦略を提案する。
最後に,汎用安全性を確保するため,ロボット本体全体がメインタスク性能を損なうことなく,学習後の外部インタラクションに順応できる基本的ヌルスペースコンプライアンス手法を導入する。
この最後のコントリビューションは、システムを多目的なHRIプラットフォームに変換し、エンドエフェクタ(EE)固有のアプリケーションを超えていく。
7-DOF KUKA LWRロボットの総合的な比較実験により,完全なフレームワークを検証する。
その結果、より安全で、より直感的で、より効率的な統合システムにより、幅広いロボットとロボットの協調作業が可能となった。
関連論文リスト
- InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills [16.31202379413011]
我々は,現実世界の人間-物体間相互作用(HOI)制御のための統合物理学に基づく模倣学習フレームワークを開発した。
InterRealは、人間型ロボットがHOI参照動作をトラッキングし、きめ細かい対話的スキルの学習を容易にする。
クリティカルトラッキングエラーメトリクスによって導かれるメタ政治は、低レベルの強化学習目標に対して報酬信号を探索し、割り当てる。
論文 参考訳(メタデータ) (2026-03-08T07:44:35Z) - Interaction-Grounded Learning for Contextual Markov Decision Processes with Personalized Feedback [59.287761696290865]
本稿では,個人化されたフィードバックを伴って,文脈的マルコフ決定プロセス(MDP)のサブ線形後悔保証を実現する計算効率の高いアルゴリズムを提案する。
提案手法の有効性を,合成エピソードMDPと実世界のユーザ予約データセットの両方を用いた実験を通じて,マルチターンインタラクションからパーソナライズされた目的を学習する際の有効性を示す。
論文 参考訳(メタデータ) (2026-02-09T06:29:54Z) - Scalable Dexterous Robot Learning with AR-based Remote Human-Robot Interactions [8.111267700755986]
本稿では,手軽なロボットアームハンドシステムにおける操作のためのスケーラブルなロボット学習に焦点を当てた。
本稿では,汎用的な操作タスク問題に対処するための統一的なフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-07T03:47:21Z) - ConceptACT: Episode-Level Concepts for Sample-Efficient Robotic Imitation Learning [2.9277370836568264]
ConceptACTはAction Chunking with Transformersの拡張で、トレーニング中にエピソードレベルのセマンティックな概念アノテーションを活用して学習効率を向上させる。
我々は、最終エンコーダ層が人間のアノテーションと整合するように調整された、概念認識のクロスアテンションを実装するトランスフォーマーアーキテクチャを用いて概念を統合する。
論文 参考訳(メタデータ) (2026-01-23T19:24:00Z) - Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation [90.90219129619344]
本稿では,スパイキング機能を備えたR-prior-S, Recurrent Geometric-priormodal Policyを提案する。
物理的現実の高レベル推論を基礎として、軽量な2次元幾何学的帰納バイアスを利用する。
ロボット行動生成におけるデータ効率問題に対して,再帰的適応スパイクネットワークを導入する。
論文 参考訳(メタデータ) (2026-01-13T23:36:30Z) - Learning specifications for reactive synthesis with safety constraints [9.76292270520872]
我々は、潜在タスクを確率的形式言語としてモデル化し、適切な反応合成フレームワークを導入する。
既存のエビデンス駆動のステートアルゴリズムをマージし、学習プロセス全体を通して安全性要件を取り入れます。
本手法は,ロボットと環境の相互作用を動的変化を考慮した2人プレイヤゲームとしてモデル化する。
論文 参考訳(メタデータ) (2026-01-09T05:17:45Z) - StaMo: Unsupervised Learning of Generalizable Robot Motion from Compact State Representation [56.996371714721995]
高度に圧縮された2つの状態表現を学習する教師なしの手法を提案する。
私たちの表現は効率的で解釈可能で、既存のVLAベースのモデルとシームレスに統合されます。
提案手法は,コンパクトな状態表現から一般化可能なロボットモーションを学習できることから,StaMoと命名する。
論文 参考訳(メタデータ) (2025-10-06T17:37:24Z) - Self-Augmented Robot Trajectory: Efficient Imitation Learning via Safe Self-augmentation with Demonstrator-annotated Precision [2.3548641190233264]
自己拡張型ロボット軌道(Self-Augmented Robot Trajectory, SART)は、一つの人間のデモンストレーションからポリシー学習を可能にするフレームワークである。
SARTは、人間による実証にのみ訓練されたポリシーよりも、はるかに高い成功率を達成する。
論文 参考訳(メタデータ) (2025-09-11T23:10:56Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。