論文の概要: Learning Variable Impedance Skills from Demonstrations with Passivity
Guarantee
- arxiv url: http://arxiv.org/abs/2306.11308v1
- Date: Tue, 20 Jun 2023 06:05:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 15:32:17.038027
- Title: Learning Variable Impedance Skills from Demonstrations with Passivity
Guarantee
- Title(参考訳): 受動保証付きデモから可変インピーダンススキルを学習する
- Authors: Yu Zhang, Long Cheng, Xiuze Xia, and Haoyu Zhang
- Abstract要約: 本稿では,力覚と運動情報を統合し,可変インピーダンス制御を実現するための学習支援フレームワークを提案する。
タンクを用いた可変インピーダンス制御手法を提案する。
- 参考スコア(独自算出の注目度): 13.446072103907971
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robots are increasingly being deployed not only in workplaces but also in
households. Effectively execute of manipulation tasks by robots relies on
variable impedance control with contact forces. Furthermore, robots should
possess adaptive capabilities to handle the considerable variations exhibited
by different robotic tasks in dynamic environments, which can be obtained
through human demonstrations. This paper presents a learning-from-demonstration
framework that integrates force sensing and motion information to facilitate
variable impedance control. The proposed approach involves the estimation of
full stiffness matrices from human demonstrations, which are then combined with
sensed forces and motion information to create a model using the non-parametric
method. This model allows the robot to replicate the demonstrated task while
also responding appropriately to new task conditions through the use of the
state-dependent stiffness profile. Additionally, a novel tank based variable
impedance control approach is proposed to ensure passivity by using the learned
stiffness. The proposed approach was evaluated using two virtual variable
stiffness systems. The first evaluation demonstrates that the stiffness
estimated approach exhibits superior robustness compared to traditional methods
when tested on manual datasets, and the second evaluation illustrates that the
novel tank based approach is more easily implementable compared to traditional
variable impedance control approaches.
- Abstract(参考訳): ロボットは職場だけでなく家庭にも配備されるようになっている。
ロボットによる操作タスクの効果的実行は、接触力による可変インピーダンス制御に依存する。
さらに、ロボットは、動的環境において異なるロボットタスクによって示されるかなりのバリエーションを扱うために適応能力を持つべきである。
本稿では,力覚と運動情報を統合し,可変インピーダンス制御を実現するための学習支援フレームワークを提案する。
提案手法は, 人間の実演からの全剛性行列を推定し, 知覚力と運動情報を組み合わせて非パラメトリック法を用いてモデルを作成する。
このモデルにより、ロボットは、状態依存剛性プロファイルを用いて、新しいタスク条件に適切に応答しながら、実証されたタスクを再現することができる。
さらに, 学習剛性を利用して透過性を確保するため, タンク型可変インピーダンス制御手法を提案する。
提案手法は2つの仮想変数剛性システムを用いて評価した。
第1の評価は,従来手法と比較して剛性推定手法の方が従来手法よりも頑健性が高いことを示し,第2評価では,従来の可変インピーダンス制御手法よりも新しいタンクベースアプローチの方が容易に実装できることを示す。
関連論文リスト
- Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control [2.058941610795796]
本稿では,低次元物理モデル学習のための合理化手法を提案する。
各種平面ソフトマニピュレータを用いたシミュレーションにより,本手法の有効性を検証した。
物理的に互換性のあるモデルを生成する方法のおかげで、学習したモデルはモデルベースの制御ポリシーと簡単に組み合わせることができる。
論文 参考訳(メタデータ) (2024-10-31T18:37:22Z) - Distributed Robust Learning based Formation Control of Mobile Robots based on Bioinspired Neural Dynamics [14.149584412213269]
まず,変数構造とカスケード設計手法を用いた分散推定器を導入し,実時間性能向上のための微分情報の必要性を排除した。
そして、スムーズな制御入力を提供し、スピードジャンプ問題を効果的に解決することを目的とした、バイオインスパイアされたニューラルダイナミックベースのアプローチを用いて、キネマティックトラッキング制御法を開発した。
完全に未知の力学と乱れを持つロボットの課題に対処するために,学習に基づく頑健な動的コントローラを開発した。
論文 参考訳(メタデータ) (2024-03-23T04:36:12Z) - SWBT: Similarity Weighted Behavior Transformer with the Imperfect
Demonstration for Robotic Manipulation [32.78083518963342]
SWBT(Simisity Weighted Behavior Transformer)という新しいフレームワークを提案する。
SWBTは、環境との相互作用なしに、専門家と不完全なデモンストレーションの両方から効果的に学習する。
我々は、ロボット操作タスクのオフライン模倣学習環境に不完全なデモンストレーションを統合する試みを初めて行った。
論文 参考訳(メタデータ) (2024-01-17T04:15:56Z) - DiAReL: Reinforcement Learning with Disturbance Awareness for Robust
Sim2Real Policy Transfer in Robot Control [0.0]
遅延マルコフ決定プロセスは、最近コミットされたアクションの有限時間ウィンドウでエージェントの状態空間を拡大することでマルコフ特性を満たす。
本稿では,遅延した環境下での乱れ増進型マルコフ決定プロセスを導入し,政治強化学習アルゴリズムのトレーニングにおける乱れ推定を取り入れた新しい表現法を提案する。
論文 参考訳(メタデータ) (2023-06-15T10:11:38Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Exploiting Symmetry and Heuristic Demonstrations in Off-policy
Reinforcement Learning for Robotic Manipulation [1.7901837062462316]
本稿では,物理ロボット環境に存在する自然対称性を定義し,組み込むことを目的とする。
提案手法は,産業用アームの2つのポイント・ツー・ポイント・リーチタスクによって,障害物を伴わずに検証される。
提案手法と従来の非政治強化学習アルゴリズムとの比較研究は,アプリケーションにおける学習性能と潜在的価値の優位性を示している。
論文 参考訳(メタデータ) (2023-04-12T11:38:01Z) - On Robust Numerical Solver for ODE via Self-Attention Mechanism [82.95493796476767]
我々は,内在性雑音障害を緩和し,AIによって強化された数値解法を,データサイズを小さくする訓練について検討する。
まず,教師付き学習における雑音を制御するための自己認識機構の能力を解析し,さらに微分方程式の数値解に付加的な自己認識機構を導入し,簡便かつ有効な数値解法であるAttrを提案する。
論文 参考訳(メタデータ) (2023-02-05T01:39:21Z) - Visual Adversarial Imitation Learning using Variational Models [60.69745540036375]
逆関数仕様は、深い強化学習を通しての学習行動にとって大きな障害であり続けている。
望ましい行動の視覚的なデモンストレーションは、エージェントを教えるためのより簡単で自然な方法を示すことが多い。
変動モデルに基づく対向的模倣学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-07-16T00:15:18Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Efficient Empowerment Estimation for Unsupervised Stabilization [75.32013242448151]
エンパワーメント原理は 直立位置での 力学系の教師なし安定化を可能にする
本稿では,ガウスチャネルとして動的システムのトレーニング可能な表現に基づく代替解を提案する。
提案手法は, サンプルの複雑さが低く, 訓練時より安定であり, エンパワーメント機能の本質的特性を有し, 画像からエンパワーメントを推定できることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:10:16Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。