論文の概要: ILoSA: Interactive Learning of Stiffness and Attractors
- arxiv url: http://arxiv.org/abs/2103.03099v1
- Date: Thu, 4 Mar 2021 15:25:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-05 14:44:50.082677
- Title: ILoSA: Interactive Learning of Stiffness and Attractors
- Title(参考訳): ILoSA: スティフネスとアトラクションのインタラクティブな学習
- Authors: Giovanni Franzese, Anna M\'esz\'aros, Luka Peternel, and Jens Kober
- Abstract要約: 本稿では,ユーザフレンドリーなインタフェースを用いて,人間の実演や修正からデカルト剛性とアトラクタの両方を学習できる可変インピーダンスポリシーの学習法について検討する。
ILoSAと呼ばれるこのフレームワークは、政策学習、不確実性領域の特定、インタラクティブな修正、剛性変調、アクティブ障害拒否を可能にするためにガウスプロセスを使用している。
この枠組みの実験的評価はフランカ-エミカ・パンダにおいて, ユニークな力相互作用特性を有する3つのケースで行った。
- 参考スコア(独自算出の注目度): 3.4753713006891647
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Teaching robots how to apply forces according to our preferences is still an
open challenge that has to be tackled from multiple engineering perspectives.
This paper studies how to learn variable impedance policies where both the
Cartesian stiffness and the attractor can be learned from human demonstrations
and corrections with a user-friendly interface. The presented framework, named
ILoSA, uses Gaussian Processes for policy learning, identifying regions of
uncertainty and allowing interactive corrections, stiffness modulation and
active disturbance rejection. The experimental evaluation of the framework is
carried out on a Franka-Emika Panda in three separate cases with unique force
interaction properties: 1) pulling a plug wherein a sudden force discontinuity
occurs upon successful removal of the plug, 2) pushing a box where a sustained
force is required to keep the robot in motion, and 3) wiping a whiteboard in
which the force is applied perpendicular to the direction of movement.
- Abstract(参考訳): ロボットに私たちの好みに応じて力を適用する方法を教えることは、複数のエンジニアリングの観点から取り組まなければならないオープンチャレンジです。
本稿では,ユーザフレンドリーなインタフェースを用いて,人間の実演や修正からデカルト剛性とアトラクタの両方を学習できる可変インピーダンスポリシーの学習法について検討する。
ILoSAと呼ばれるこのフレームワークは、政策学習、不確実性領域の特定、インタラクティブな修正、剛性変調、アクティブ障害拒否を可能にするためにガウスプロセスを使用している。
フランカ・エミカ・パンダにおいて,(1)プラグの取り外し成功時に突然の力の不連続が発生するプラグを引っ張る,(2)ロボットの動作を維持するために持続的な力を必要とする箱を押す,(3)力が移動方向に垂直に作用するホワイトボードを拭く,という3つの異なる力相互作用特性を有する実験的な評価を行った。
関連論文リスト
- Conformal Policy Learning for Sensorimotor Control Under Distribution
Shifts [61.929388479847525]
本稿では,センサコントローラの観測値の分布変化を検知・応答する問題に焦点をあてる。
鍵となる考え方は、整合量子を入力として取ることができるスイッチングポリシーの設計である。
本稿では, 基本方針を異なる特性で切り替えるために, 共形量子関数を用いてこのようなポリシーを設計する方法を示す。
論文 参考訳(メタデータ) (2023-11-02T17:59:30Z) - Multimodal and Force-Matched Imitation Learning with a See-Through Visuotactile Sensor [14.492202828369127]
我々は、模倣学習(IL)の枠組みの中でマルチモーダル・ビゾタクタクタブル・センサを活用し、コンタクトリッチなタスクを実行する。
本稿では,IL改善のための補完手法として,触覚力マッチングと学習モード切替という2つのアルゴリズム的貢献を紹介する。
以上の結果から, 力の一致が平均政策成功率62.5%, ビズオタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタク
論文 参考訳(メタデータ) (2023-11-02T14:02:42Z) - Robotic Handling of Compliant Food Objects by Robust Learning from
Demonstration [79.76009817889397]
本稿では,食品に適合する物体をロボットで把握する上で,実証からの学習(LfD)に基づく頑健な学習方針を提案する。
教師の意図した方針を推定し,無矛盾な実演を自動的に除去するLfD学習ポリシーを提案する。
提案されたアプローチは、前述の業界セクターで幅広い応用が期待できる。
論文 参考訳(メタデータ) (2023-09-22T13:30:26Z) - Learning Vision-based Pursuit-Evasion Robot Policies [54.52536214251999]
我々は、部分的に観察可能なロボットの監督を生成する完全観測可能なロボットポリシーを開発する。
我々は、RGB-Dカメラを搭載した4足歩行ロボットに、野生での追従回避のインタラクションにポリシーを展開させる。
論文 参考訳(メタデータ) (2023-08-30T17:59:05Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Learning Variable Impedance Skills from Demonstrations with Passivity Guarantee [13.498124592226734]
本稿では,力覚と運動情報を統合し,可変インピーダンス制御を実現するための学習支援フレームワークを提案する。
タンクを用いた可変インピーダンス制御手法を提案する。
論文 参考訳(メタデータ) (2023-06-20T06:05:04Z) - Object-Aware Regularization for Addressing Causal Confusion in Imitation
Learning [131.1852444489217]
本稿では,オブジェクト認識方式で模倣ポリシーを標準化する手法として,オブジェクト認識型RegularizatiOn(OREO)を提案する。
我々の主な考えは、政策が専門家の行動と強く相関するニュアンス変数を悪用することを防ぐために、政策が全ての意味オブジェクトに均一に出席することを奨励することである。
論文 参考訳(メタデータ) (2021-10-27T01:56:23Z) - Teaching Robots to Grasp Like Humans: An Interactive Approach [3.3836709236378746]
本研究は,実証と修正に基づいて,人間から把握する複雑な作業がどのように学習されるかを検討する。
より良いデモを提供するように訓練する代わりに、専門家でないユーザには、最初のデモのダイナミクスをインタラクティブに修正する能力が提供される。
論文 参考訳(メタデータ) (2021-10-09T10:27:50Z) - A GAN-Like Approach for Physics-Based Imitation Learning and Interactive
Character Control [2.2082422928825136]
物理的にシミュレートされた文字の対話的制御のためのシンプルで直感的なアプローチを提案する。
本研究は,GAN(Generative Adversarial Network)と強化学習に基づく。
我々は,本手法の適用性を,模倣と対話的な制御タスクの範囲で強調する。
論文 参考訳(メタデータ) (2021-05-21T00:03:29Z) - Towards Coordinated Robot Motions: End-to-End Learning of Motion
Policies on Transform Trees [63.31965375413414]
人間による実証から構造化政策を学習し、マルチタスクの課題解決を提案します。
我々の構造化ポリシーは、異なる空間におけるサブタスクポリシーを組み合わせるためのフレームワークであるRMPflowにインスパイアされている。
マルチタスク問題に適したエンドツーエンドの学習目標関数を導き出します。
論文 参考訳(メタデータ) (2020-12-24T22:46:22Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。