論文の概要: Skeletal Feature Compensation for Imitation Learning with Embodiment
Mismatch
- arxiv url: http://arxiv.org/abs/2104.07810v1
- Date: Thu, 15 Apr 2021 22:50:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 06:24:04.638373
- Title: Skeletal Feature Compensation for Imitation Learning with Embodiment
Mismatch
- Title(参考訳): 具体的ミスマッチを伴う模倣学習における骨格特徴量補償
- Authors: Eddy Hudson, Garrett Warnell, Faraz Torabi, Peter Stone
- Abstract要約: SILEMは,学習者や専門家から得られた骨格的特徴の違いを補う模倣学習手法である。
我々は、PyBulletのHalfCheetahとAntに基づいておもちゃのドメインを作成し、SILEMのこの種のエンボディメントミスマッチに対する利点を評価する。
また、より現実的な問題について定性的かつ定量的な結果を提供します。人間のデモンストレーションを観察して歩くために、シミュレーションされたヒューマノイドエージェントを教えます。
- 参考スコア(独自算出の注目度): 51.03498820458658
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning from demonstrations in the wild (e.g. YouTube videos) is a
tantalizing goal in imitation learning. However, for this goal to be achieved,
imitation learning algorithms must deal with the fact that the demonstrators
and learners may have bodies that differ from one another. This condition --
"embodiment mismatch" -- is ignored by many recent imitation learning
algorithms. Our proposed imitation learning technique, SILEM (\textbf{S}keletal
feature compensation for \textbf{I}mitation \textbf{L}earning with
\textbf{E}mbodiment \textbf{M}ismatch), addresses a particular type of
embodiment mismatch by introducing a learned affine transform to compensate for
differences in the skeletal features obtained from the learner and expert. We
create toy domains based on PyBullet's HalfCheetah and Ant to assess SILEM's
benefits for this type of embodiment mismatch. We also provide qualitative and
quantitative results on more realistic problems -- teaching simulated humanoid
agents, including Atlas from Boston Dynamics, to walk by observing human
demonstrations.
- Abstract(参考訳): 野生でのデモ(例)から学ぶ
YouTubeビデオ)は模倣学習の目標だ。
しかし、この目標を達成するためには、模擬学習アルゴリズムは、デモ参加者と学習者が互いに異なる身体を持つ可能性があるという事実に対処する必要がある。
この「身体的ミスマッチ」は、近年の模倣学習アルゴリズムでは無視されている。
提案手法であるSILEM(\textbf{S}keletal feature compensation for \textbf{I}mitation \textbf{L}earning with \textbf{E}mbodiment \textbf{M}ismatch)は,学習者や専門家から得られた骨格特徴の違いを補償するアフィン変換を導入することで,特定の種類の実施ミスマッチに対処する。
我々は、PyBulletのHalfCheetahとAntに基づいておもちゃのドメインを作成し、SILEMのこの種のエンボディメントミスマッチに対する利点を評価する。
我々はまた、より現実的な問題に関する質的かつ定量的な結果も提供します -- ボストン・ダイナミクスのAtlasを含むシミュレーションされたヒューマノイドエージェントに、人間のデモを観察して歩くように教えています。
関連論文リスト
- The Common Stability Mechanism behind most Self-Supervised Learning
Approaches [64.40701218561921]
自己指導型学習手法の安定性のメカニズムを説明するための枠組みを提供する。
我々は,BYOL,SWAV,SimSiam,Barlow Twins,DINOなどの非コントラスト技術であるSimCLRの動作メカニズムについて議論する。
私たちは異なる仮説を定式化し、Imagenet100データセットを使ってそれらをテストします。
論文 参考訳(メタデータ) (2024-02-22T20:36:24Z) - Contrastive Unlearning: A Contrastive Approach to Machine Unlearning [30.38966646250252]
本研究では,表現学習の概念を有効活用する,対照的な非学習フレームワークを提案する。
その結果,非学習の非学習効果と効率性は,最先端のアルゴリズムと比較して低い結果が得られた。
論文 参考訳(メタデータ) (2024-01-19T02:16:30Z) - Sequential Causal Imitation Learning with Unobserved Confounders [82.22545916247269]
猿が猿を見なさい」とは、制度の根底にある仕組みを深く理解せずに「生」の模倣を指して、昔ながらの格言である。
本稿では、エピソード毎に複数の意思決定をしなければならないシーケンシャルセッティングにおける因果模倣学習の問題について検討する。
論文 参考訳(メタデータ) (2022-08-12T13:53:23Z) - Partner-Assisted Learning for Few-Shot Image Classification [54.66864961784989]
人間の視覚能力を模倣し、徹底的な人間のアノテーションを必要とせずに効果的なモデルを学ぶために、わずかなショットラーニングが研究されている。
本稿では,新しいクラスのプロトタイプをラベル付きサンプルから推定できるように,要素表現を得るためのトレーニング戦略の設計に焦点をあてる。
本稿では,まずパートナーエンコーダのペアワイド類似性をモデル化し,ソフトアンカーとして機能する特徴を抽出し,その出力をソフトアンカーと整列させ,分類性能を最大化しようとする2段階トレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T22:46:19Z) - RAIL: A modular framework for Reinforcement-learning-based Adversarial
Imitation Learning [47.535110066013736]
Reinforcement-learning-based Adversarial Imitation Learning (RAIL) という,組織的なモジュール型フレームワークを提案する。
SAIfO: SAC-based Adversarial Imitation from ObservationとSILEM(Skeletal Feature Compensation for Imitation Learning with Embodiment Mismatch)の2つの新しいifO(Imitation from Observation)アルゴリズムを作成します。
本稿では,SAIfOに着目し,OpenAI Gymのロコモーションタスクのスイートで評価し,FifOを実行する並列RAILアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-08T18:16:27Z) - Few-shot Visual Reasoning with Meta-analogical Contrastive Learning [141.2562447971]
本稿では,類似推論に頼って,数ショット(または低ショット)の視覚推論問題を解くことを提案する。
両領域の要素間の構造的関係を抽出し、類似学習と可能な限り類似するように強制する。
RAVENデータセット上での本手法の有効性を検証し, トレーニングデータが少ない場合, 最先端の手法より優れることを示す。
論文 参考訳(メタデータ) (2020-07-23T14:00:34Z) - Adversarial Machine Learning in Network Intrusion Detection Systems [6.18778092044887]
ネットワーク侵入検知システムにおける逆問題の性質について検討する。
進化的計算(粒子群最適化と遺伝的アルゴリズム)と深層学習(生成的敵ネットワーク)を、敵対的サンプル生成のためのツールとして利用する。
我々の研究は、敵の摂動に直面した機械学習ベースのNIDSの脆弱性を強調している。
論文 参考訳(メタデータ) (2020-04-23T19:47:43Z) - State-Only Imitation Learning for Dexterous Manipulation [63.03621861920732]
本稿では,国家のみの模倣学習について考察する。
我々は、逆ダイナミクスモデルをトレーニングし、状態のみのデモンストレーションのアクションを予測するためにそれを使用します。
我々の手法は状態-作用アプローチと同等に動作し、RL単独よりもかなり優れています。
論文 参考訳(メタデータ) (2020-04-07T17:57:20Z) - Metric-Based Imitation Learning Between Two Dissimilar Anthropomorphic
Robotic Arms [29.08134072341867]
模倣学習における大きな課題の1つは、対応問題である。
異種エンボディメント間の距離測定を導入する。
この尺度は, 実施形態の類似性を記述し, 遠隔操作による模倣政策の学習に適していることが判明した。
論文 参考訳(メタデータ) (2020-02-25T19:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。