論文の概要: Skeletal Feature Compensation for Imitation Learning with Embodiment
Mismatch
- arxiv url: http://arxiv.org/abs/2104.07810v1
- Date: Thu, 15 Apr 2021 22:50:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 06:24:04.638373
- Title: Skeletal Feature Compensation for Imitation Learning with Embodiment
Mismatch
- Title(参考訳): 具体的ミスマッチを伴う模倣学習における骨格特徴量補償
- Authors: Eddy Hudson, Garrett Warnell, Faraz Torabi, Peter Stone
- Abstract要約: SILEMは,学習者や専門家から得られた骨格的特徴の違いを補う模倣学習手法である。
我々は、PyBulletのHalfCheetahとAntに基づいておもちゃのドメインを作成し、SILEMのこの種のエンボディメントミスマッチに対する利点を評価する。
また、より現実的な問題について定性的かつ定量的な結果を提供します。人間のデモンストレーションを観察して歩くために、シミュレーションされたヒューマノイドエージェントを教えます。
- 参考スコア(独自算出の注目度): 51.03498820458658
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning from demonstrations in the wild (e.g. YouTube videos) is a
tantalizing goal in imitation learning. However, for this goal to be achieved,
imitation learning algorithms must deal with the fact that the demonstrators
and learners may have bodies that differ from one another. This condition --
"embodiment mismatch" -- is ignored by many recent imitation learning
algorithms. Our proposed imitation learning technique, SILEM (\textbf{S}keletal
feature compensation for \textbf{I}mitation \textbf{L}earning with
\textbf{E}mbodiment \textbf{M}ismatch), addresses a particular type of
embodiment mismatch by introducing a learned affine transform to compensate for
differences in the skeletal features obtained from the learner and expert. We
create toy domains based on PyBullet's HalfCheetah and Ant to assess SILEM's
benefits for this type of embodiment mismatch. We also provide qualitative and
quantitative results on more realistic problems -- teaching simulated humanoid
agents, including Atlas from Boston Dynamics, to walk by observing human
demonstrations.
- Abstract(参考訳): 野生でのデモ(例)から学ぶ
YouTubeビデオ)は模倣学習の目標だ。
しかし、この目標を達成するためには、模擬学習アルゴリズムは、デモ参加者と学習者が互いに異なる身体を持つ可能性があるという事実に対処する必要がある。
この「身体的ミスマッチ」は、近年の模倣学習アルゴリズムでは無視されている。
提案手法であるSILEM(\textbf{S}keletal feature compensation for \textbf{I}mitation \textbf{L}earning with \textbf{E}mbodiment \textbf{M}ismatch)は,学習者や専門家から得られた骨格特徴の違いを補償するアフィン変換を導入することで,特定の種類の実施ミスマッチに対処する。
我々は、PyBulletのHalfCheetahとAntに基づいておもちゃのドメインを作成し、SILEMのこの種のエンボディメントミスマッチに対する利点を評価する。
我々はまた、より現実的な問題に関する質的かつ定量的な結果も提供します -- ボストン・ダイナミクスのAtlasを含むシミュレーションされたヒューマノイドエージェントに、人間のデモを観察して歩くように教えています。
関連論文リスト
- Boosting Semi-Supervised Scene Text Recognition via Viewing and Summarizing [71.29488677105127]
既存のシーンテキスト認識(STR)手法は、特に芸術的で歪んだ文字に対して、挑戦的なテキストを認識するのに苦労している。
人的コストを伴わずに、合成データと実際のラベルなしデータを活用して、対照的な学習ベースのSTRフレームワークを提案する。
本手法は,共通ベンチマークとUnion14M-Benchmarkで平均精度94.7%,70.9%のSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-11-23T15:24:47Z) - Representation Alignment from Human Feedback for Cross-Embodiment Reward Learning from Mixed-Quality Demonstrations [8.71931996488953]
本研究では,1つ以上の実施形態におけるビデオデモから報酬関数を学習したいと考える,クロス・エボディメント逆強化学習の課題について検討する。
本研究では,人間からのフィードバックを表現学習やアライメントに活用し,効果的なクロス・エボディメント学習を実現する技術について分析する。
論文 参考訳(メタデータ) (2024-08-10T18:24:14Z) - Contrastive Unlearning: A Contrastive Approach to Machine Unlearning [30.38966646250252]
本研究では,表現学習の概念を有効活用する,対照的な非学習フレームワークを提案する。
その結果,非学習の非学習効果と効率性は,最先端のアルゴリズムと比較して低い結果が得られた。
論文 参考訳(メタデータ) (2024-01-19T02:16:30Z) - Sequential Causal Imitation Learning with Unobserved Confounders [82.22545916247269]
猿が猿を見なさい」とは、制度の根底にある仕組みを深く理解せずに「生」の模倣を指して、昔ながらの格言である。
本稿では、エピソード毎に複数の意思決定をしなければならないシーケンシャルセッティングにおける因果模倣学習の問題について検討する。
論文 参考訳(メタデータ) (2022-08-12T13:53:23Z) - Partner-Assisted Learning for Few-Shot Image Classification [54.66864961784989]
人間の視覚能力を模倣し、徹底的な人間のアノテーションを必要とせずに効果的なモデルを学ぶために、わずかなショットラーニングが研究されている。
本稿では,新しいクラスのプロトタイプをラベル付きサンプルから推定できるように,要素表現を得るためのトレーニング戦略の設計に焦点をあてる。
本稿では,まずパートナーエンコーダのペアワイド類似性をモデル化し,ソフトアンカーとして機能する特徴を抽出し,その出力をソフトアンカーと整列させ,分類性能を最大化しようとする2段階トレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T22:46:19Z) - Few-shot Visual Reasoning with Meta-analogical Contrastive Learning [141.2562447971]
本稿では,類似推論に頼って,数ショット(または低ショット)の視覚推論問題を解くことを提案する。
両領域の要素間の構造的関係を抽出し、類似学習と可能な限り類似するように強制する。
RAVENデータセット上での本手法の有効性を検証し, トレーニングデータが少ない場合, 最先端の手法より優れることを示す。
論文 参考訳(メタデータ) (2020-07-23T14:00:34Z) - Adversarial Machine Learning in Network Intrusion Detection Systems [6.18778092044887]
ネットワーク侵入検知システムにおける逆問題の性質について検討する。
進化的計算(粒子群最適化と遺伝的アルゴリズム)と深層学習(生成的敵ネットワーク)を、敵対的サンプル生成のためのツールとして利用する。
我々の研究は、敵の摂動に直面した機械学習ベースのNIDSの脆弱性を強調している。
論文 参考訳(メタデータ) (2020-04-23T19:47:43Z) - State-Only Imitation Learning for Dexterous Manipulation [63.03621861920732]
本稿では,国家のみの模倣学習について考察する。
我々は、逆ダイナミクスモデルをトレーニングし、状態のみのデモンストレーションのアクションを予測するためにそれを使用します。
我々の手法は状態-作用アプローチと同等に動作し、RL単独よりもかなり優れています。
論文 参考訳(メタデータ) (2020-04-07T17:57:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。