論文の概要: Cross-Domain Imitation Learning with a Dual Structure
- arxiv url: http://arxiv.org/abs/2006.01494v3
- Date: Fri, 25 Sep 2020 08:19:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 23:25:31.593006
- Title: Cross-Domain Imitation Learning with a Dual Structure
- Title(参考訳): 二重構造によるクロスドメイン模倣学習
- Authors: Sungho Choi, Seungyul Han, Woojun Kim, Youngchul Sung
- Abstract要約: 対象ドメイン内のエージェントが、報酬関数にアクセスすることなく、ソースドメイン内の専門家のデモンストレーションを観察することにより、対象ドメイン内で適切に機能するポリシーを学習するクロスドメイン模倣学習(CDIL)。
本稿では,模倣学習におけるドメイン差を克服する2重構造学習手法を提案する。
シミュレーションの結果,提案手法は他の既存アルゴリズムよりもCDILの性能が優れており,ドメイン差のない模倣学習とほぼ同等の性能が得られることがわかった。
- 参考スコア(独自算出の注目度): 20.493193390620352
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we consider cross-domain imitation learning (CDIL) in which an
agent in a target domain learns a policy to perform well in the target domain
by observing expert demonstrations in a source domain without accessing any
reward function. In order to overcome the domain difference for imitation
learning, we propose a dual-structured learning method. The proposed learning
method extracts two feature vectors from each input observation such that one
vector contains domain information and the other vector contains policy
expertness information, and then enhances feature vectors by synthesizing new
feature vectors containing both target-domain and policy expertness
information. The proposed CDIL method is tested on several MuJoCo tasks where
the domain difference is determined by image angles or colors. Numerical
results show that the proposed method shows superior performance in CDIL to
other existing algorithms and achieves almost the same performance as imitation
learning without domain difference.
- Abstract(参考訳): 本稿では,対象ドメイン内のエージェントが,報酬機能にアクセスせずにソースドメインのエキスパートデモンストレーションを観察することで,対象ドメイン内で適切に実行する方針を学習するクロスドメイン模倣学習(cdil)について検討する。
模倣学習におけるドメイン差を克服するために, 二重構造学習法を提案する。
提案手法は,1つのベクターがドメイン情報,もう1つのベクターがポリシーエキスパート情報を含む各入力観測から2つの特徴ベクトルを抽出し,ターゲットドメイン情報とポリシーエキスパート情報の両方を含む新たな特徴ベクトルを合成することで機能ベクターを強化する。
提案手法は,画像の角度や色によって領域差が決定される MuJoCo タスク上でテストされる。
その結果,提案手法は他のアルゴリズムよりもcdilの性能が優れており,ドメイン差のない模倣学習とほぼ同等の性能が得られることがわかった。
関連論文リスト
- PiPa: Pixel- and Patch-wise Self-supervised Learning for Domain
Adaptative Semantic Segmentation [100.6343963798169]
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、学習モデルの他のドメインへの一般化を強化することを目的としている。
そこで我々は,ドメイン適応型セマンティックセマンティックセグメンテーションのための,PiPaという,画素・パッチ対応の自己教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-14T18:31:24Z) - Domain Invariant Masked Autoencoders for Self-supervised Learning from
Multi-domains [73.54897096088149]
マルチドメインからの自己教師型学習のためのドメイン不変のMasked AutoEncoder (DiMAE)を提案する。
中心となる考え方は、入力画像を異なるドメインからのスタイルノイズで拡張し、拡張イメージの埋め込みからイメージを再構築することである。
PACSとDomainNetの実験は、最近の最先端の手法と比較して、DiMAEがかなりの利益を得ていることを示している。
論文 参考訳(メタデータ) (2022-05-10T09:49:40Z) - Label Distribution Learning for Generalizable Multi-source Person
Re-identification [48.77206888171507]
人物再識別(Re-ID)は,映像監視システムにおいて重要な技術である。
教師付きモデルを任意の未確認領域に直接適用することは困難である。
一般化可能な多ソース人物Re-IDタスクに対処する新しいラベル分散学習法(LDL)を提案する。
論文 参考訳(メタデータ) (2022-04-12T15:59:10Z) - Vector-Decomposed Disentanglement for Domain-Invariant Object Detection [75.64299762397268]
ドメイン固有の表現からドメイン不変表現を取り除こうとする。
実験では,本手法を単目的,複目的のケースで評価した。
論文 参考訳(メタデータ) (2021-08-15T07:58:59Z) - Continuous and Diverse Image-to-Image Translation via Signed Attribute
Vectors [120.13149176992896]
本稿では,様々な領域にまたがる多様な写像経路の連続的な変換を可能にする,効果的に署名された属性ベクトルを提案する。
連続翻訳結果の視覚的品質を高めるため、2つの符号対称属性ベクトル間の軌跡を生成する。
論文 参考訳(メタデータ) (2020-11-02T18:59:03Z) - Adversarial Dual Distinct Classifiers for Unsupervised Domain Adaptation [67.83872616307008]
Unversarial Domain adaptation (UDA)は、異なる分散されたラベル付きソースドメインから学習モデルを構築することで、ラベルなしのターゲットサンプルを認識しようとする。
本稿では,タスク固有のカテゴリ境界に一致するソースとターゲット領域のデータ分布を同時に整合させる新しいアドリラルデュアル・ディスタンス・ネットワーク(AD$2$CN)を提案する。
具体的には、ドメイン不変の特徴発生器を利用して、識別的クロスドメインアライメントのガイダンスにより、ソースとターゲットデータを潜在共通空間に埋め込む。
論文 参考訳(メタデータ) (2020-08-27T01:29:10Z) - Unsupervised Cross-domain Image Classification by Distance Metric Guided
Feature Alignment [11.74643883335152]
教師なしドメイン適応は、ソースドメインからターゲットドメインに知識を転送する有望な道である。
本稿では,距離メトリックガイド機能アライメント(MetFA)を提案する。
我々のモデルは、クラス分布アライメントを統合して、ソースドメインからターゲットドメインにセマンティック知識を転送します。
論文 参考訳(メタデータ) (2020-08-19T13:36:57Z) - Cross-domain Detection via Graph-induced Prototype Alignment [114.8952035552862]
カテゴリレベルのドメインアライメントを求めるグラフ誘発プロトタイプアライメント(GPA)フレームワークを提案する。
さらに,クラス不均衡がドメイン適応に与える影響を軽減するために,クラス重み付きコントラスト損失を設計する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-03-28T17:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。