論文の概要: DIGIC: Domain Generalizable Imitation Learning by Causal Discovery
- arxiv url: http://arxiv.org/abs/2402.18910v1
- Date: Thu, 29 Feb 2024 07:09:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 15:56:28.740445
- Title: DIGIC: Domain Generalizable Imitation Learning by Causal Discovery
- Title(参考訳): DIGIC:因果発見によるドメイン一般化可能な模倣学習
- Authors: Yang Chen, Yitao Liang, Zhouchen Lin
- Abstract要約: 因果性は機械学習と組み合わせて、ドメインの一般化のための堅牢な表現を生成する。
我々は、実証データ分布を活用して、ドメインの一般化可能なポリシーの因果的特徴を発見するために、異なる試みを行っている。
DIGICと呼ばれる新しいフレームワークを設計し、実演データ分布から専門家行動の直接的な原因を見出すことにより因果的特徴を識別する。
- 参考スコア(独自算出の注目度): 69.13526582209165
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causality has been combined with machine learning to produce robust
representations for domain generalization. Most existing methods of this type
require massive data from multiple domains to identify causal features by
cross-domain variations, which can be expensive or even infeasible and may lead
to misidentification in some cases. In this work, we make a different attempt
by leveraging the demonstration data distribution to discover the causal
features for a domain generalizable policy. We design a novel framework, called
DIGIC, to identify the causal features by finding the direct cause of the
expert action from the demonstration data distribution via causal discovery.
Our framework can achieve domain generalizable imitation learning with only
single-domain data and serve as a complement for cross-domain variation-based
methods under non-structural assumptions on the underlying causal models. Our
empirical study in various control tasks shows that the proposed framework
evidently improves the domain generalization performance and has comparable
performance to the expert in the original domain simultaneously.
- Abstract(参考訳): 因果性は機械学習と組み合わされ、ドメインの一般化のための堅牢な表現を生み出す。
このタイプの既存の方法の多くは、クロスドメインのバリエーションによって因果的特徴を特定するために、複数のドメインからの膨大なデータを必要とする。
本研究では,実演データ分布を利用して,ドメイン一般化ポリシーの因果的特徴を発見することで,異なる試みを行う。
DIGICと呼ばれる新しいフレームワークを設計し、因果発見による実演データ分布から専門家行動の直接的な原因を見つけることによって因果的特徴を特定する。
本フレームワークは、単一ドメインデータのみを用いてドメイン一般化可能な模倣学習を実現し、基礎となる因果モデルに対する非構造的仮定の下で、ドメイン間変動に基づく手法の補完となる。
各種制御タスクにおける実証研究により,提案フレームワークは明らかにドメインの一般化性能を向上し,同時に元のドメインの専門家に匹敵する性能を示した。
関連論文リスト
- Fine-Tuning Pre-trained Language Models for Robust Causal Representation Learning [26.29386609645171]
プレトレーニング言語モデル(PLM)の微調整は、様々な領域で有効であることが示されている。
本研究では, 分解仮定に基づいて, いわゆる因果前ドア調整によりロバスト表現を導出可能であることを示す。
そこで本研究では,表現学習に微調整機構と因果関係を導入することにより,領域一般化問題に光を当てる。
論文 参考訳(メタデータ) (2024-10-18T11:06:23Z) - Domain Generalization via Causal Adjustment for Cross-Domain Sentiment
Analysis [59.73582306457387]
クロスドメイン感情分析における領域一般化の問題に焦点をあてる。
本稿では,ドメイン固有表現とドメイン不変表現をアンタングル化するバックドア調整に基づく因果モデルを提案する。
一連の実験は、我々のモデルの優れたパフォーマンスと堅牢性を示しています。
論文 参考訳(メタデータ) (2024-02-22T13:26:56Z) - Normalization Perturbation: A Simple Domain Generalization Method for
Real-World Domain Shifts [133.99270341855728]
実世界のドメインスタイルは環境の変化やセンサノイズによって大きく変化する可能性がある。
深層モデルはトレーニングドメインスタイルしか知らない。
このドメインスタイルのオーバーフィット問題を解決するために,正規化摂動を提案する。
論文 参考訳(メタデータ) (2022-11-08T17:36:49Z) - Gated Domain Units for Multi-source Domain Generalization [14.643490853965385]
分散シフト(DS)は、テスト時のデータセットとトレーニング時のデータセットが異なる場合に発生する。
GDU(Gated Domain Units)で構成されるモジュール型ニューラルネットワークレイヤを導入し,各潜伏する基本分布の表現を学習する。
推論中、各基本分布の表現と新しい観測結果を比較することで、重み付けされた学習機械のアンサンブルを作成することができる。
論文 参考訳(メタデータ) (2022-06-24T18:12:38Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - META: Mimicking Embedding via oThers' Aggregation for Generalizable
Person Re-identification [68.39849081353704]
Domain Generalizable (DG) Person Re-identification (ReID)は、トレーニング時に対象のドメインデータにアクセスすることなく、見えないドメインをまたいでテストすることを目的としている。
本稿では,DG ReID のための OThers' Aggregation (META) を用いた Mimicking Embedding という新しい手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T08:06:50Z) - Unsupervised Domain Generalization for Person Re-identification: A
Domain-specific Adaptive Framework [50.88463458896428]
ドメイン一般化(DG)は近年,人物再同定(ReID)において注目されている。
既存のメソッドは通常、ソースドメインにラベルを付ける必要があります。
本稿では、単純で効率的なドメイン固有適応化フレームワークを提案し、適応正規化モジュールで実現する。
論文 参考訳(メタデータ) (2021-11-30T02:35:51Z) - Towards Data-Free Domain Generalization [12.269045654957765]
異なるソースデータドメインでトレーニングされたモデルに含まれる知識は、どのようにして単一のモデルにマージされるのか?
以前のドメインの一般化手法は、典型的にはソースドメインデータの使用に依存しており、プライベートな分散データには適さない。
DeKANは、利用可能な教師モデルからドメイン固有の知識を抽出し、融合し、ドメインシフトに頑健な学生モデルに変換するアプローチである。
論文 参考訳(メタデータ) (2021-10-09T11:44:05Z) - Learning causal representations for robust domain adaptation [31.261956776418618]
多くの現実世界のアプリケーションでは、ターゲットのドメインデータが常に利用できるとは限らない。
本稿では,学習段階において対象ドメインデータが利用できない場合について検討する。
本稿では,深層オートエンコーダと因果構造学習を統一モデルに統合したCausal AutoEncoder (CAE)を提案する。
論文 参考訳(メタデータ) (2020-11-12T11:24:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。