論文の概要: Domain adaptation under structural causal models
- arxiv url: http://arxiv.org/abs/2010.15764v2
- Date: Wed, 24 Nov 2021 04:26:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 22:35:55.442785
- Title: Domain adaptation under structural causal models
- Title(参考訳): 構造因果モデルに基づく領域適応
- Authors: Yuansi Chen, Peter B\"uhlmann
- Abstract要約: ドメイン適応(DA)は、モデルをトレーニングするために使用されるソースデータが、モデルをテストするために使用されるターゲットデータとは異なるときに発生する。
近年のDAの進歩は主に応用駆動型である。
本稿では,DA手法の予測性能の解析と比較を可能にする構造因果モデルによる理論的枠組みを提案する。
- 参考スコア(独自算出の注目度): 2.627046865670577
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain adaptation (DA) arises as an important problem in statistical machine
learning when the source data used to train a model is different from the
target data used to test the model. Recent advances in DA have mainly been
application-driven and have largely relied on the idea of a common subspace for
source and target data. To understand the empirical successes and failures of
DA methods, we propose a theoretical framework via structural causal models
that enables analysis and comparison of the prediction performance of DA
methods. This framework also allows us to itemize the assumptions needed for
the DA methods to have a low target error. Additionally, with insights from our
theory, we propose a new DA method called CIRM that outperforms existing DA
methods when both the covariates and label distributions are perturbed in the
target data. We complement the theoretical analysis with extensive simulations
to show the necessity of the devised assumptions. Reproducible synthetic and
real data experiments are also provided to illustrate the strengths and
weaknesses of DA methods when parts of the assumptions in our theory are
violated.
- Abstract(参考訳): ドメイン適応(DA)は、モデルをトレーニングするために使用されるソースデータが、モデルをテストするために使用されるターゲットデータと異なる場合、統計機械学習において重要な問題となる。
DAの最近の進歩は主にアプリケーション駆動であり、ソースデータとターゲットデータの共通部分空間の考え方に大きく依存している。
da法の実証的成功と失敗を理解するために,da手法の予測性能の分析と比較を可能にする構造因果モデルによる理論的枠組みを提案する。
このフレームワークはまた、DAメソッドが低い目標誤差を持つのに必要な仮定を分類することができます。
さらに,本理論から得られた知見により,コバルト分布とラベル分布の両方が対象データに摂動した場合に既存のda法を上回るcirmと呼ばれる新しいda法を提案する。
理論解析を広範囲なシミュレーションで補完し,提案する仮定の必要性を示す。
再現可能な合成および実データ実験は、我々の理論における仮定の一部に違反した場合のda法の強みと弱みを説明するためにも提供される。
関連論文リスト
- Toward the Identifiability of Comparative Deep Generative Models [7.5479347719819865]
比較深部生成モデル(DGM)における識別可能性の理論を提案する。
これらのモデルは、一般的な混合関数のクラスにおいて識別性に欠けるが、混合関数が断片的アフィンであるときに驚くほど識別可能であることを示す。
また, モデルミス種別の影響についても検討し, 従来提案されていた比較DGMの正則化手法が, 潜伏変数の数が事前に分かっていない場合に, 識別可能性を高めることを実証的に示す。
論文 参考訳(メタデータ) (2024-01-29T06:10:54Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Using causal inference to avoid fallouts in data-driven parametric
analysis: a case study in the architecture, engineering, and construction
industry [0.7566148383213173]
実世界の実装における意思決定プロセスは、データ駆動モデルへの依存の高まりに影響を受けています。
本研究では,データ駆動手法,経験的ドメイン知識,第一原理シミュレーションの相乗パターンについて検討した。
論文 参考訳(メタデータ) (2023-09-11T13:54:58Z) - Learning Robust Statistics for Simulation-based Inference under Model
Misspecification [23.331522354991527]
本稿では,シミュレーションに基づく推論手法の異なるクラスにまたがって機能するモデル不特定性を扱うための,最初の一般的なアプローチを提案する。
提案手法は,モデルが適切に特定された場合の精度を保ちながら,不特定シナリオにおいて頑健な推論をもたらすことを示す。
論文 参考訳(メタデータ) (2023-05-25T09:06:26Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Structural Regularization [0.0]
本稿では,統計モデルの正則化として経済理論に基づく構造モデルを用いて,データモデリングの新しい手法を提案する。
本手法は, 構造モデルと非構造正規化統計モデルの両方より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-27T06:47:07Z) - Adversarial Distributional Training for Robust Deep Learning [53.300984501078126]
逆行訓練(AT)は、逆行例によるトレーニングデータを増やすことにより、モデルロバスト性を改善する最も効果的な手法の一つである。
既存のAT手法の多くは、敵の例を作らせるために特定の攻撃を採用しており、他の目に見えない攻撃に対する信頼性の低い堅牢性につながっている。
本稿では,ロバストモデル学習のための新しいフレームワークであるADTを紹介する。
論文 参考訳(メタデータ) (2020-02-14T12:36:59Z) - Few-shot Domain Adaptation by Causal Mechanism Transfer [107.08605582020866]
我々は,少数のラベル付き対象ドメインデータと多数のラベル付きソースドメインデータしか利用できないレグレッション問題に対して,数ショットの教師付きドメイン適応(DA)について検討する。
現在のDA法の多くは、パラメータ化された分布シフトまたは明らかな分布類似性に基づく転送仮定に基づいている。
本稿では,データ生成機構がドメイン間で不変であるメタ分散シナリオであるメカニズム転送を提案する。
論文 参考訳(メタデータ) (2020-02-10T02:16:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。