論文の概要: Domain adaptation under structural causal models
- arxiv url: http://arxiv.org/abs/2010.15764v2
- Date: Wed, 24 Nov 2021 04:26:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 22:35:55.442785
- Title: Domain adaptation under structural causal models
- Title(参考訳): 構造因果モデルに基づく領域適応
- Authors: Yuansi Chen, Peter B\"uhlmann
- Abstract要約: ドメイン適応(DA)は、モデルをトレーニングするために使用されるソースデータが、モデルをテストするために使用されるターゲットデータとは異なるときに発生する。
近年のDAの進歩は主に応用駆動型である。
本稿では,DA手法の予測性能の解析と比較を可能にする構造因果モデルによる理論的枠組みを提案する。
- 参考スコア(独自算出の注目度): 2.627046865670577
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain adaptation (DA) arises as an important problem in statistical machine
learning when the source data used to train a model is different from the
target data used to test the model. Recent advances in DA have mainly been
application-driven and have largely relied on the idea of a common subspace for
source and target data. To understand the empirical successes and failures of
DA methods, we propose a theoretical framework via structural causal models
that enables analysis and comparison of the prediction performance of DA
methods. This framework also allows us to itemize the assumptions needed for
the DA methods to have a low target error. Additionally, with insights from our
theory, we propose a new DA method called CIRM that outperforms existing DA
methods when both the covariates and label distributions are perturbed in the
target data. We complement the theoretical analysis with extensive simulations
to show the necessity of the devised assumptions. Reproducible synthetic and
real data experiments are also provided to illustrate the strengths and
weaknesses of DA methods when parts of the assumptions in our theory are
violated.
- Abstract(参考訳): ドメイン適応(DA)は、モデルをトレーニングするために使用されるソースデータが、モデルをテストするために使用されるターゲットデータと異なる場合、統計機械学習において重要な問題となる。
DAの最近の進歩は主にアプリケーション駆動であり、ソースデータとターゲットデータの共通部分空間の考え方に大きく依存している。
da法の実証的成功と失敗を理解するために,da手法の予測性能の分析と比較を可能にする構造因果モデルによる理論的枠組みを提案する。
このフレームワークはまた、DAメソッドが低い目標誤差を持つのに必要な仮定を分類することができます。
さらに,本理論から得られた知見により,コバルト分布とラベル分布の両方が対象データに摂動した場合に既存のda法を上回るcirmと呼ばれる新しいda法を提案する。
理論解析を広範囲なシミュレーションで補完し,提案する仮定の必要性を示す。
再現可能な合成および実データ実験は、我々の理論における仮定の一部に違反した場合のda法の強みと弱みを説明するためにも提供される。
関連論文リスト
- Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-10-17T17:59:02Z) - Revisiting Spurious Correlation in Domain Generalization [12.745076668687748]
データ生成プロセスにおける因果関係を記述するために,構造因果モデル(SCM)を構築した。
さらに、スプリアス相関に基づくメカニズムを徹底的に分析する。
そこで本研究では,OOD一般化における共起バイアスの制御について,相対性スコア重み付き推定器を導入して提案する。
論文 参考訳(メタデータ) (2024-06-17T13:22:00Z) - Model Reconstruction Using Counterfactual Explanations: A Perspective From Polytope Theory [9.771997770574947]
本研究は, 対物モデルを用いたモデル再構成を改良する方法について分析する。
我々の主な貢献は、モデル再構成における誤差と対実的なクエリの数の間の新しい理論的関係を導出することである。
論文 参考訳(メタデータ) (2024-05-08T18:52:47Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Using causal inference to avoid fallouts in data-driven parametric
analysis: a case study in the architecture, engineering, and construction
industry [0.7566148383213173]
実世界の実装における意思決定プロセスは、データ駆動モデルへの依存の高まりに影響を受けています。
本研究では,データ駆動手法,経験的ドメイン知識,第一原理シミュレーションの相乗パターンについて検討した。
論文 参考訳(メタデータ) (2023-09-11T13:54:58Z) - On the Need of a Modeling Language for Distribution Shifts: Illustrations on Tabular Datasets [30.518020409197767]
5つのデータセットと6万のメソッド構成にまたがる自然なシフトを含む実験的なテストベッドを構築します。
ML文献のX$(co)シフトに重きを置いているのとは対照的に、Y|X$-shiftsはテストベッドでもっとも一般的です。
論文 参考訳(メタデータ) (2023-07-11T14:25:10Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Structural Regularization [0.0]
本稿では,統計モデルの正則化として経済理論に基づく構造モデルを用いて,データモデリングの新しい手法を提案する。
本手法は, 構造モデルと非構造正規化統計モデルの両方より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-27T06:47:07Z) - Adversarial Distributional Training for Robust Deep Learning [53.300984501078126]
逆行訓練(AT)は、逆行例によるトレーニングデータを増やすことにより、モデルロバスト性を改善する最も効果的な手法の一つである。
既存のAT手法の多くは、敵の例を作らせるために特定の攻撃を採用しており、他の目に見えない攻撃に対する信頼性の低い堅牢性につながっている。
本稿では,ロバストモデル学習のための新しいフレームワークであるADTを紹介する。
論文 参考訳(メタデータ) (2020-02-14T12:36:59Z) - Few-shot Domain Adaptation by Causal Mechanism Transfer [107.08605582020866]
我々は,少数のラベル付き対象ドメインデータと多数のラベル付きソースドメインデータしか利用できないレグレッション問題に対して,数ショットの教師付きドメイン適応(DA)について検討する。
現在のDA法の多くは、パラメータ化された分布シフトまたは明らかな分布類似性に基づく転送仮定に基づいている。
本稿では,データ生成機構がドメイン間で不変であるメタ分散シナリオであるメカニズム転送を提案する。
論文 参考訳(メタデータ) (2020-02-10T02:16:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。