論文の概要: How Useful is Causal Invariance for Domain Adaptation in Finite-Sample Settings?
- arxiv url: http://arxiv.org/abs/2606.12680v1
- Date: Wed, 10 Jun 2026 21:07:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.461865
- Title: How Useful is Causal Invariance for Domain Adaptation in Finite-Sample Settings?
- Title(参考訳): 有限サンプル設定における領域適応の因果不均一性はどの程度有用か?
- Authors: Julia Kostin, Kasra Jalaldoust, Elias Bareinboim, Samory Kpotufe, Fanny Yang,
- Abstract要約: 機械学習モデルは、トレーニングされたソースディストリビューションとは異なるターゲットディストリビューションにデプロイされると、しばしば劣化する。
因果関係に基づく領域一般化における最近の研究は、共用因果構造が不変な予測因子を誘導する方法を示している。
本稿では,完全あるいは部分的な因果知識が,教師付きドメイン適応を確実に改善できるかどうかについて検討する。
- 参考スコア(独自算出の注目度): 58.740078141879984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning models often degrade when they are deployed on a target distribution that differs from the source distributions they were trained on. Recent work in causality-based domain generalization has shown how shared causal structure between domains can induce invariant predictors, e.g., models on a subset of features which have stable risk across structured domain shifts. However, the extent to which such population-level causal invariances can lead to gains in finite-sample settings remains underexplored. In particular, in practice we often have access to a few labeled target samples, a setting called supervised domain adaptation (sDA). In this paper, we explore when (full or partial) causal knowledge can provably improve supervised domain adaptation. As a first step, we study linear regression, where full or partial causal knowledge specifies a collection of invariant or possibly invariant feature subsets, each yielding a source-trained candidate predictor. We derive matching upper and lower bounds showing that finite-sample gains are governed by the target-risk margins separating the candidates, together with the finite-source estimation error. When these margins are sufficiently large relative to $n_Q$, an adaptive aggregation procedure can match the best candidate predictor while avoiding negative transfer relative to target-only learning. On the other hand, when the margins are too small, no algorithm can reliably exploit the candidate collection to obtain faster finite-sample rates. We further connect these margins to structural shift magnitude in linear SCMs and validate the theory on real-world causal benchmarks.
- Abstract(参考訳): 機械学習モデルは、トレーニングされたソースディストリビューションとは異なるターゲットディストリビューションにデプロイされると、しばしば劣化する。
因果関係に基づく領域一般化における最近の研究は、ドメイン間の共用因果構造が、構造された領域シフトの安定なリスクを持つ機能のサブセット上で、不変な予測子を誘導する方法を示している。
しかし、そのような集団レベルの因果不均一が有限サンプル設定で得られる程度は、まだ未解明のままである。
特に、実際には、監視ドメイン適応(sDA)と呼ばれるいくつかのラベル付きターゲットサンプルにアクセスすることがよくあります。
本稿では,(完全あるいは部分的な)因果的知識が,教師付きドメイン適応を確実に向上させる方法について検討する。
最初のステップとして、線形回帰について検討し、完全な因果知識または部分的因果知識が不変あるいはおそらく不変な特徴部分集合の集合を規定し、それぞれがソース学習された候補予測子を生成する。
我々は、有限サンプルゲインが、候補を分離するターゲットリスクマージンと、有限ソース推定誤差によって支配されていることを示す上限と下限のマッチングを導出する。
これらのマージンが$n_Q$に対して十分に大きい場合、アダプティブアグリゲーション手順は、ターゲットのみの学習に対して負の転送を回避しつつ、最適な候補予測子と一致させることができる。
一方、マージンが小さすぎる場合、アルゴリズムはより高速な有限サンプルレートを得るために、候補コレクションを確実に活用することができない。
さらに、これらのマージンを線形SCMにおける構造シフトマグニチュードに結合し、実世界の因果ベンチマークに関する理論を検証する。
関連論文リスト
- Unsupervised Domain Adaptation for Action Recognition via Self-Ensembling and Conditional Embedding Alignment [2.06242362470764]
本稿では, 整合正則化, 時間アンサンブル, 条件分布アライメントの3つの関数からなる新しい共同最適化アーキテクチャを提案する。
$mu$DARは、平均マクロF1スコアを4つのベンチマークwHARデータセットで6つの最先端UDAメソッドで改善する$approx$4-12%の範囲をもたらす。
論文 参考訳(メタデータ) (2024-10-23T00:59:27Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Constrained Maximum Cross-Domain Likelihood for Domain Generalization [14.91361835243516]
ドメインの一般化は、複数のソースドメイン上で一般化可能なモデルを学ぶことを目的としている。
本稿では,異なる領域の後方分布間のKL偏差を最小限に抑える新しい領域一般化法を提案する。
Digits-DG、PACS、Office-Home、MiniDomainNetの4つの標準ベンチマークデータセットの実験は、我々のメソッドの優れたパフォーマンスを強調している。
論文 参考訳(メタデータ) (2022-10-09T03:41:02Z) - Domain-Specific Risk Minimization for Out-of-Distribution Generalization [104.17683265084757]
まず、適応性ギャップを明示的に考慮した一般化境界を確立する。
本稿では,目標に対するより良い仮説の選択を導くための効果的なギャップ推定法を提案する。
もう1つの方法は、オンラインターゲットサンプルを用いてモデルパラメータを適応させることにより、ギャップを最小化することである。
論文 参考訳(メタデータ) (2022-08-18T06:42:49Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z) - Learning Calibrated Uncertainties for Domain Shift: A Distributionally
Robust Learning Approach [150.8920602230832]
ドメインシフトの下で校正された不確実性を学習するためのフレームワークを提案する。
特に、密度比推定は、ターゲット(テスト)サンプルの近さをソース(トレーニング)分布に反映する。
提案手法は下流タスクに有利な校正不確実性を生成する。
論文 参考訳(メタデータ) (2020-10-08T02:10:54Z) - A Balanced and Uncertainty-aware Approach for Partial Domain Adaptation [142.31610972922067]
この研究は、特にターゲットドメインのクラスラベルがソースドメインのサブセットである場合に、教師なしのドメイン適応問題に対処する。
本稿では,ドメイン逆境学習に基づく新しいドメイン適応手法 BA$3$US を提案し,BAA(Ba balanced Adversarial Alignment)とAUS(Adaptive Uncertainty Suppression)の2つの新しい手法を提案する。
複数のベンチマーク実験の結果、BA$3$USが部分的なドメイン適応タスクの最先端を超越していることが示されている。
論文 参考訳(メタデータ) (2020-03-05T11:37:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。