論文の概要: Domain Adaptation under Missingness Shift
- arxiv url: http://arxiv.org/abs/2211.02093v1
- Date: Thu, 3 Nov 2022 18:49:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 16:08:00.731347
- Title: Domain Adaptation under Missingness Shift
- Title(参考訳): 欠落シフト下でのドメイン適応
- Authors: Helen Zhou, Sivaraman Balakrishnan, Zachary C. Lipton
- Abstract要約: 欠損度シフト(DAMS)下におけるドメイン適応問題について紹介する。
欠落したデータのレートは、しばしば記録保持ポリシーに依存するため、時間や場所によって変化する可能性がある。
合成データおよび半合成データの実験において,仮定が成立する際の手法の可能性を実証した。
- 参考スコア(独自算出の注目度): 38.650099178537864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rates of missing data often depend on record-keeping policies and thus may
change across times and locations, even when the underlying features are
comparatively stable. In this paper, we introduce the problem of Domain
Adaptation under Missingness Shift (DAMS). Here, (labeled) source data and
(unlabeled) target data would be exchangeable but for different missing data
mechanisms. We show that when missing data indicators are available, DAMS can
reduce to covariate shift. Focusing on the setting where missing data
indicators are absent, we establish the following theoretical results for
underreporting completely at random: (i) covariate shift is violated
(adaptation is required); (ii) the optimal source predictor can perform worse
on the target domain than a constant one; (iii) the optimal target predictor
can be identified, even when the missingness rates themselves are not; and (iv)
for linear models, a simple analytic adjustment yields consistent estimates of
the optimal target parameters. In experiments on synthetic and semi-synthetic
data, we demonstrate the promise of our methods when assumptions hold. Finally,
we discuss a rich family of future extensions.
- Abstract(参考訳): データの欠落率はしばしば記録保存ポリシーに依存するため、基礎となる機能が比較的安定している場合でも、時間や場所によって変化する可能性がある。
本稿では,DAMS(Missingness Shift)におけるドメイン適応の問題を紹介する。
ここでは、(ラベル付き)ソースデータと(ラベルなし)ターゲットデータは、異なるデータメカニズムに対して交換可能である。
データインジケータが不足している場合、DAMSは共変量シフトに還元できることを示す。
データインジケータが欠落している設定に焦点をあてて、以下の理論結果を完全にランダムに報告する。
(i)共変量シフトが違反している(適応が必要)
(ii) 最適震源予測器は、定点よりも目標領域で悪化させることができる。
(iii)欠落率自体がない場合であっても、最適な目標予測器を識別することができる。
(iv) 線形モデルの場合, 簡単な解析調整により最適対象パラメータの一貫した推定値が得られる。
合成および半合成データ実験において,仮定が持たれた場合の手法の期待を実証する。
最後に、将来の拡張の豊富なファミリーについて論じる。
関連論文リスト
- Adapting to Shifting Correlations with Unlabeled Data Calibration [6.84735357291896]
サイト間の分散シフトは、不安定な相関を利用する傾向にあるため、モデル性能を著しく低下させる可能性がある。
本稿では,モデル予測を予測対象と共同設立者間のシフト相関に適応させるフレキシブルな手法であるGeneralized Prevalence Adjustment (GPA)を提案する。
GPAは、これらのサイトからの未ラベルのサンプルを使用して、新しいサイトのターゲットと共同創設者の相互作用を推測することができる。
論文 参考訳(メタデータ) (2024-09-09T18:45:43Z) - Learning When the Concept Shifts: Confounding, Invariance, and Dimension Reduction [5.38274042816001]
観測データでは、分布シフトは観測されていない共起因子によって駆動されることが多い。
このことは、観測データを用いた領域適応問題の研究を動機付けます。
学習した低次元部分空間を用いて、ターゲットとソースのリスクの間にほぼ理想的なギャップを生じさせるモデルを示す。
論文 参考訳(メタデータ) (2024-06-22T17:43:08Z) - Conformal Prediction with Missing Values [19.18178194789968]
まず,共形予測の限界カバレッジ保証が,不一致分布のインプットデータに当てはまることを示す。
次に、インプットされたデータに基づいてトレーニングされた普遍的に一貫した量子レグレッションアルゴリズムが、ピンボールリスクに対してベイズ最適であることを示す。
論文 参考訳(メタデータ) (2023-06-05T09:28:03Z) - Adapting to Latent Subgroup Shifts via Concepts and Proxies [82.01141290360562]
最適ターゲット予測器は、ソースドメインでのみ利用できる概念とプロキシ変数の助けを借りて、非パラメトリックに識別可能であることを示す。
本研究では,データ生成プロセスに特有の潜在変数モデルを提案する。
論文 参考訳(メタデータ) (2022-12-21T18:30:22Z) - Uncertainty-guided Source-free Domain Adaptation [77.3844160723014]
ソースフリードメイン適応(SFDA)は、事前訓練されたソースモデルのみを使用することで、未ラベルのターゲットデータセットに分類器を適応させることを目的としている。
本稿では、ソースモデル予測の不確実性を定量化し、ターゲット適応の導出に利用することを提案する。
論文 参考訳(メタデータ) (2022-08-16T08:03:30Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery [97.79015388276483]
構造方程式モデル(SEM)は、有向非巡回グラフ(DAG)を介して表される因果関係を推論する効果的な枠組みである。
近年の進歩により、観測データからDAGの有効最大点推定が可能となった。
線形ガウス SEM を特徴付ける DAG 上の分布を推定するための変分フレームワークである BCD Nets を提案する。
論文 参考訳(メタデータ) (2021-12-06T03:35:21Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。