論文の概要: Domain Adaptation Under MNAR Missingness
- arxiv url: http://arxiv.org/abs/2504.00322v1
- Date: Tue, 01 Apr 2025 01:03:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:20:40.524246
- Title: Domain Adaptation Under MNAR Missingness
- Title(参考訳): MNAR欠損下でのドメイン適応
- Authors: Tyrel Stokes, Hyungrok Do, Saul Blecker, Rumi Chunara, Samrachana Adhikari,
- Abstract要約: 現在のドメイン適応法は、ミス・アット・ランダム(MAR)の欠失メカニズムに制限されている。
妥当な仮定の下では、MNAR欠落の問題は計算問題に還元できることを示す。
- 参考スコア(独自算出の注目度): 4.965247405975508
- License:
- Abstract: Current domain adaptation methods under missingness shift are restricted to Missing At Random (MAR) missingness mechanisms. However, in many real-world examples, the MAR assumption may be too restrictive. When covariates are Missing Not At Random (MNAR) in both source and target data, the common covariate shift solutions, including importance weighting, are not directly applicable. We show that under reasonable assumptions, the problem of MNAR missingness shift can be reduced to an imputation problem. This allows us to leverage recent methodological developments in both the traditional statistics and machine/deep-learning literature for MNAR imputation to develop a novel domain adaptation procedure for MNAR missingness shift. We further show that our proposed procedure can be extended to handle simultaneous MNAR missingness and covariate shifts. We apply our procedure to Electronic Health Record (EHR) data from two hospitals in south and northeast regions of the US. In this setting we expect different hospital networks and regions to serve different populations and to have different procedures, practices, and software for inputting and recording data, causing simultaneous missingness and covariate shifts.
- Abstract(参考訳): 現在のドメイン適応法は、ミス・アット・ランダム(MAR)の欠失メカニズムに制限されている。
しかし、多くの実世界の例では、MARの仮定は制限的すぎるかもしれない。
コバリアイトがソースデータとターゲットデータの両方においてミス・ノー・アット・ランダム(MNAR)である場合、重み付けを含む共通共変量シフト解は直接適用されない。
妥当な仮定の下では、MNAR欠落の問題は計算問題に還元できることを示す。
これにより、従来の統計学とMNAR計算のための機械/深層学習文学の両方において、近年の方法論的発展を活用して、MNAR欠失シフトのための新しい領域適応手順を開発することができる。
さらに,提案手法は,MNARの欠如と共変量シフトを同時に処理するために拡張可能であることを示す。
本稿では,米国南部および北東部の2つの病院の電子健康記録(EHR)データに適用する。
この設定では、異なる病院ネットワークや地域が異なる人口に奉仕し、データの入力と記録を行うための異なる手順、プラクティス、ソフトウェアを持つことを期待し、同時に欠落と共変量シフトを引き起こします。
関連論文リスト
- Proxy Methods for Domain Adaptation [78.03254010884783]
プロキシ変数は、遅延変数を明示的にリカバリしたりモデル化したりすることなく、分散シフトへの適応を可能にする。
両設定の複雑な分散シフトに適応する2段階のカーネル推定手法を開発した。
論文 参考訳(メタデータ) (2024-03-12T09:32:41Z) - Deep Generative Imputation Model for Missing Not At Random Data [13.56794299885683]
我々は、潜伏空間における現実の欠落メカニズムを処理するために、GNRと呼ばれる深い生成的計算モデルを利用する。
実験の結果,GNRは最先端のMNARベースラインをはるかに超え,有意なマージンを有することが明らかとなった。
論文 参考訳(メタデータ) (2023-08-16T06:01:12Z) - Cross-Dataset Adaptation for Instrument Classification in Cataract
Surgery Videos [54.1843419649895]
特定のデータセットでこのタスクをうまく実行する最先端モデルでは、別のデータセットでテストすると、パフォーマンスが低下する。
本稿では,Barlow Adaptorと呼ばれる新しいエンドツーエンドのUnsupervised Domain Adaptation (UDA)手法を提案する。
さらに,BFAL(Barlow Feature Alignment Loss)と呼ばれる,異なるドメインにまたがる特徴を整列させる新たな損失を導入する。
論文 参考訳(メタデータ) (2023-07-31T18:14:18Z) - Reversing the Abnormal: Pseudo-Healthy Generative Networks for Anomaly
Detection [8.737589725372398]
PHANES(Pseudo Healthy Generative Network for Anomaly)と呼ばれる新しい教師なしアプローチを導入する。
本手法は, 異常を回復し, 健康な組織を保存し, 異常領域を偽の健康再建に置き換える機能を有する。
我々は、T1w脳MRIデータセットの脳梗塞検出におけるPHANESの有効性を実証し、最先端(SOTA)法よりも大幅に改善したことを示す。
論文 参考訳(メタデータ) (2023-03-15T08:54:20Z) - Multiple Imputation with Neural Network Gaussian Process for
High-dimensional Incomplete Data [9.50726756006467]
既存のメソッドにはいくつかの制限があるが、Imputationはおそらく欠落データを扱う最も一般的な方法である。
2つのNNGPに基づくMI手法、すなわちMI-NNGPを提案する。
MI-NNGP法は, 合成および実データに対して, 既存の最先端手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2022-11-23T20:54:26Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - Domain Adaptation meets Individual Fairness. And they get along [48.95808607591299]
アルゴリズムフェアネスの介入は、機械学習モデルが分散シフトを克服するのに役立つことを示す。
特に,個人フェアネス(IF)の適切な概念を強制することで,MLモデルの分布外精度が向上することを示す。
論文 参考訳(メタデータ) (2022-05-01T16:19:55Z) - Multiple Imputation via Generative Adversarial Network for
High-dimensional Blockwise Missing Value Problems [6.123324869194195]
本稿では,GAN(Generative Adversarial Network)による多重インプットを提案する。
MI-GANは、高次元データセット上で既存の最先端計算手法と高い性能を示す。
特に、MI-GANは統計的推測と計算速度の点で他の計算方法よりも優れている。
論文 参考訳(メタデータ) (2021-12-21T20:19:37Z) - MURAL: An Unsupervised Random Forest-Based Embedding for Electronic
Health Record Data [59.26381272149325]
異なる変数型でデータを表現するための教師なしランダムフォレストを提案する。
muraL forestsは、ノード分割変数がランダムに選択される一連の決定ツリーで構成されている。
提案手法を用いることで,競合するアプローチよりも正確なデータの視覚化と分類が可能であることを示す。
論文 参考訳(メタデータ) (2021-11-19T22:02:21Z) - Identifiable Generative Models for Missing Not at Random Data Imputation [13.790820495804567]
多くの計算法は、MNARデータが存在する場合、その欠如を考慮に入れない。
本研究では,MNARにおける生成モデルの識別可能性について検討する。
軽微な仮定の下で識別可能性を保証する実用的な深層生成モデルを提案する。
論文 参考訳(メタデータ) (2021-10-27T18:51:38Z) - Learning to Match Distributions for Domain Adaptation [116.14838935146004]
本稿では,ドメイン間分布マッチングを自動的に学習する学習 to Match (L2M)を提案する。
L2Mは、メタネットワークを用いてデータ駆動方式で分布整合損失を学習することにより、誘導バイアスを低減する。
公開データセットの実験は、SOTA法よりもL2Mの方が優れていることを裏付けている。
論文 参考訳(メタデータ) (2020-07-17T03:26:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。