論文の概要: Label Shift Estimators for Non-Ignorable Missing Data
- arxiv url: http://arxiv.org/abs/2310.18261v1
- Date: Fri, 27 Oct 2023 16:50:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-30 12:53:11.270304
- Title: Label Shift Estimators for Non-Ignorable Missing Data
- Title(参考訳): 無視不能データに対するラベルシフト推定器
- Authors: Andrew C. Miller and Joseph Futoma
- Abstract要約: ランダム変数 Y の平均を非無視的欠損(すなわち、不足メカニズムが Y に依存する場合)で推定する問題を考察する。
当社のアプローチは、無視できないアプローチと無視できないアプローチを比較して、大規模な健康調査を用いて、病気の有病率を推定するために使用します。
- 参考スコア(独自算出の注目度): 2.605549784939959
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of estimating the mean of a random variable Y subject
to non-ignorable missingness, i.e., where the missingness mechanism depends on
Y . We connect the auxiliary proxy variable framework for non-ignorable
missingness (West and Little, 2013) to the label shift setting (Saerens et al.,
2002). Exploiting this connection, we construct an estimator for non-ignorable
missing data that uses high-dimensional covariates (or proxies) without the
need for a generative model. In synthetic and semi-synthetic experiments, we
study the behavior of the proposed estimator, comparing it to commonly used
ignorable estimators in both well-specified and misspecified settings.
Additionally, we develop a score to assess how consistent the data are with the
label shift assumption. We use our approach to estimate disease prevalence
using a large health survey, comparing ignorable and non-ignorable approaches.
We show that failing to account for non-ignorable missingness can have profound
consequences on conclusions drawn from non-representative samples.
- Abstract(参考訳): 非無視的欠落に対する確率変数 y の平均を推定する問題、すなわち欠落機構が y に依存する場合を考える。
ラベルシフト設定(Saerens et al., 2002)に非無視的不足(West and Little, 2013)のための補助プロキシ変数フレームワークを接続する。
この接続を活用し、生成モデルを必要としない高次元共変量(またはプロキシ)を用いた無視不能データに対する推定器を構築する。
合成, 半合成実験において, 提案した推定器の挙動について検討し, 明確に特定された, 未特定な条件下でよく用いられる無知な推定器と比較した。
さらに,ラベルシフトの仮定とデータがどの程度一致しているかを評価するスコアを開発する。
本手法は,無知と無知の2つのアプローチを比較し,大規模健康調査を用いて疾患の有病率を推定する。
非無知な欠如を説明できないことは、非代表的サンプルから得られた結論に重大な影響を与える可能性がある。
関連論文リスト
- Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Estimating the Contamination Factor's Distribution in Unsupervised
Anomaly Detection [7.174572371800215]
異常検出手法は、期待された振る舞いに従わない例を特定する。
異常として示される例の比率は、汚染因子と呼ばれる異常の予想割合と等しい。
ラベルのないデータセットの汚染係数の後方分布を推定する手法を提案する。
論文 参考訳(メタデータ) (2022-10-19T11:51:25Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Quantifying Ignorance in Individual-Level Causal-Effect Estimates under
Hidden Confounding [38.09565581056218]
共同設立者による高次元観測データから条件付き平均治療効果(CATE)の学習問題について検討した。
高次元データに適した新しいパラメトリック間隔推定器を提案する。
論文 参考訳(メタデータ) (2021-03-08T15:58:06Z) - Deep Generative Pattern-Set Mixture Models for Nonignorable Missingness [0.0]
無視できないデータと無視できないデータの両方をモデル化する可変オートエンコーダアーキテクチャを提案する。
モデルでは,観測されたデータと欠落マスクに基づいて,欠落したデータを欠落パターンにクラスタ化することを明示的に学習する。
当社のセットアップでは,無知かつ無知な欠如の特性をトレードオフすることで,両タイプのデータに適用することが可能である。
論文 参考訳(メタデータ) (2021-03-05T08:21:35Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z) - The Hidden Uncertainty in a Neural Networks Activations [105.4223982696279]
ニューラルネットワークの潜在表現の分布は、アウト・オブ・ディストリビューション(OOD)データの検出に成功している。
本研究は、この分布が、モデルの不確実性と相関しているかどうかを考察し、新しい入力に一般化する能力を示す。
論文 参考訳(メタデータ) (2020-12-05T17:30:35Z) - Semi-supervised learning and the question of true versus estimated
propensity scores [0.456877715768796]
本稿では, 既知の確率関数が治療効果を推定するのに有用である, という強い直感を再現する簡単な手順を提案する。
さらに、シミュレーション研究は、多くの状況において逆正当性重み推定器よりも直接回帰が好ましいことを示唆している。
論文 参考訳(メタデータ) (2020-09-14T04:13:12Z) - Survival Estimation for Missing not at Random Censoring Indicators based
on Copula Models [1.52292571922932]
そこで本研究では,MNARを非ランダムに検閲しない条件付き生存関数に対する条件付きコーパスモデルに基づく新しい条件付き生存関数推定器を提案する。
理論的な結果に加えて,シミュレーションによる小サンプルに対する推定器の動作方法や,合成データおよび実データの解析による実用性を示す。
論文 参考訳(メタデータ) (2020-09-03T15:04:27Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - Estimating Gradients for Discrete Random Variables by Sampling without
Replacement [93.09326095997336]
我々は、置換のないサンプリングに基づいて、離散確率変数に対する期待値の偏りのない推定器を導出する。
推定器は3つの異なる推定器のラオ・ブラックウェル化として導出可能であることを示す。
論文 参考訳(メタデータ) (2020-02-14T14:15:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。