論文の概要: Stable predictions for health related anticausal prediction tasks
affected by selection biases: the need to deconfound the test set features
- arxiv url: http://arxiv.org/abs/2011.04128v1
- Date: Mon, 9 Nov 2020 01:17:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 00:25:43.317382
- Title: Stable predictions for health related anticausal prediction tasks
affected by selection biases: the need to deconfound the test set features
- Title(参考訳): 選択バイアスに影響を及ぼす健康関連対因果予測タスクの安定予測--テストセットの特徴を解消する必要性
- Authors: Elias Chaibub Neto, Phil Snyder, Solveig K Sieberts, Larsson Omberg
- Abstract要約: 健康関連機械学習アプリケーションでは、トレーニングデータはターゲット集団の非表現的なサンプルに対応することが多い。
テストセットの機能を分解することで、安定性の向上が達成できることを示す。
- 参考スコア(独自算出の注目度): 12.272975892517037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In health related machine learning applications, the training data often
corresponds to a non-representative sample from the target populations where
the learners will be deployed. In anticausal prediction tasks, selection biases
often make the associations between confounders and the outcome variable
unstable across different target environments. As a consequence, the
predictions from confounded learners are often unstable, and might fail to
generalize in shifted test environments. Stable prediction approaches aim to
solve this problem by producing predictions that are stable across unknown test
environments. These approaches, however, are sometimes applied to the training
data alone with the hope that training an unconfounded model will be enough to
generate stable predictions in shifted test sets. Here, we show that this is
insufficient, and that improved stability can be achieved by deconfounding the
test set features as well. We illustrate these observations using both
synthetic data and real world data from a mobile health study.
- Abstract(参考訳): 健康関連機械学習アプリケーションでは、トレーニングデータはしばしば、学習者が配置される対象集団からの非表現的なサンプルに対応する。
反因果予測タスクでは、選択バイアスは、共同創設者と異なるターゲット環境における結果変数の関連を不安定にすることが多い。
その結果, 学習者の予測は不安定であり, シフトテスト環境での一般化に失敗する可能性がある。
安定した予測手法は、未知のテスト環境で安定な予測を生成することでこの問題を解決することを目的としている。
しかし、これらのアプローチは時々トレーニングデータのみに適用され、基礎のないモデルをトレーニングすることで、シフトしたテストセットで安定した予測を生成するのに十分であることを期待している。
ここでは,テストセットの機能をデコンファクトすることで,安定性の向上が実現可能であることを示す。
モバイル健康調査から得られた合成データと実世界データの両方を用いて,これらの観測を行った。
関連論文リスト
- Reliability-Aware Prediction via Uncertainty Learning for Person Image
Retrieval [51.83967175585896]
UALは、データ不確実性とモデル不確実性を同時に考慮し、信頼性に配慮した予測を提供することを目的としている。
データ不確実性はサンプル固有のノイズを捕捉する」一方、モデル不確実性はサンプルの予測に対するモデルの信頼を表現している。
論文 参考訳(メタデータ) (2022-10-24T17:53:20Z) - Data Feedback Loops: Model-driven Amplification of Dataset Biases [9.773315369593876]
我々は、あるモデルとのインタラクションを履歴として記録し、将来トレーニングデータとしてスクラップ化するシステムを定式化する。
テスト時間偏差統計に対する変化を追跡することによって、その安定性を経時的に分析する。
バイアス増幅の度合いは、モデルの出力がトレーニング分布のサンプルのように振る舞うかどうかと密接に関連していることがわかった。
論文 参考訳(メタデータ) (2022-09-08T17:35:51Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Double Perturbation: On the Robustness of Robustness and Counterfactual
Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。
この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文 参考訳(メタデータ) (2021-04-12T06:57:36Z) - Robust Validation: Confident Predictions Even When Distributions Shift [19.327409270934474]
本稿では,モデルが点予測ではなく,その予測に対して不確実な推定を行うような,頑健な予測推論の手順について述べる。
本稿では, トレーニング集団の周囲に$f$-divergence のボールを用いて, 任意のテスト分布に対して適切なカバレッジレベルを与える予測セットを生成する手法を提案する。
私たちの方法論の重要な構成要素は、将来のデータシフトの量を見積り、それに対する堅牢性を構築することです。
論文 参考訳(メタデータ) (2020-08-10T17:09:16Z) - Individual Calibration with Randomized Forecasting [116.2086707626651]
予測値がランダムに設定された場合,各サンプルのキャリブレーションは回帰設定で可能であることを示す。
我々は、個別の校正を強制する訓練目標を設計し、それをランダム化された回帰関数の訓練に使用する。
論文 参考訳(メタデータ) (2020-06-18T05:53:10Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。