論文の概要: Everything is Varied: The Surprising Impact of Individual Variation on
ML Robustness in Medicine
- arxiv url: http://arxiv.org/abs/2210.04555v1
- Date: Mon, 10 Oct 2022 10:49:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 18:51:06.529739
- Title: Everything is Varied: The Surprising Impact of Individual Variation on
ML Robustness in Medicine
- Title(参考訳): 医療におけるmlの堅牢性に対する個人差の驚くべき影響
- Authors: Andra Campagner, Lorenzo Famiglini, Anna Carobene, Federico Cabitza
- Abstract要約: 個体差 (IV) は集団差や誤りではなく、対象内の変化による変化を指す。
IVが機械学習(ML)のパフォーマンスと一般化に与える影響と、その影響を緩和する方法について検討する。
1)現状のMLモデルは,データ中のIVの存在によって大きな影響を受けており,2)データ拡張とデータ不整合に基づく高度な学習戦略は,IVに対する堅牢性の向上に有効であることを示す。
- 参考スコア(独自算出の注目度): 0.14337588659482517
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In medical settings, Individual Variation (IV) refers to variation that is
due not to population differences or errors, but rather to within-subject
variation, that is the intrinsic and characteristic patterns of variation
pertaining to a given instance or the measurement process. While taking into
account IV has been deemed critical for proper analysis of medical data, this
source of uncertainty and its impact on robustness have so far been neglected
in Machine Learning (ML). To fill this gap, we look at how IV affects ML
performance and generalization and how its impact can be mitigated.
Specifically, we provide a methodological contribution to formalize the problem
of IV in the statistical learning framework and, through an experiment based on
one of the largest real-world laboratory medicine datasets for the problem of
COVID-19 diagnosis, we show that: 1) common state-of-the-art ML models are
severely impacted by the presence of IV in data; and 2) advanced learning
strategies, based on data augmentation and data imprecisiation, and proper
study designs can be effective at improving robustness to IV. Our findings
demonstrate the critical relevance of correctly accounting for IV to enable
safe deployment of ML in clinical settings.
- Abstract(参考訳): 医学的環境では、個体差(IV)とは、集団差や誤差ではなく、対象内変異(intra-subject variation)であり、特定の事例や測定過程に関連する変動の本質的、特徴的パターンである。
ivを考慮に入れると、医療データの適切な分析には重要であると考えられてきたが、この不確実性の原因とその堅牢性への影響は機械学習(ml)では無視されている。
このギャップを埋めるために、IVがMLのパフォーマンスと一般化にどのように影響し、その影響を緩和するかを検討する。
具体的には、統計学習の枠組みにおけるIVの問題を定式化するための方法論的貢献と、新型コロナウイルスの診断のための世界最大規模の実験用医療データセットに基づく実験を通して、以下の結果を示す。
1) 共通最先端mlモデルは、データにおけるivの存在によって深刻な影響を受ける。
2)データ強化とデータ不整合に基づく高度な学習戦略と適切な学習設計は,IVに対する堅牢性向上に有効である。
本研究は,臨床環境におけるMLの安全な展開を可能にするために,IVを正しく評価することの重要性を示唆するものである。
関連論文リスト
- Distributional Instrumental Variable Method [4.34680331569334]
本研究の目的は介入分布全体を推定することである。
非線形IV設定における生成モデルを用いたDIV(Distributedal Instrumental Variable)法を提案する。
論文 参考訳(メタデータ) (2025-02-11T15:33:06Z) - FedMedICL: Towards Holistic Evaluation of Distribution Shifts in Federated Medical Imaging [68.6715007665896]
FedMedICLは統合されたフレームワークであり、フェデレートされた医療画像の課題を全体評価するためのベンチマークである。
6種類の医用画像データセットについて,いくつかの一般的な手法を総合的に評価した。
単純なバッチ分散手法はFedMedICL実験全体の平均性能において,高度な手法を超越していることがわかった。
論文 参考訳(メタデータ) (2024-07-11T19:12:23Z) - Estimating Heterogeneous Treatment Effects by Combining Weak Instruments and Observational Data [44.31792000298105]
病状平均治療効果(CATE)の正確な予測は、パーソナライズされた医療とデジタルプラットフォーム分析において重要である。
我々は,信頼性の高いCATE推定を実現するために,IVと観測データを組み合わせた新しい手法を開発した。
論文 参考訳(メタデータ) (2024-06-10T16:40:55Z) - How Well Does GPT-4V(ision) Adapt to Distribution Shifts? A Preliminary
Investigation [90.93999543169296]
GPT-4Vは最も先進的な多モード基盤モデルとして機能する。
本研究は, GPT-4Vの動的環境における適応性と一般化能力について, 厳密に評価する。
論文 参考訳(メタデータ) (2023-12-12T16:48:07Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Instrumental Variable Learning for Chest X-ray Classification [52.68170685918908]
本稿では,素因果関係を排除し,正確な因果表現を得るための解釈可能な機器変数(IV)学習フレームワークを提案する。
提案手法の性能はMIMIC-CXR,NIH ChestX-ray 14,CheXpertデータセットを用いて実証した。
論文 参考訳(メタデータ) (2023-05-20T03:12:23Z) - Instrumental Variables in Causal Inference and Machine Learning: A
Survey [26.678154268037595]
因果推論(英: Causal inference)とは、データに基づく変数間の因果関係に関する結論を引き出すために仮定を用いる過程である。
因果推論と機械学習の両分野における増大する文献は、計測変数(IV)の使用を提案する
本論文は、因果推論と機械学習の両方において、IV法とその応用を体系的かつ包括的に導入し、議論する最初の試みである。
論文 参考訳(メタデータ) (2022-12-12T08:59:04Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Discovering Ancestral Instrumental Variables for Causal Inference from
Observational Data [0.0]
測定変数(IV)は、観察データから興味の結果に対する治療の因果効果を推定するための強力なアプローチである。
既存のIV法は、IVが選択され、ドメイン知識で正当化されることを要求する。
本稿では,データから有効なIVを発見するためのデータ駆動アルゴリズムについて,軽度な仮定で検討・設計する。
論文 参考訳(メタデータ) (2022-06-04T07:48:13Z) - Improving Inference from Simple Instruments through Compliance
Estimation [0.0]
機器変数(IV)回帰は、治療の受け取りが完全にランダムでない環境での因果治療効果を推定するために広く用いられている。
IVは、一貫した治療効果の見積もりを回復できるが、しばしばうるさい。
楽器の強度の予測可能な変動を利用して,IV推定値の効率を改善する方法について検討した。
論文 参考訳(メタデータ) (2021-08-08T20:18:34Z) - Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning [107.70165026669308]
オフライン強化学習(RL)では、事前収集された観測データのみから最適なポリシーが学習される。
遷移力学が加法的非線形汎関数形式を持つようなマルコフ決定過程について検討する。
そこで本稿では,条件付きモーメント制限の原始的2次元再構成に基づく,証明可能なIVVIアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-19T13:01:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。