論文の概要: Missing Values and Imputation in Healthcare Data: Can Interpretable
Machine Learning Help?
- arxiv url: http://arxiv.org/abs/2304.11749v1
- Date: Sun, 23 Apr 2023 20:54:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 16:37:06.678296
- Title: Missing Values and Imputation in Healthcare Data: Can Interpretable
Machine Learning Help?
- Title(参考訳): 医療データに欠けている価値とインプテーション: 解釈可能な機械学習は役に立つか?
- Authors: Zhi Chen, Sarah Tan, Urszula Chajewska, Cynthia Rudin, Rich Caruana
- Abstract要約: 我々は、近年の解釈可能な機械学習の進歩が、欠落した価値問題を理解し、対処するための新たな視点を提供することを示す。
高精度ガラス箱説明型ブースティングマシン(EBMs)に基づく手法を提案する。
実世界の医療データセットの実験では,提案手法の有効性が示されている。
- 参考スコア(独自算出の注目度): 31.331173083093987
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Missing values are a fundamental problem in data science. Many datasets have
missing values that must be properly handled because the way missing values are
treated can have large impact on the resulting machine learning model. In
medical applications, the consequences may affect healthcare decisions. There
are many methods in the literature for dealing with missing values, including
state-of-the-art methods which often depend on black-box models for imputation.
In this work, we show how recent advances in interpretable machine learning
provide a new perspective for understanding and tackling the missing value
problem. We propose methods based on high-accuracy glass-box Explainable
Boosting Machines (EBMs) that can help users (1) gain new insights on
missingness mechanisms and better understand the causes of missingness, and (2)
detect -- or even alleviate -- potential risks introduced by imputation
algorithms. Experiments on real-world medical datasets illustrate the
effectiveness of the proposed methods.
- Abstract(参考訳): 値の欠如はデータサイエンスにおける根本的な問題である。
多くのデータセットは、欠落した値を扱う方法が機械学習モデルに大きく影響を与える可能性があるため、適切に扱わなければならない値が欠落している。
医療応用においては、その結果が医療決定に影響を及ぼす可能性がある。
文献には不足した値を扱うための多くの方法があり、例えば最先端の手法は、しばしば計算のためのブラックボックスモデルに依存する。
本稿では,最近の解釈可能な機械学習の進歩が,不足する価値問題の理解と解決のための新たな視点を提供することを示す。
本稿では,(1)欠陥メカニズムの新たな洞察を得て,不足の原因をよりよく理解し,(2)計算アルゴリズムによって生じる潜在的なリスクを検出・緩和する,高精度なガラス箱説明型ブースティングマシン(EBMs)に基づく手法を提案する。
実世界の医療データセットの実験では,提案手法の有効性が示されている。
関連論文リスト
- Common Steps in Machine Learning Might Hinder The Explainability Aims in Medicine [0.0]
本稿では、機械学習におけるデータ前処理のステップとそのモデルの説明可能性および解釈可能性への影響について論じる。
これらのステップはモデルの精度を向上させるが、特に医学において慎重に考慮されていない場合、モデルの説明可能性を妨げる可能性がある。
論文 参考訳(メタデータ) (2024-08-30T12:09:14Z) - On the Performance of Imputation Techniques for Missing Values on Healthcare Datasets [0.0]
値やデータの欠落は、実世界のデータセット、特に医療データの一般的な特徴のひとつだ。
本研究は, 平均計算法, 中間計算法, 最終観測法 (LOCF) 計算法, K-Nearest Neighbor (KNN) 計算法, 補間計算法, ミスフォレスト計算法, 連鎖方程式による多重計算法の比較である。
その結果,ミスフォレスト・インキュベーションが最善であり,MICEインキュベーションが最善であることがわかった。
論文 参考訳(メタデータ) (2024-03-13T18:07:17Z) - Detecting Shortcut Learning for Fair Medical AI using Shortcut Testing [62.9062883851246]
機械学習は医療の改善に大いに貢献するが、その利用が健康格差を広めたり増幅したりしないことを確実にすることは重要である。
アルゴリズムの不公平性の潜在的な要因の1つ、ショートカット学習は、トレーニングデータにおける不適切な相関に基づいてMLモデルが予測した時に発生する。
マルチタスク学習を用いて,臨床MLシステムの公平性評価の一環として,ショートカット学習の評価と緩和を行う手法を提案する。
論文 参考訳(メタデータ) (2022-07-21T09:35:38Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - PROMISSING: Pruning Missing Values in Neural Networks [0.0]
本稿では,ニューラルネットワークの学習と推論の段階において,欠落値(PROMISSing)を抽出する,シンプルで直感的かつ効果的な手法を提案する。
実験の結果, ProMISSing は様々な計算手法と比較して予測性能が良くなることがわかった。
論文 参考訳(メタデータ) (2022-06-03T15:37:27Z) - CAIPI in Practice: Towards Explainable Interactive Medical Image
Classification [0.8137198664755597]
本稿では、画像分類のための説明可能な対話型CAIPIアルゴリズムを拡張する。
画像分類のためのヒューマン・イン・ザ・ループアプローチを簡単にするためのインターフェースを提供する。
医療MNISTで9,7.48%、ファッションMNISTで9,5.02%の精度を達成している。
論文 参考訳(メタデータ) (2022-04-06T08:21:34Z) - Benchmarking missing-values approaches for predictive models on health
databases [47.187609203210705]
我々は、大規模健康データベースに焦点を当てた予測モデルにおいて、不足値戦略のベンチマークを行う。
教師あり機械学習における欠落値に対するネイティブサポートは、計算コストをはるかに少なくして最先端の計算計算よりも優れていると予測できる。
論文 参考訳(メタデータ) (2022-02-17T09:40:04Z) - To Impute or not to Impute? -- Missing Data in Treatment Effect
Estimation [84.76186111434818]
我々は,MCM(Mixed Con founded missingness)と呼ばれる新しい欠損機構を同定し,ある欠損度が治療選択を判断し,他の欠損度が治療選択によって決定されることを示した。
本研究は,全てのデータを因果的に入力すると,不偏推定を行うために必要な情報を効果的に除去するので,処理効果のモデルが貧弱になることを示す。
私たちのソリューションは選択的計算であり、CMMからの洞察を使って、どの変数をインプットすべきで、どの変数をインプットすべきでないかを正確に知らせる。
論文 参考訳(メタデータ) (2022-02-04T12:08:31Z) - MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。
MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。
我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2021-11-04T22:38:18Z) - Bayesian Optimization with Missing Inputs [53.476096769837724]
我々は、よく知られたアッパー信頼境界(UCB)獲得関数に基づく新たな獲得関数を開発する。
我々は,本手法の有用性を示すために,合成アプリケーションと実世界のアプリケーションの両方について包括的な実験を行った。
論文 参考訳(メタデータ) (2020-06-19T03:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。