Fugu-MT 論文翻訳(概要): Tipping the Balance: Impact of Class Imbalance Correction on the Performance of Clinical Risk Prediction Models

論文の概要: Tipping the Balance: Impact of Class Imbalance Correction on the Performance of Clinical Risk Prediction Models

arxiv url: http://arxiv.org/abs/2603.00208v1
Date: Fri, 27 Feb 2026 12:29:16 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-03 19:50:56.110834
Title: Tipping the Balance: Impact of Class Imbalance Correction on the Performance of Clinical Risk Prediction Models
Title（参考訳）: バランスの調整:クラス不均衡補正が臨床リスク予測モデルの性能に及ぼす影響
Authors: Amalie Koch Andersen, Hadi Mehdizavareh, Arijit Khan, Tobias Becher, Simone Britsch, Markward Britsch, Morten Bøttcher, Simon Winther, Palle Duun Rohde, Morten Hasselstrøm Jensen, Simon Lebech Cichosz,
Abstract要約: クラス不均衡補正技術は、稀な結果を伴う設定におけるモデル性能を改善するために一般的に用いられる。本研究は,リアルタイム臨床予測タスクの判別と校正に広く用いられているリサンプリング戦略が及ぼす影響について検討した。
参考スコア（独自算出の注目度）: 2.2534253247996214
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Objective: ML-based clinical risk prediction models are increasingly used to support decision-making in healthcare. While class-imbalance correction techniques are commonly applied to improve model performance in settings with rare outcomes, their impact on probabilistic calibration remains insufficiently understood. This study evaluated the effect of widely used resampling strategies on both discrimination and calibration across real-world clinical prediction tasks. Methods: Ten clinical datasets spanning diverse medical domains and including 605,842 patients were analyzed. Multiple machine-learning model families, including linear models and several non-linear approaches, were evaluated. Models were trained on the original data and under three commonly used 1:1 class-imbalance correction strategies (SMOTE, RUS, ROS). Performance was assessed on held-out data using discrimination and calibration metrics. Results: Across all datasets and model families, resampling had no positive impact on predictive performance. Changes in the Receiver Operating Characteristic Area Under Curve (ROC-AUC) relative to models trained on the original data were small and inconsistent (ROS: -0.002, p<0.05; RUS: -0.004, p>0.05; SMOTE: -0.01, p<0.05), with no resampling strategy demonstrating a systematic improvement. In contrast, resampling in general degraded the calibration performance. Models trained using imbalance correction exhibited higher Brier scores (0.029 to 0.080, p<0.05), reflecting poorer probabilistic accuracy, and marked deviations in calibration intercept and slope, indicating systematic distortions of predicted risk despite preserved rank-based performance. Conclusion: In a diverse set of real-world clinical prediction tasks, commonly used class-imbalance correction techniques did not provide generalizable improvements in discrimination and were associated with degraded calibration.
Abstract（参考訳）: 目的:MLベースの臨床リスク予測モデルは、医療における意思決定を支援するためにますます利用されている。クラス不均衡補正技術は、稀な結果を伴う設定においてモデル性能を改善するために一般的に適用されるが、確率的キャリブレーションへの影響は未だ十分に理解されていない。本研究は,リアルタイム臨床予測タスクにおける識別と校正の両方に広く用いられているリサンプリング戦略が与える影響について検討した。方法: 多様な医療領域にまたがる10の臨床データセットと605,842人の患者について分析した。線形モデルと非線形アプローチを含む複数の機械学習モデルファミリーを評価した。モデルは元のデータに基づいて訓練され、3つの一般的な1:1クラス不均衡補正戦略 (SMOTE, RUS, ROS) の下で訓練された。識別と校正の指標を用いて、ホールドアウトデータの性能を評価した。結果: すべてのデータセットとモデルファミリーにおいて,再サンプリングは予測性能に肯定的な影響を与えなかった。元のデータで訓練されたモデルと比較して, 受動特性領域 (ROC-AUC) の変化は小さく, 不整合 (ROS: -0.002, p<0.05, RUS: -0.004, p>0.05, SMOTE: -0.01, p<0.05) であった。対照的に、一般的に再サンプリングは校正性能を低下させた。不均衡補正を用いて訓練したモデルでは、高いブライアスコア(0.029～0.080, p<0.05)を示し、確率的精度の低下を反映し、キャリブレーション・インターセプトと斜面の偏差を示し、保存されたランクベース性能にもかかわらず予測リスクの体系的歪みを示した。結論: 実世界の様々な臨床予測課題において, 一般的に使用されているクラス不均衡補正技術は, 識別の全般的な改善を提供しておらず, 校正の低下と関連していた。

関連論文リスト

Diagnostics for Individual-Level Prediction Instability in Machine Learning for Healthcare [0.0]
2つの相補的診断法を用いて個人レベルの予測不安定性を定量化する評価フレームワークを提案する。これらの診断をシミュレーションデータとGUSTO-I臨床データセットに適用する。
論文参考訳（メタデータ） (2026-02-27T03:42:28Z)
Investigating the Impact of Histopathological Foundation Models on Regressive Prediction of Homologous Recombination Deficiency [52.50039435394964]
回帰に基づくタスクの基礎モデルを体系的に評価する。我々は5つの最先端基礎モデルを用いて、スライド画像全体(WSI)からパッチレベルの特徴を抽出する。乳房、子宮内膜、肺がんコホートにまたがるこれらの抽出された特徴に基づいて、連続したRDDスコアを予測するモデルが訓練されている。
論文参考訳（メタデータ） (2026-01-29T14:06:50Z)
Classifier Calibration at Scale: An Empirical Study of Model-Agnostic Post-Hoc Methods [0.0]
教師付き二項分類における確率的予測を改善するためのモデル非依存のポストホック校正法について検討した。我々は、線形モデル、SVM、ツリーアンサンブル(CatBoost、XGBoost、LightGBM)を含む21の広く使われている分類器をベンチマークした。一般的な校正手順,特にプラットスケーリングと等調回帰は,適切なスコアリング性能を体系的に低下させる可能性がある。
論文参考訳（メタデータ） (2026-01-19T18:23:36Z)
An Explainable and Fair AI Tool for PCOS Risk Assessment: Calibration, Subgroup Equity, and Interactive Clinical Deployment [0.10026496861838446]
本稿では,多嚢胞性卵巣症候群(PCOS)の予測のための,公平で解釈可能な機械学習フレームワークを提案する。このフレームワークは、SHAPに基づく特徴属性と人口統計監査を統合し、予測的説明と観察的差異を関連付ける。 StreamlitベースのWebインターフェースは、リアルタイムPCOSリスク評価、ロッテルダム基準評価、インタラクティブな「What-if」分析を可能にする。
論文参考訳（メタデータ） (2025-11-08T16:14:56Z)
Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文参考訳（メタデータ） (2024-04-26T16:39:50Z)
Calibration of Neural Networks [77.34726150561087]
本稿では,ニューラルネットワークの文脈における信頼性校正問題について調査する。我々は,問題文,キャリブレーション定義,評価に対する異なるアプローチについて分析する。実験実験では、様々なデータセットとモデルをカバーし、異なる基準に従って校正方法を比較する。
論文参考訳（メタデータ） (2023-03-19T20:27:51Z)
On the Importance of Calibration in Semi-supervised Learning [13.859032326378188]
State-of-the-art (SOTA) の半教師付き学習(SSL)手法はラベル付きデータとラベルなしデータの混在を活用することに成功している。我々は、キャリブレーションを最適化し、標準ビジョンベンチマークでその有効性を実証する新しいSSLモデル群を紹介します。
論文参考訳（メタデータ） (2022-10-10T15:41:44Z)
Identifying and mitigating bias in algorithms used to manage patients in a pandemic [4.756860520861679]
現実のデータセットを使用して、新型コロナウイルスの死亡率、人工呼吸器の状態、入院状態を予測するために、ロジスティック回帰モデルが作成された。モデルではバイアス試験の回数が57%減少した。キャリブレーション後, 予測モデルの平均感度は0.527から0.955に増加した。
論文参考訳（メタデータ） (2021-10-30T21:10:56Z)
Bootstrapping Your Own Positive Sample: Contrastive Learning With Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。 EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文参考訳（メタデータ） (2021-04-07T06:02:04Z)
Increasing the efficiency of randomized trial estimates via linear adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文参考訳（メタデータ） (2020-12-17T21:10:10Z)
UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。 UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。 UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文参考訳（メタデータ） (2020-10-22T02:28:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。