論文の概要: An Explainable and Fair AI Tool for PCOS Risk Assessment: Calibration, Subgroup Equity, and Interactive Clinical Deployment
- arxiv url: http://arxiv.org/abs/2511.11636v1
- Date: Sat, 08 Nov 2025 16:14:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:22.695097
- Title: An Explainable and Fair AI Tool for PCOS Risk Assessment: Calibration, Subgroup Equity, and Interactive Clinical Deployment
- Title(参考訳): PCOSリスクアセスメントのための説明可能な公正なAIツール:校正、サブグループ・エクイティ、インタラクティブな臨床展開
- Authors: Asma Sadia Khan, Sadia Tabassum,
- Abstract要約: 本稿では,多嚢胞性卵巣症候群(PCOS)の予測のための,公平で解釈可能な機械学習フレームワークを提案する。
このフレームワークは、SHAPに基づく特徴属性と人口統計監査を統合し、予測的説明と観察的差異を関連付ける。
StreamlitベースのWebインターフェースは、リアルタイムPCOSリスク評価、ロッテルダム基準評価、インタラクティブな「What-if」分析を可能にする。
- 参考スコア(独自算出の注目度): 0.10026496861838446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a fairness-audited and interpretable machine learning framework for predicting polycystic ovary syndrome (PCOS), designed to evaluate model performance and identify diagnostic disparities across patient subgroups. The framework integrated SHAP-based feature attributions with demographic audits to connect predictive explanations with observed disparities for actionable insights. Probabilistic calibration metrics (Brier Score and Expected Calibration Error) are incorporated to ensure reliable risk predictions across subgroups. Random Forest, SVM, and XGBoost models were trained with isotonic and Platt scaling for calibration and fairness comparison. A calibrated Random Forest achieved a high predictive accuracy of 90.8%. SHAP analysis identified follicle count, weight gain, and menstrual irregularity as the most influential features, which are consistent with the Rotterdam diagnostic criteria. Although the SVM with isotonic calibration achieved the lowest calibration error (ECE = 0.0541), the Random Forest model provided a better balance between calibration and interpretability (Brier = 0.0678, ECE = 0.0666). Therefore, it was selected for detailed fairness and SHAP analyses. Subgroup analysis revealed that the model performed best among women aged 25-35 (accuracy 90.9%) but underperformed in those under 25 (69.2%), highlighting age-related disparities. The model achieved perfect precision in obese women and maintained high recall in lean PCOS cases, demonstrating robustness across phenotypes. Finally, a Streamlit-based web interface enables real-time PCOS risk assessment, Rotterdam criteria evaluation, and interactive 'what-if' analysis, bridging the gap between AI research and clinical usability.
- Abstract(参考訳): 本稿では,多嚢胞性卵巣症候群(PCOS)の予測のための,公平で解釈可能な機械学習フレームワークを提案する。
このフレームワークは、SHAPに基づく特徴属性と人口統計監査を統合し、予測的説明と観察的差異を関連付ける。
確率的校正基準(Brier Score と expecteded Calibration Error)は、サブグループ全体の信頼性の高いリスク予測を保証するために組み込まれている。
ランダムフォレスト、SVM、XGBoostモデルは、キャリブレーションと公平性比較のための等調スケーリングとプラットスケーリングで訓練された。
校正されたランダムフォレストは90.8%という高い予測精度を達成した。
SHAP分析では, 卵胞数, 体重増加, 月経不規則性を最も有意な特徴として同定し, ロッテルダム診断基準と一致した。
等速キャリブレーションを持つSVMは最低キャリブレーション誤差(ECE = 0.0541)を達成したが、ランダムフォレストモデルはキャリブレーションと解釈可能性のバランスが良くなった(Brier = 0.0678, ECE = 0.0666)。
そのため、詳細な公正度とSHAP分析のために選定された。
サブグループ分析の結果、25~35歳の女性(精度90.9%)の間では最高の成績を示したが、25歳未満(69.2%)では成績が低かった。
このモデルは肥満女性において完全精度を達成し、リーンPCOS症例では高いリコールを維持し、表現型間で堅牢性を示した。
最後に、StreamlitベースのWebインターフェースは、リアルタイムPCOSリスク評価、Rotterdam基準評価、インタラクティブな'What-if'分析を可能にし、AI研究と臨床ユーザビリティのギャップを埋める。
関連論文リスト
- On the Role of Calibration in Benchmarking Algorithmic Fairness for Skin Cancer Detection [0.03066137405373616]
我々はISIC 2020 Challengeデータセットの皮膚がん検出アルゴリズムの性能を評価する。
2位と3位のモデルと比較し、性別、人種、年齢によって定義されるサブグループに焦点を当てます。
既存のモデルでは識別精度が向上するが,リスクを過度に診断し,新たなデータセットに適用した場合に校正上の問題があることが判明した。
論文 参考訳(メタデータ) (2025-11-10T23:51:04Z) - Predicting Metabolic Dysfunction-Associated Steatotic Liver Disease using Machine Learning Methods [0.8642326601683298]
我々は、公正で厳密で再現可能なMASLD予測モデルを開発した。
MASLDは米国の成人の33%に影響を与え、最も一般的な慢性肝疾患である。
論文 参考訳(メタデータ) (2025-10-25T13:36:18Z) - Assessing the Feasibility of Early Cancer Detection Using Routine Laboratory Data: An Evaluation of Machine Learning Approaches on an Imbalanced Dataset [0.02030567625639093]
犬における早期がん検出のためのアクセス可能なスクリーニングツールの開発は、獣医学における重要な課題である。
本研究は,Golden Retriever Lifetime Studyコホートを用いたがんリスク分類の可能性を評価する。
通常の検査データには統計的に検出可能ながんシグナルが存在するが、正常な老化やその他の炎症状態から臨床的に信頼性の高い識別を行うには弱く、確立されていないと結論付けている。
論文 参考訳(メタデータ) (2025-10-23T04:52:42Z) - Automatic Cough Analysis for Non-Small Cell Lung Cancer Detection [33.37223681850477]
非小細胞肺癌(NSCLC)の早期発見は患者の予後改善に重要である。
本研究では,NSCLC患者と健常者との鑑別のためのスクリーニングツールとして,自動コークス分析の利用について検討する。
記録は、サポートベクタマシン(SVM)やXGBoostといった機械学習技術を用いて分析された。
論文 参考訳(メタデータ) (2025-07-25T11:30:22Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Evaluating Probabilistic Classifiers: The Triptych [62.997667081978825]
本稿では,予測性能の異なる相補的な側面に焦点をあてた診断グラフィックのトリチチを提案し,研究する。
信頼性図は校正に対処し、受信動作特性(ROC)曲線は識別能力を診断し、マーフィー図は全体的な予測性能と価値を視覚化する。
論文 参考訳(メタデータ) (2023-01-25T19:35:23Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。