論文の概要: Intersectional Fairness in Vision-Language Models for Medical Image Disease Classification
- arxiv url: http://arxiv.org/abs/2512.15249v1
- Date: Wed, 17 Dec 2025 09:47:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.924504
- Title: Intersectional Fairness in Vision-Language Models for Medical Image Disease Classification
- Title(参考訳): 医用画像疾患分類のための視覚言語モデルにおける間欠的公正性
- Authors: Yupeng Zhang, Adam G. Dunn, Usman Naseem, Jinman Kim,
- Abstract要約: CMAC-MMD(Cross-Modal Alignment Consistency)は、横断的な患者サブグループ間で診断の確実性を標準化するトレーニングフレームワークである。
皮膚科コホートでは, 交叉異常診断ギャップ(正陽性率差$TPR)を0.50から0.26に減らした。
緑内障検診では、TPRが0.41ドルから0.31ドルに値下げされ、より良いAUCが0.72ドル(vs. 0.71ベースライン)となった。
- 参考スコア(独自算出の注目度): 25.30858592524878
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Medical artificial intelligence (AI) systems, particularly multimodal vision-language models (VLM), often exhibit intersectional biases where models are systematically less confident in diagnosing marginalised patient subgroups. Such bias can lead to higher rates of inaccurate and missed diagnoses due to demographically skewed data and divergent distributions of diagnostic certainty. Current fairness interventions frequently fail to address these gaps or compromise overall diagnostic performance to achieve statistical parity among the subgroups. In this study, we developed Cross-Modal Alignment Consistency (CMAC-MMD), a training framework that standardises diagnostic certainty across intersectional patient subgroups. Unlike traditional debiasing methods, this approach equalises the model's decision confidence without requiring sensitive demographic data during clinical inference. We evaluated this approach using 10,015 skin lesion images (HAM10000) with external validation on 12,000 images (BCN20000), and 10,000 fundus images for glaucoma detection (Harvard-FairVLMed), stratifying performance by intersectional age, gender, and race attributes. In the dermatology cohort, the proposed method reduced the overall intersectional missed diagnosis gap (difference in True Positive Rate, $Δ$TPR) from 0.50 to 0.26 while improving the overall Area Under the Curve (AUC) from 0.94 to 0.97 compared to standard training. Similarly, for glaucoma screening, the method reduced $Δ$TPR from 0.41 to 0.31, achieving a better AUC of 0.72 (vs. 0.71 baseline). This establishes a scalable framework for developing high-stakes clinical decision support systems that are both accurate and can perform equitably across diverse patient subgroups, ensuring reliable performance without increasing privacy risks.
- Abstract(参考訳): 医療人工知能(AI)システム、特にマルチモーダル視覚言語モデル(VLM)は、モデルが疎外された患者サブグループの診断において体系的に信頼性が低い交差点バイアスを示すことが多い。
このようなバイアスは、人口統計学的に歪んだデータと診断確実性のばらつきによる不正確な診断と欠落の頻度を上昇させる可能性がある。
現在の公正な介入は、しばしばこれらのギャップに対処したり、診断性能を損なうことで、サブグループ間の統計的同等性を達成するのに失敗する。
本研究では,クロスモーダルアライメント・コンシスタンス(CMAC-MMD)を開発した。
従来のデバイアス法とは異なり、この手法は臨床推論中に機密的な人口統計データを必要とせず、モデルの決定信頼度を等しくする。
12,000枚 (BCN20000), 緑内障検出用1万枚 (Harvard-FairVLMed) , 交叉年齢, 性別, 人種属性による階層化性能について, 10,015枚の皮膚病変画像 (HAM10000) を用いて検討した。
皮膚科コホートにおいて, 提案手法は, 正の正の値, Δ$TPRの差を0.50から0.26に減らし, 通常の訓練に比べてAUCの面積を0.94から0.97に改善した。
同様に緑内障検診では、$Δ$TPR を 0.41 から 0.31 に減らし、より良い AUC を 0.72 (vs. 0.71 ベースライン) とした。
これにより、多種多様な患者サブグループで公平に機能し、プライバシリスクを増大させることなく信頼性の高いパフォーマンスを確保できる、高精度な臨床診断支援システムを開発するためのスケーラブルな枠組みが確立される。
関連論文リスト
- MeCaMIL: Causality-Aware Multiple Instance Learning for Fair and Interpretable Whole Slide Image Diagnosis [40.3028468133626]
MIL(Multiple Case Learning)は、コンピュータ病理学における全スライド画像(WSI)解析の主流パラダイムとして登場した。
因果関係を意識したMILフレームワークである textbfMeCaMIL は、構造化因果グラフを通じて、階層的共同創設者を明示的にモデル化する。
MeCaMILは優れた公正性を達成する -- 人口格差の分散は、属性全体の平均で65%以上減少する。
論文 参考訳(メタデータ) (2025-11-14T06:47:21Z) - FAST-CAD: A Fairness-Aware Framework for Non-Contact Stroke Diagnosis [8.939811267715228]
本稿では,FAST-CADを提案する。FAST-CADは,ドメイン・アドバイザリ・トレーニングと群分布的ロバストな最適化を組み合わせた理論的基盤を持つフレームワークである。
我々のアプローチは、領域適応とミニマックスフェアネス理論に基づいており、収束境界の保証とフェアネスを提供する。
実験により, 人口集団間の公平性を保ちながら, 診断性能が良好であることが確認された。
論文 参考訳(メタデータ) (2025-11-12T01:40:58Z) - A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - Debias-CLR: A Contrastive Learning Based Debiasing Method for Algorithmic Fairness in Healthcare Applications [0.17624347338410748]
異なる治療と戦うために,暗黙の処理内脱バイアス法を提案した。
心不全患者の臨床記録と診断基準,治療報告,生理的活力について検討した。
Debias-CLRは、性別や民族を嫌う場合に、SC-WEAT(Single-Category Word Embedding Association Test)の効果を減少させることができた。
論文 参考訳(メタデータ) (2024-11-15T19:32:01Z) - Fairness Evolution in Continual Learning for Medical Imaging [47.52603262576663]
本研究では、ドメイン固有の公平度指標を用いてタスク間でバイアスがどのように進化し、異なるCL戦略がこの進化にどのように影響するかを検討する。
以上の結果から,擬似ラベルと擬似ラベルの学習は最適分類性能を実現するが,擬似ラベルの偏りは小さいことが示唆された。
論文 参考訳(メタデータ) (2024-04-10T09:48:52Z) - Rescuing referral failures during automated diagnosis of domain-shifted
medical images [17.349847762608086]
異なる人口層から取得した医療画像や、別の技術を用いて測定した場合、最先端の領域一般化アプローチでさえ、参照中に深刻な失敗を犯すことが示される。
我々は,これらの障害を解消し,大幅な性能向上を実現する,ロバストな一般化とポストホック参照アプローチの新たな組み合わせを評価する。
論文 参考訳(メタデータ) (2023-11-28T13:14:55Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Private, fair and accurate: Training large-scale, privacy-preserving AI models in medical imaging [47.99192239793597]
我々は,AIモデルのプライバシ保護トレーニングが,非プライベートトレーニングと比較して精度と公平性に与える影響を評価した。
我々の研究は、実際の臨床データセットの困難な現実的な状況下では、診断深層学習モデルのプライバシー保護トレーニングは、優れた診断精度と公正さで可能であることを示しています。
論文 参考訳(メタデータ) (2023-02-03T09:49:13Z) - Estimating and Improving Fairness with Adversarial Learning [65.99330614802388]
本研究では,深層学習に基づく医療画像解析システムにおけるバイアスの同時緩和と検出を目的としたマルチタスク・トレーニング戦略を提案する。
具体的には,バイアスに対する識別モジュールと,ベース分類モデルにおける不公平性を予測するクリティカルモジュールを追加することを提案する。
大規模で利用可能な皮膚病変データセットのフレームワークを評価します。
論文 参考訳(メタデータ) (2021-03-07T03:10:32Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。