Fugu-MT 論文翻訳(概要): Generative models improve fairness of medical classifiers under distribution shifts

論文の概要: Generative models improve fairness of medical classifiers under distribution shifts

arxiv url: http://arxiv.org/abs/2304.09218v1
Date: Tue, 18 Apr 2023 18:15:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-20 16:35:39.092255
Title: Generative models improve fairness of medical classifiers under distribution shifts
Title（参考訳）: 分布シフト下での医療分類器の公平性を改善する生成モデル
Authors: Ira Ktena, Olivia Wiles, Isabela Albuquerque, Sylvestre-Alvise Rebuffi, Ryutaro Tanno, Abhijit Guha Roy, Shekoofeh Azizi, Danielle Belgrave, Pushmeet Kohli, Alan Karthikesalingam, Taylan Cemgil, Sven Gowal
Abstract要約: データから現実的な拡張を自動的に学習することは、生成モデルを用いてラベル効率の良い方法で可能であることを示す。これらの学習の強化は、モデルをより堅牢で統計的に公平に配布できることを示した。
参考スコア（独自算出の注目度）: 49.10233060774818
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A ubiquitous challenge in machine learning is the problem of domain generalisation. This can exacerbate bias against groups or labels that are underrepresented in the datasets used for model development. Model bias can lead to unintended harms, especially in safety-critical applications like healthcare. Furthermore, the challenge is compounded by the difficulty of obtaining labelled data due to high cost or lack of readily available domain expertise. In our work, we show that learning realistic augmentations automatically from data is possible in a label-efficient manner using generative models. In particular, we leverage the higher abundance of unlabelled data to capture the underlying data distribution of different conditions and subgroups for an imaging modality. By conditioning generative models on appropriate labels, we can steer the distribution of synthetic examples according to specific requirements. We demonstrate that these learned augmentations can surpass heuristic ones by making models more robust and statistically fair in- and out-of-distribution. To evaluate the generality of our approach, we study 3 distinct medical imaging contexts of varying difficulty: (i) histopathology images from a publicly available generalisation benchmark, (ii) chest X-rays from publicly available clinical datasets, and (iii) dermatology images characterised by complex shifts and imaging conditions. Complementing real training samples with synthetic ones improves the robustness of models in all three medical tasks and increases fairness by improving the accuracy of diagnosis within underrepresented groups. This approach leads to stark improvements OOD across modalities: 7.7% prediction accuracy improvement in histopathology, 5.2% in chest radiology with 44.6% lower fairness gap and a striking 63.5% improvement in high-risk sensitivity for dermatology with a 7.5x reduction in fairness gap.
Abstract（参考訳）: 機械学習におけるユビキタスな課題は、ドメインの一般化の問題である。これは、モデル開発に使用されるデータセットに不足しているグループやラベルに対するバイアスを悪化させる可能性がある。モデルバイアスは、特に医療のような安全クリティカルなアプリケーションにおいて、意図しない害をもたらす可能性がある。さらに、高いコストや容易に利用できるドメインの専門知識の欠如によりラベル付きデータを得るのが困難である。本研究では,生成モデルを用いたラベル効率の良い方法で,データから現実的な拡張を自動学習できることを実証する。特に,画像モダリティのための異なる条件とサブグループの基盤となるデータ分布を捉えるために,ラベルなしデータの多さを活用する。適切なラベルに生成モデルを条件付けすることにより、特定の要求に応じて合成例の分布を制御できる。これらの学習の強化は、モデルをより堅牢で統計的に公平に分布させ、ヒューリスティックなものを上回ることができることを示した。アプローチの汎用性を評価するために, 異なる難易度を示す3つの異なる医用画像コンテキストについて検討した。 (i)公開一般化ベンチマークによる病理像 (ii)公開臨床データからの胸部x線、及び (III)複雑な変化と画像条件を特徴とする皮膚科画像。実際のトレーニングサンプルを合成標本で補完することで、3つの医療課題のモデルの堅牢性が向上し、未表現グループ内の診断精度を向上させることにより公平性を高める。このアプローチは、病理組織学における7.7%の予測精度の向上、5.2%の胸部x線検査でフェアネスギャップが44.6%低下し、63.5%の高リスク感度の改善、7.5倍のフェアネスギャップが低下した。

関連論文リスト

Patient-Conditioned Adaptive Offsets for Reliable Diagnosis across Subgroups [11.237134615215977]
我々は,共有診断モデルを維持しながらサブグループ信頼性を向上させる患者条件適応フレームワークであるHyperAdaptを紹介する。複数の公開医用画像ベンチマークによる実験により、提案手法は、全体的な精度を犠牲にすることなく、サブグループレベルのパフォーマンスを一貫して改善することを示した。
論文参考訳（メタデータ） (2026-01-19T14:33:41Z)
Robust Classification of Oral Cancer with Limited Training Data [0.0]
本稿では,小さな訓練セットを用いた口腔癌分類のための,畳み込みニューラルネットワーク(CNN)とベイズ深層学習を組み合わせたハイブリッドモデルを提案する。提案したモデルは、従来のCNNのパフォーマンスに匹敵する、トレーニングデータと同様の分布を持つテストデータセットで94%の精度を達成した。信頼分析の結果, 正しい分類標本に対する不確実性(高い信頼度)と誤分類標本に対する不確実性(低い信頼度)が認められた。
論文参考訳（メタデータ） (2025-10-02T00:40:53Z)
Improving Performance, Robustness, and Fairness of Radiographic AI Models with Finely-Controllable Synthetic Data [14.791557943114737]
RoentGen-v2は胸部X線写真のためのテキスト・画像拡散モデルである。人口動態条件付き臨床的にもっともらしい画像を生成する。我々は、この大規模な合成データセットを用いて、下流疾患分類モデルのための最適なトレーニングパイプラインを評価する。
論文参考訳（メタデータ） (2025-08-22T20:30:58Z)
Bias and Generalizability of Foundation Models across Datasets in Breast Mammography [4.117899774444893]
乳房マンモグラフィー分類のための基礎モデル(FM)の公平性とバイアスについて検討する。我々は、未表現領域と社内データセットからのさまざまなソースを含む、膨大なデータセットのプールを活用している。実験の結果,FMのモーダリティ固有の事前学習は性能を向上させるが,個々のデータセットの特徴に基づいて訓練された分類器はドメイン間の一般化に失敗することがわかった。
論文参考訳（メタデータ） (2025-05-14T06:56:17Z)
Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文参考訳（メタデータ） (2024-12-30T01:59:34Z)
FairREAD: Re-fusing Demographic Attributes after Disentanglement for Fair Medical Image Classification [3.615240611746158]
FairREAD (Fair Refusion After Disentanglement) は, センシティブな階層属性を公正な画像表現に再統合することで不公平を緩和するフレームワークである。 FairREADは、臨床に関係のある詳細を保存するために、制御された再灌流機構を使用しながら、人口統計情報をアンタングルする敵の訓練を採用している。大規模臨床X線データセットの総合的評価は、FairREADが診断精度を維持しながら不公平度指標を著しく低減することを示した。
論文参考訳（メタデータ） (2024-12-20T22:17:57Z)
PRECISe : Prototype-Reservation for Explainable Classification under Imbalanced and Scarce-Data Settings [0.0]
PreCISeは,3つの課題すべてに対処するために,簡潔に構築された説明可能な設計モデルである。 PreCISeは、マイノリティクラスへのデータ効率的な一般化において、現在の最先端メソッドよりも優れています。ケーススタディでは、モデルが容易に解釈可能な予測を生成する能力を強調している。
論文参考訳（メタデータ） (2024-08-11T12:05:32Z)
The Limits of Fair Medical Imaging AI In The Wild [43.97266228706059]
医療用AIが人口統計エンコーディングをどのように利用するかを検討する。医療画像AIは、疾患分類において、人口動態のショートカットを利用することを確認した。人口統計属性のエンコーディングが少ないモデルは、しばしば「グローバルに最適」であることがわかった。
論文参考訳（メタデータ） (2023-12-11T18:59:50Z)
MCRAGE: Synthetic Healthcare Data for Fairness [3.0089659534785853]
そこで本稿では,MCRAGE (Generative Modeling) の強化による不均衡データセットの増大によるマイノリティクラス再バランスを提案する。 MCRAGEは、デノイング拡散確率モデル (Denoising Diffusion Probabilistic Model, CDDPM) を訓練し、未表現のクラスから高品質な合成EHRサンプルを生成する。この合成データを使用して、既存の不均衡なデータセットを増大させ、その結果、すべてのクラスにまたがるよりバランスの取れた分散を実現します。
論文参考訳（メタデータ） (2023-10-27T19:02:22Z)
SSL-CPCD: Self-supervised learning with composite pretext-class discrimination for improved generalisability in endoscopic image analysis [3.1542695050861544]
深層学習に基づく教師付き手法は医用画像解析において広く普及している。大量のトレーニングデータと、目に見えないデータセットに対する一般的な問題に直面する必要がある。本稿では,加法的角マージンを用いたパッチレベルのインスタンスグループ識別とクラス間変動のペナル化について検討する。
論文参考訳（メタデータ） (2023-05-31T21:28:08Z)
Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文参考訳（メタデータ） (2022-04-22T17:27:00Z)
SCALP -- Supervised Contrastive Learning for Cardiopulmonary Disease Classification and Localization in Chest X-rays using Patient Metadata [10.269187107011934]
そこで我々は,自己監督型コントラストアプローチを教師付き設定に拡張する,エンドツーエンドフレームワークであるSCALPを紹介した。 SCALPは同一患者(陽性キー)から胸部X線を抽出し、異なる患者(陰キー)から胸部X線を分離する実験により,SCALPは,分類タスクと局所化タスクの両方において,有意な差で既存のベースラインを上回っていることが示された。
論文参考訳（メタデータ） (2021-10-27T21:38:12Z)
Variational Knowledge Distillation for Disease Classification in Chest X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文参考訳（メタデータ） (2021-03-19T14:13:56Z)
Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文参考訳（メタデータ） (2021-02-26T02:29:30Z)
Semi-supervised Medical Image Classification with Relation-driven Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文参考訳（メタデータ） (2020-05-15T06:57:54Z)
Self-Training with Improved Regularization for Sample-Efficient Chest X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文参考訳（メタデータ） (2020-05-03T02:36:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。