論文の概要: MeDi: Metadata-Guided Diffusion Models for Mitigating Biases in Tumor Classification
- arxiv url: http://arxiv.org/abs/2506.17140v1
- Date: Fri, 20 Jun 2025 16:41:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.549798
- Title: MeDi: Metadata-Guided Diffusion Models for Mitigating Biases in Tumor Classification
- Title(参考訳): MeDi: 腫瘍分類におけるビアーゼの緩和のためのメタデータ誘導拡散モデル
- Authors: David Jacob Drexlin, Jonas Dippel, Julius Hense, Niklas Prenißl, Grégoire Montavon, Frederick Klauschen, Klaus-Robert Müller,
- Abstract要約: 本稿では,このようなメタデータを生成拡散モデルフレームワーク(MeDi)に明示的にモデル化する手法を提案する。
MeDiは、不足しているサブ集団を合成データで対象とする拡張を可能にする。
TCGAの未確認サブポピュレーションに対して,MeDiが高品質な病理像を生成することを実験的に示す。
- 参考スコア(独自算出の注目度): 13.350688594462214
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep learning models have made significant advances in histological prediction tasks in recent years. However, for adaptation in clinical practice, their lack of robustness to varying conditions such as staining, scanner, hospital, and demographics is still a limiting factor: if trained on overrepresented subpopulations, models regularly struggle with less frequent patterns, leading to shortcut learning and biased predictions. Large-scale foundation models have not fully eliminated this issue. Therefore, we propose a novel approach explicitly modeling such metadata into a Metadata-guided generative Diffusion model framework (MeDi). MeDi allows for a targeted augmentation of underrepresented subpopulations with synthetic data, which balances limited training data and mitigates biases in downstream models. We experimentally show that MeDi generates high-quality histopathology images for unseen subpopulations in TCGA, boosts the overall fidelity of the generated images, and enables improvements in performance for downstream classifiers on datasets with subpopulation shifts. Our work is a proof-of-concept towards better mitigating data biases with generative models.
- Abstract(参考訳): 近年,深層学習モデルは組織学的予測タスクにおいて大きな進歩を遂げている。
しかし、臨床実践に適応するためには、染色、スキャナー、病院、人口統計などの様々な条件に対する堅牢性の欠如は、依然として制限要因である。
大規模な基礎モデルは、この問題を完全には排除していない。
そこで本稿では,メタデータをメタデータ誘導型生成拡散モデルフレームワーク(MeDi)に明示的にモデル化する手法を提案する。
MeDiは、限られたトレーニングデータのバランスを保ち、下流モデルにおけるバイアスを緩和する合成データによる、未表現サブポピュレーションのターゲット拡大を可能にする。
実験により,MeDiはTCGAの未確認サブポピュレーションに対して高品質な病理像を生成するとともに,生成画像全体の忠実度を高めるとともに,サブポピュレーションシフトのあるデータセット上での下流分類器の性能を向上させることができることを示した。
私たちの仕事は、生成モデルによるデータのバイアスを緩和するための概念実証です。
関連論文リスト
- Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - Improving Fairness and Mitigating MADness in Generative Models [21.024727486615646]
我々は、意図的に設計されたハイパーネットワークで生成モデルをトレーニングすると、マイノリティクラスに属するデータポイントを生成する際により公平なモデルが得られることを示す。
本稿では,実データと自己合成データとの差分を正規化する手法を提案する。
論文 参考訳(メタデータ) (2024-05-22T20:24:41Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Latent Code Augmentation Based on Stable Diffusion for Data-free Substitute Attacks [47.84143701817491]
ブラックボックス代替攻撃では対象モデルのトレーニングデータが利用できないため、近年のスキームではGANを用いて代替モデルのトレーニングデータを生成する。
本稿では,SD(Stable Diffusion)に基づくデータフリー代替攻撃方式を提案する。
論文 参考訳(メタデータ) (2023-07-24T15:10:22Z) - Metapopulation Graph Neural Networks: Deep Metapopulation Epidemic
Modeling with Human Mobility [14.587916407752719]
多段階多地域流行予測のための新しいハイブリッドモデルMepoGNNを提案する。
本モデルでは, 確認症例数だけでなく, 疫学的パラメータも明示的に学習できる。
論文 参考訳(メタデータ) (2023-06-26T17:09:43Z) - Learning to Jump: Thinning and Thickening Latent Counts for Generative
Modeling [69.60713300418467]
ジャンプの学習は、様々な種類のデータの生成モデリングのための一般的なレシピである。
ジャンプの学習が、デノゼの学習と相容れないパフォーマンスを期待される場合と、より良いパフォーマンスを期待される場合を実証する。
論文 参考訳(メタデータ) (2023-05-28T05:38:28Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。