論文の概要: Unveiling Institution-Specific Bias in Pathology Foundation Models: Detriments, Causes, and Potential Solutions
- arxiv url: http://arxiv.org/abs/2502.16889v1
- Date: Mon, 24 Feb 2025 06:40:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:54:04.080564
- Title: Unveiling Institution-Specific Bias in Pathology Foundation Models: Detriments, Causes, and Potential Solutions
- Title(参考訳): 病態基礎モデルにおける制度的バイアスの解明--除草・原因・可能性-
- Authors: Weiping Lin, Shen Liu, Runchen Zhu, Liansheng Wang,
- Abstract要約: 病理基盤モデル(PFM)によって抽出された特徴は,診断関連情報によってしばしば汚染される。
この汚染は、実際の臨床環境に適用する際のモデルの一般化能力を損なう、急激な相関をもたらす可能性がある。
我々は,無関係な情報の影響を軽減するための,シンプルで効果的なソリューションを提案する。
- 参考スコア(独自算出の注目度): 10.037604479753162
- License:
- Abstract: Pathology foundation models (PFMs) extract valuable discriminative features from images for downstream clinical tasks. PFMs have simplified the development of deep learning models, effectively leveraging prior knowledge to improve diagnostic accuracy in diverse scenarios. However, we find that PFMs sometimes struggle with certain challenges. Specifically, features extracted by PFMs are often contaminated by diagnosis-irrelevant information, i.e., institution-specific features associated with the images. This contamination can lead to spurious correlations, undermining the models' generalization ability when applied in real-world clinical settings. In this work, we first reveal the issue of feature contamination in PFMs, demonstrate the presence of institution-specific features, thoroughly investigate its negative impacts, analyze the underlying causes, and provide insights into potential solutions. Specifically, we find that institution-specific information is embedded in pathological images and can be readily captured by current PFMs. Through extensive experiments, we demonstrate the detrimental impact of this irrelevant information, particularly in out-of-distribution (OOD) settings, where reliance on contaminated features leads to significant performance degradation. This indicates that the models are being misled by non-diagnostic information. We further delve into the reasons PFMs extract such institution-specific information and validate our findings. Finally, we propose a simple yet effective solution to mitigate the influence of irrelevant information. This study is not intended to criticize existing PFMs, as they have indeed greatly advanced the development of computational pathology. our aim is to inspire future research to focus on innovative training strategies, rather than relying exclusively on scaling laws, to realize more generalized PFMs.
- Abstract(参考訳): 病理基盤モデル(PFMs)は、下流の臨床的タスクのために画像から貴重な識別的特徴を抽出する。
PFMは、様々なシナリオにおける診断精度を改善するために、事前知識を効果的に活用し、ディープラーニングモデルの開発を単純化した。
しかし、PFMは特定の課題に苦しむことがある。
具体的には、PFMによって抽出された特徴は、診断に関連のない情報、すなわち画像に関連する機関固有の特徴によってしばしば汚染される。
この汚染は、実際の臨床環境に適用する際のモデルの一般化能力を損なう、急激な相関をもたらす可能性がある。
本研究は, PFMにおける特徴汚染の問題を最初に明らかにし, 施設固有の特徴の存在を実証し, その負の影響を徹底的に調査し, その原因を分析し, 潜在的な解決策に関する洞察を提供する。
具体的には, 施設固有の情報は病理画像に埋め込まれており, 現状のPFMで容易に捉えられることが判明した。
広範にわたる実験を通じて、この無関係な情報の有害な影響、特に汚染された特徴への依存が性能を著しく低下させるオフ・オブ・ディストリビューション(OOD)における影響を実証した。
これは、モデルは非診断的な情報によって誤解されていることを示している。
PFMがそのような施設固有の情報を抽出する理由をさらに掘り下げ、その結果を検証した。
最後に,無関係な情報の影響を軽減するための,シンプルで効果的なソリューションを提案する。
この研究は、計算病理学の発展が著しく進んでいるため、既存のPFMを批判するものではない。
我々の目標は、より一般化されたPFMを実現するために、法のスケーリングにのみ依存するのではなく、革新的なトレーニング戦略に焦点をあてることに、将来の研究を刺激することである。
関連論文リスト
- Fair Diagnosis: Leveraging Causal Modeling to Mitigate Medical Bias [14.848344916632024]
医学画像解析では、モデル予測は人種や性別などのセンシティブな属性に影響される可能性がある。
本稿では,感度属性が診断予測に与える影響を低減することを目的とした因果モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-06T02:59:36Z) - FOCUS: Knowledge-enhanced Adaptive Visual Compression for Few-shot Whole Slide Image Classification [4.148491257542209]
少ないショット学習は、計算病理学における癌診断の重要な解決策である。
このパラダイムにおける重要な課題は、スライド画像全体(WSI)の限られたトレーニングセットと膨大な数のパッチとの間の固有の相違に起因する。
我々は、診断関連領域の集中分析を可能にするために、知識強化型適応型視覚圧縮フレームワーク、FOCUSを紹介した。
論文 参考訳(メタデータ) (2024-11-22T05:36:38Z) - Decoding Decision Reasoning: A Counterfactual-Powered Model for Knowledge Discovery [6.1521675665532545]
医用画像では、AIモデルの予測の背後にある根拠を明らかにすることが、信頼性を評価する上で重要である。
本稿では,意思決定推論と特徴識別機能を備えた説明可能なモデルを提案する。
提案手法を実装することにより,データ駆動モデルにより活用されるクラス固有の特徴を効果的に識別および可視化することができる。
論文 参考訳(メタデータ) (2024-05-23T19:00:38Z) - Unified Uncertainty Estimation for Cognitive Diagnosis Models [70.46998436898205]
本稿では,幅広い認知診断モデルに対する統一的不確実性推定手法を提案する。
診断パラメータの不確かさをデータ・アスペクトとモデル・アスペクトに分解する。
本手法は有効であり,認知診断の不確実性に関する有用な知見を提供することができる。
論文 参考訳(メタデータ) (2024-03-09T13:48:20Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - Progress and Opportunities of Foundation Models in Bioinformatics [77.74411726471439]
基礎モデル(FM)は、特に深層学習の領域において、計算生物学の新しい時代に定着した。
我々の焦点は、特定の生物学的問題にFMを応用することであり、研究ニーズに適切なFMを選択するために研究コミュニティを指導することを目的としています。
データノイズ、モデル説明可能性、潜在的なバイアスなど、生物学においてFMが直面する課題と限界を分析します。
論文 参考訳(メタデータ) (2024-02-06T02:29:17Z) - Domain-invariant Clinical Representation Learning by Bridging Data Distribution Shift across EMR Datasets [28.59271580918754]
効果的な予後モデルは、医師が正確な診断を行い、パーソナライズされた治療計画を設計するのを助けることができる。
限られたデータ収集、不十分な臨床経験、プライバシと倫理上の懸念は、データの可用性を制限します。
本稿では,ソースとターゲットデータセット間の遷移モデルを構築するドメイン不変表現学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T18:32:21Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Domain Invariant Model with Graph Convolutional Network for Mammogram
Classification [49.691629817104925]
グラフ畳み込みネットワークを用いたドメイン不変モデル(DIM-GCN)を提案する。
まず,潜伏変数を病原性その他の疾患関連部位に明示的に分解するベイズネットワークを提案する。
マクロな特徴をよりよく捉えるために、我々は、GCN(Graph Convolutional Network)を介して、観察された臨床特性を再構築の目的として活用する。
論文 参考訳(メタデータ) (2022-04-21T08:23:44Z) - What Do You See in this Patient? Behavioral Testing of Clinical NLP
Models [69.09570726777817]
本稿では,入力の変化に関する臨床結果モデルの振る舞いを評価する拡張可能なテストフレームワークを提案する。
私たちは、同じデータを微調整しても、モデル行動は劇的に変化し、最高のパフォーマンスのモデルが常に最も医学的に可能なパターンを学習していないことを示しています。
論文 参考訳(メタデータ) (2021-11-30T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。