論文の概要: Beyond Diagnostic Performance: Revealing and Quantifying Ethical Risks in Pathology Foundation Models
- arxiv url: http://arxiv.org/abs/2502.16889v2
- Date: Tue, 01 Jul 2025 15:08:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-02 15:54:40.036212
- Title: Beyond Diagnostic Performance: Revealing and Quantifying Ethical Risks in Pathology Foundation Models
- Title(参考訳): 診断性能を超える:病理基盤モデルにおける倫理的リスクの解明と定量化
- Authors: Weiping Lin, Shen Liu, Runchen Zhu, Yixuan Lin, Baoshun Wang, Liansheng Wang,
- Abstract要約: 病理基盤モデル (Pathology foundation model, PFM) は、計算病理学に適した大規模事前訓練モデルである。
我々は,プライバシリーク,臨床信頼性,グループフェアネスなど,PFMの倫理的リスクに関する定量的分析を開拓した。
この研究は、PFMにおける倫理的リスクの最初の定量的かつ体系的な評価を提供する。
- 参考スコア(独自算出の注目度): 9.324455712108175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pathology foundation models (PFMs), as large-scale pre-trained models tailored for computational pathology, have significantly advanced a wide range of applications. Their ability to leverage prior knowledge from massive datasets has streamlined the development of intelligent pathology models. However, we identify several critical and interrelated ethical risks that remain underexplored, yet must be addressed to enable the safe translation of PFMs from lab to clinic. These include the potential leakage of patient-sensitive attributes, disparities in model performance across demographic and institutional subgroups, and the reliance on diagnosis-irrelevant features that undermine clinical reliability. In this study, we pioneer the quantitative analysis for ethical risks in PFMs, including privacy leakage, clinical reliability, and group fairness. Specifically, we propose an evaluation framework that systematically measures key dimensions of ethical concern: the degree to which patient-sensitive attributes can be inferred from model representations, the extent of performance disparities across demographic and institutional subgroups, and the influence of diagnostically irrelevant features on model decisions. We further investigate the underlying causes of these ethical risks in PFMs and empirically validate our findings. Then we offer insights into potential directions for mitigating such risks, aiming to inform the development of more ethically robust PFMs. This work provides the first quantitative and systematic evaluation of ethical risks in PFMs. Our findings highlight the urgent need for ethical safeguards in PFMs and offer actionable insights for building more trustworthy and clinically robust PFMs. To facilitate future research and deployment, we will release the assessment framework as an online toolkit to support the development, auditing, and deployment of ethically robust PFMs.
- Abstract(参考訳): 病理基盤モデル(PFM)は、計算病理学に適した大規模事前学習モデルとして、広範囲の応用が大幅に進歩した。
大量のデータセットから事前知識を活用する能力は、インテリジェントな病理モデルの開発を合理化している。
しかし,実験室からクリニックへの安全なPFM翻訳を可能にするためには,未調査のままでありながら対処する必要がある,いくつかの批判的・相互関連倫理的リスクを特定した。
これらには、患者に敏感な属性の潜在的漏洩、人口統計学的および制度的サブグループ間のモデルパフォーマンスの格差、臨床的信頼性を損なう診断に関連のない特徴への依存が含まれる。
本研究では,プライバシリーク,臨床信頼性,グループフェアネスなど,PFMの倫理的リスクに関する定量的分析を開拓した。
具体的には、患者に敏感な属性がモデル表現から推測できる程度、人口統計学的および制度的サブグループ間のパフォーマンス格差の程度、そして、診断的に無関係な特徴がモデル決定に与える影響を体系的に評価する枠組みを提案する。
PFMにおけるこれらの倫理的リスクの根本原因をさらに調査し,その知見を実証的に検証した。
そして、我々は、より倫理的に堅牢なPFMの開発を知らせることを目的として、そのようなリスクを緩和するための潜在的な方向性についての洞察を提供する。
この研究は、PFMにおける倫理的リスクの最初の定量的かつ体系的な評価を提供する。
本研究は, PFMの倫理的保護の必要性を強調し, 信頼性が高く, 臨床的に堅牢な PFM の構築に有効な知見を提供するものである。
今後の研究・展開を容易にするため、倫理的に堅牢なPFMの開発・監査・展開を支援するオンラインツールキットとしてアセスメントフレームワークをリリースする。
関連論文リスト
- A Survey of Pathology Foundation Model: Progress and Future Directions [3.009351592961681]
近年の病理基盤モデル (PFM) は, 大規模な病理組織学的データに基づいて, 抽出器と凝集器の機能を大幅に増強した。
本調査では,各領域のFM分析に利用可能なトップダウンの哲学を通じて,PFMを分類する階層的分類について述べる。
論文 参考訳(メタデータ) (2025-04-05T03:44:09Z) - Perplexity Trap: PLM-Based Retrievers Overrate Low Perplexity Documents [64.43980129731587]
因果診断・矯正法(CDC)という因果推論時間脱バイアス法を提案する。
CDCはまず、パープレキシティのバイアス効果を診断し、その後、全体の関連スコアからバイアス効果を分離する。
3つの領域にまたがる実験結果から, より優れた脱バイアス効果が示された。
論文 参考訳(メタデータ) (2025-03-11T17:59:00Z) - Fair Diagnosis: Leveraging Causal Modeling to Mitigate Medical Bias [14.848344916632024]
医学画像解析では、モデル予測は人種や性別などのセンシティブな属性に影響される可能性がある。
本稿では,感度属性が診断予測に与える影響を低減することを目的とした因果モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-06T02:59:36Z) - FOCUS: Knowledge-enhanced Adaptive Visual Compression for Few-shot Whole Slide Image Classification [4.148491257542209]
少ないショット学習は、計算病理学における癌診断の重要な解決策である。
このパラダイムにおける重要な課題は、スライド画像全体(WSI)の限られたトレーニングセットと膨大な数のパッチとの間の固有の相違に起因する。
我々は、診断関連領域の集中分析を可能にするために、知識強化型適応型視覚圧縮フレームワーク、FOCUSを紹介した。
論文 参考訳(メタデータ) (2024-11-22T05:36:38Z) - Establishing Causal Relationship Between Whole Slide Image Predictions and Diagnostic Evidence Subregions in Deep Learning [3.5504159526793924]
Causal Inference Multiple Instance Learning (CI-MIL)は、サブイメージの認識の混乱を軽減するために配布外一般化を利用する。
CI-MILは、その選択された領域が基底真理アノテーションと高い一貫性を示すため、優れた解釈可能性を示す。
論文 参考訳(メタデータ) (2024-07-24T11:00:08Z) - Decoding Decision Reasoning: A Counterfactual-Powered Model for Knowledge Discovery [6.1521675665532545]
医用画像では、AIモデルの予測の背後にある根拠を明らかにすることが、信頼性を評価する上で重要である。
本稿では,意思決定推論と特徴識別機能を備えた説明可能なモデルを提案する。
提案手法を実装することにより,データ駆動モデルにより活用されるクラス固有の特徴を効果的に識別および可視化することができる。
論文 参考訳(メタデータ) (2024-05-23T19:00:38Z) - Unified Uncertainty Estimation for Cognitive Diagnosis Models [70.46998436898205]
本稿では,幅広い認知診断モデルに対する統一的不確実性推定手法を提案する。
診断パラメータの不確かさをデータ・アスペクトとモデル・アスペクトに分解する。
本手法は有効であり,認知診断の不確実性に関する有用な知見を提供することができる。
論文 参考訳(メタデータ) (2024-03-09T13:48:20Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - Progress and Opportunities of Foundation Models in Bioinformatics [77.74411726471439]
基礎モデル(FM)は、特に深層学習の領域において、計算生物学の新しい時代に定着した。
我々の焦点は、特定の生物学的問題にFMを応用することであり、研究ニーズに適切なFMを選択するために研究コミュニティを指導することを目的としています。
データノイズ、モデル説明可能性、潜在的なバイアスなど、生物学においてFMが直面する課題と限界を分析します。
論文 参考訳(メタデータ) (2024-02-06T02:29:17Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Domain Invariant Model with Graph Convolutional Network for Mammogram
Classification [49.691629817104925]
グラフ畳み込みネットワークを用いたドメイン不変モデル(DIM-GCN)を提案する。
まず,潜伏変数を病原性その他の疾患関連部位に明示的に分解するベイズネットワークを提案する。
マクロな特徴をよりよく捉えるために、我々は、GCN(Graph Convolutional Network)を介して、観察された臨床特性を再構築の目的として活用する。
論文 参考訳(メタデータ) (2022-04-21T08:23:44Z) - What Do You See in this Patient? Behavioral Testing of Clinical NLP
Models [69.09570726777817]
本稿では,入力の変化に関する臨床結果モデルの振る舞いを評価する拡張可能なテストフレームワークを提案する。
私たちは、同じデータを微調整しても、モデル行動は劇的に変化し、最高のパフォーマンスのモデルが常に最も医学的に可能なパターンを学習していないことを示しています。
論文 参考訳(メタデータ) (2021-11-30T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。