論文の概要: Medical Imaging AI Competitions Lack Fairness
- arxiv url: http://arxiv.org/abs/2512.17581v1
- Date: Fri, 19 Dec 2025 13:48:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.409932
- Title: Medical Imaging AI Competitions Lack Fairness
- Title(参考訳): 医療画像AIコンペティションの欠如
- Authors: Annika Reinke, Evangelia Christodoulou, Sthuthi Sadananda, A. Emre Kavur, Khrystyna Faryna, Daan Schouten, Bennett A. Landman, Carole Sudre, Olivier Colliot, Nick Heller, Sophie Loizillon, Martin Maška, Maëlys Solal, Arya Yazdan-Panah, Vilma Bozgo, Ömer Sümer, Siem de Jong, Sophie Fischer, Michal Kozubek, Tim Rädsch, Nadim Hammoud, Fruzsina Molnár-Gábor, Steven Hicks, Michael A. Riegler, Anindo Saha, Vajira Thambawita, Pal Halvorsen, Amelia Jiménez-Sánchez, Qingyang Yang, Veronika Cheplygina, Sabrina Bottazzi, Alexander Seitel, Spyridon Bakas, Alexandros Karargyris, Kiran Vaidhya Venkadesh, Bram van Ginneken, Lena Maier-Hein,
- Abstract要約: 課題データセットが現実の臨床的多様性を代表するものなのか、FAIR原則に従ってアクセス可能で法的に再利用可能なものなのか、という2つの相補的な側面に沿って公正性を評価する。
本研究の結果は, 地理的位置, モダリティ, 問題型関連バイアスなどのデータセット構成に有意な偏りがみられ, 現在のベンチマークは実世界の臨床多様性を十分に反映していないことが示唆された。
これらの欠点は、ベンチマークエコシステムの基本的な制限を明らかにし、リーダボードの成功と臨床関連性との間の断絶を浮き彫りにします。
- 参考スコア(独自算出の注目度): 50.895929923643905
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Benchmarking competitions are central to the development of artificial intelligence (AI) in medical imaging, defining performance standards and shaping methodological progress. However, it remains unclear whether these benchmarks provide data that are sufficiently representative, accessible, and reusable to support clinically meaningful AI. In this work, we assess fairness along two complementary dimensions: (1) whether challenge datasets are representative of real-world clinical diversity, and (2) whether they are accessible and legally reusable in line with the FAIR principles. To address this question, we conducted a large-scale systematic study of 241 biomedical image analysis challenges comprising 458 tasks across 19 imaging modalities. Our findings show substantial biases in dataset composition, including geographic location, modality-, and problem type-related biases, indicating that current benchmarks do not adequately reflect real-world clinical diversity. Despite their widespread influence, challenge datasets were frequently constrained by restrictive or ambiguous access conditions, inconsistent or non-compliant licensing practices, and incomplete documentation, limiting reproducibility and long-term reuse. Together, these shortcomings expose foundational fairness limitations in our benchmarking ecosystem and highlight a disconnect between leaderboard success and clinical relevance.
- Abstract(参考訳): ベンチマークコンペティションは、医療画像における人工知能(AI)の開発、パフォーマンス標準の定義、方法論の進歩形成の中心である。
しかし、これらのベンチマークが、臨床的に意味のあるAIをサポートするのに十分な代表的、アクセス可能、再利用可能なデータを提供するかどうかは不明だ。
本研究は,(1)課題データセットが現実臨床の多様性を表すものであるか,(2)FAIR原則に従ってアクセス可能で法的に再利用可能であるか,の2つの相補的な側面に沿った公平性を評価する。
この課題に対処するため,19の画像モダリティにまたがる458のタスクからなる241のバイオメディカル画像解析課題を大規模に研究した。
本研究は, 地理的位置, モダリティ, 問題型関連バイアスなどのデータセット構成に有意な偏りを示し, 現状のベンチマークでは臨床の多様性を十分に反映していないことを示した。
その広範な影響にもかかわらず、チャレンジデータセットは、制限的または曖昧なアクセス条件、一貫性のないまたは非準拠のライセンス慣行、再現性や長期的な再利用を制限する不完全なドキュメントによって、しばしば制限された。
これらの欠点は、ベンチマークエコシステムにおける基礎的公正性の限界を明らかにし、リーダボードの成功と臨床関連性のギャップを浮き彫りにします。
関連論文リスト
- Achieving Fairness Without Harm via Selective Demographic Experts [16.212815178841087]
バイアス緩和技術は、公平性と正確性の間にトレードオフを課すことが多い。
臨床診断のような高い領域では、そのようなトレードオフは倫理的にも現実的にも受け入れられない。
我々は、異なる人口集団の異なる表現を学習し、公平で無害なアプローチを提案する。
論文 参考訳(メタデータ) (2025-11-09T09:11:02Z) - Few-Shot Multimodal Medical Imaging: A Theoretical Framework [0.0]
低リソース医用撮像条件下での学習と推論を特徴付ける統一理論フレームワークを提案する。
まず,臨床的に信頼性の高い精度を達成するのに必要な最小データ量を推定するために,少数の条件下で学習目標を定式化し,サンプルの複雑さを計算する。
そこで我々は,低データ条件下での解釈可能性保証を提供する,説明安定のための公式な指標を提案する。
論文 参考訳(メタデータ) (2025-11-03T01:21:50Z) - A Comprehensive Review of Datasets for Clinical Mental Health AI Systems [55.67299586253951]
本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
論文 参考訳(メタデータ) (2025-08-13T13:42:35Z) - Clinically-guided Data Synthesis for Laryngeal Lesion Detection [2.573786844054239]
そこで本研究では,Lyngeal endoscopic image-annotation pairを生成するために,Latent Diffusion Model(LDM)とControlNetアダプタを併用した新しいアプローチを提案する。
提案手法はCADx/eモデルのトレーニングデータセットの拡張に有効であり,喉頭科学における評価プロセスの強化に有効である。
論文 参考訳(メタデータ) (2025-08-08T09:55:54Z) - FairREAD: Re-fusing Demographic Attributes after Disentanglement for Fair Medical Image Classification [3.615240611746158]
FairREAD (Fair Refusion After Disentanglement) は, センシティブな階層属性を公正な画像表現に再統合することで不公平を緩和するフレームワークである。
FairREADは、臨床に関係のある詳細を保存するために、制御された再灌流機構を使用しながら、人口統計情報をアンタングルする敵の訓練を採用している。
大規模臨床X線データセットの総合的評価は、FairREADが診断精度を維持しながら不公平度指標を著しく低減することを示した。
論文 参考訳(メタデータ) (2024-12-20T22:17:57Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [54.98321887435557]
本稿では, マルチモーダル入力特徴と臨床治験設計における8つの重要な予測課題を網羅した, 精巧にキュレートされた23個のAI対応データセットについて述べる。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Collaborative Unsupervised Domain Adaptation for Medical Image Diagnosis [102.40869566439514]
我々は、Unsupervised Domain Adaptation (UDA)を通じて、対象タスクにおける学習を支援するために、関連ドメインからの豊富なラベル付きデータを活用しようとしている。
クリーンなラベル付きデータやサンプルを仮定するほとんどのUDAメソッドが等しく転送可能であるのとは異なり、協調的教師なしドメイン適応アルゴリズムを革新的に提案する。
提案手法の一般化性能を理論的に解析し,医用画像と一般画像の両方で実験的に評価する。
論文 参考訳(メタデータ) (2020-07-05T11:49:17Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。