論文の概要: CheXGenBench: A Unified Benchmark For Fidelity, Privacy and Utility of Synthetic Chest Radiographs
- arxiv url: http://arxiv.org/abs/2505.10496v1
- Date: Thu, 15 May 2025 16:59:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.429564
- Title: CheXGenBench: A Unified Benchmark For Fidelity, Privacy and Utility of Synthetic Chest Radiographs
- Title(参考訳): CheXGenBench: 合成胸像の忠実さ、プライバシー、実用性のための統一ベンチマーク
- Authors: Raman Dutt, Pedro Sanchez, Yongchen Yao, Steven McDonagh, Sotirios A. Tsaftaris, Timothy Hospedales,
- Abstract要約: CheXGenBenchは人工胸部X線撮影のための厳密で多面的な評価フレームワークである。
それは、最先端のテキスト・ツー・イメージ生成モデル間で、忠実さ、プライバシーリスク、臨床ユーティリティを同時に評価する。
トップパフォーマンスモデルにより生成された75Kのラジオグラフからなる高品質な合成データセットSynthCheX-75Kをリリースする。
- 参考スコア(独自算出の注目度): 17.95415442789521
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce CheXGenBench, a rigorous and multifaceted evaluation framework for synthetic chest radiograph generation that simultaneously assesses fidelity, privacy risks, and clinical utility across state-of-the-art text-to-image generative models. Despite rapid advancements in generative AI for real-world imagery, medical domain evaluations have been hindered by methodological inconsistencies, outdated architectural comparisons, and disconnected assessment criteria that rarely address the practical clinical value of synthetic samples. CheXGenBench overcomes these limitations through standardised data partitioning and a unified evaluation protocol comprising over 20 quantitative metrics that systematically analyse generation quality, potential privacy vulnerabilities, and downstream clinical applicability across 11 leading text-to-image architectures. Our results reveal critical inefficiencies in the existing evaluation protocols, particularly in assessing generative fidelity, leading to inconsistent and uninformative comparisons. Our framework establishes a standardised benchmark for the medical AI community, enabling objective and reproducible comparisons while facilitating seamless integration of both existing and future generative models. Additionally, we release a high-quality, synthetic dataset, SynthCheX-75K, comprising 75K radiographs generated by the top-performing model (Sana 0.6B) in our benchmark to support further research in this critical domain. Through CheXGenBench, we establish a new state-of-the-art and release our framework, models, and SynthCheX-75K dataset at https://raman1121.github.io/CheXGenBench/
- Abstract(参考訳): 胸部X線写真生成のための厳密で多面的な評価フレームワークであるCheXGenBenchを導入し,最新のテキスト・画像生成モデル間での忠実さ,プライバシ・リスク,臨床的有用性を同時に評価する。
実世界の画像のための生成AIの急速な進歩にもかかわらず、医療領域の評価は、方法論上の不整合、時代遅れの建築比較、および合成試料の実用的臨床的価値にほとんど対処しない非連結評価基準によって妨げられている。
CheXGenBenchは、標準化されたデータパーティショニングと、生成品質、潜在的なプライバシの脆弱性、11の主要なテキスト・ツー・イメージアーキテクチャのダウンストリーム臨床適用性を体系的に分析する20以上の定量的メトリクスからなる統一された評価プロトコルを通じて、これらの制限を克服する。
以上の結果から,既存の評価プロトコル,特に生成的忠実度の評価において重要な非効率性が明らかとなり,不整合性および非整合性の比較がもたらされた。
我々のフレームワークは、医療AIコミュニティのための標準化されたベンチマークを確立し、既存の世代モデルと将来の世代モデルの両方のシームレスな統合を容易にしながら、客観的かつ再現可能な比較を可能にする。
さらに、この重要な領域のさらなる研究を支援するために、上位性能モデル(Sana 0.6B)が生成する75Kのラジオグラフからなる高品質な合成データセット、SynthCheX-75Kをリリースする。
CheXGenBenchを通じて、新しい最先端のフレームワーク、モデル、SynthCheX-75Kデータセットをhttps://raman1121.github.io/CheXGenBench/で公開します。
関連論文リスト
- Metrics that matter: Evaluating image quality metrics for medical image generation [48.85783422900129]
本研究は、脳MRIデータを用いて、一般的に使用される非参照画像品質指標を包括的に評価する。
本研究は, ノイズ, 分布変化, および臨床的に関係のある不正確さを模倣した形態的変化を含む, 様々な課題に対する計量感度を評価する。
論文 参考訳(メタデータ) (2025-05-12T01:57:25Z) - AI-GenBench: A New Ongoing Benchmark for AI-Generated Image Detection [9.540547388707987]
Ai-GenBenchは、現実のシナリオにおけるAI生成イメージの堅牢な検出の必要性に対処するために設計された、新しいベンチマークである。
Ai-GenBenchは、明確な評価ルールと制御された拡張戦略を確立することにより、検出方法とスケーラブルなソリューションの有意義な比較を可能にする。
論文 参考訳(メタデータ) (2025-04-29T15:41:13Z) - VICCA: Visual Interpretation and Comprehension of Chest X-ray Anomalies in Generated Report Without Human Feedback [1.5839621757142595]
本稿では,AI生成医療報告のセマンティックアライメントと位置決め精度の向上を目的とした新しいフレームワークを提案する。
元の画像と生成された画像の特徴を比較することにより、デュアルスコーリングシステムを導入する。
このアプローチは既存の手法よりも優れており、病理の局在化やテキスト・ツー・イメージのアライメントにおいて最先端の結果が得られている。
論文 参考訳(メタデータ) (2025-01-29T16:02:16Z) - ReXrank: A Public Leaderboard for AI-Powered Radiology Report Generation [16.687723916901728]
我々は、AIを利用した放射線学レポート生成を評価するためのリーダーボードで課題であるReXrankを紹介する。
このフレームワークには1万の研究からなる最大のテストデータセットであるReXGradientが組み込まれています。
この標準化された評価フレームワークを提供することで、ReXrankはモデルパフォーマンスの有意義な比較を可能にします。
論文 参考訳(メタデータ) (2024-11-22T18:40:02Z) - Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
人工知能(AI)に基づく合成データ生成は、臨床医学の届け方を変えることができる。
本研究は,無線カプセル内視鏡(WCE)画像を用いた炎症性腸疾患(IBD)の診断における概念実証による医療用SDGの臨床評価に焦点を当てた。
その結果、TIDE-IIは、最先端の生成モデルと比較して品質が向上し、臨床的に可塑性で、非常に現実的なWCE画像を生成することがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - Towards Predicting Temporal Changes in a Patient's Chest X-ray Images based on Electronic Health Records [9.398163873685798]
本稿では,従来のCXRとその後の医療イベントを統合することで,将来のCXR画像を予測する新しいフレームワークであるEHRXDiffを提案する。
その結果、我々のフレームワークは、潜在的時間的変化を効果的に捉えた高品質で現実的な未来像を生成することがわかった。
論文 参考訳(メタデータ) (2024-09-11T04:49:44Z) - Revisiting Computer-Aided Tuberculosis Diagnosis [56.80999479735375]
結核(TB)は世界的な健康上の脅威であり、毎年何百万人もの死者を出している。
深層学習を用いたコンピュータ支援結核診断 (CTD) は有望であるが, 限られたトレーニングデータによって進行が妨げられている。
結核X線(TBX11K)データセットは11,200個の胸部X線(CXR)画像とそれに対応するTB領域のバウンディングボックスアノテーションを含む。
このデータセットは、高品質なCTDのための洗練された検出器のトレーニングを可能にする。
論文 参考訳(メタデータ) (2023-07-06T08:27:48Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。