論文の概要: XReal: Realistic Anatomy and Pathology-Aware X-ray Generation via Controllable Diffusion Model
- arxiv url: http://arxiv.org/abs/2403.09240v1
- Date: Thu, 14 Mar 2024 10:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-15 21:07:03.469482
- Title: XReal: Realistic Anatomy and Pathology-Aware X-ray Generation via Controllable Diffusion Model
- Title(参考訳): XReal: 可制御拡散モデルによる現実的解剖と病理認識X線生成
- Authors: Anees Ur Rehman Hashmi, Ibrahim Almakky, Mohammad Areeb Qazi, Santosh Sanjeev, Vijay Ram Papineni, Dwarikanath Mahapatra, Mohammad Yaqub,
- Abstract要約: 大規模な生成モデルは、視覚的に魅力的な画像を生成する上で、印象的な能力を示している。
胸部X線画像を生成するための新しい制御可能な拡散モデルであるXRealを提案する。
本手法は,微調整をすることなく,事前学習したテキスト・画像拡散モデルに空間制御をシームレスに統合することができる。
- 参考スコア(独自算出の注目度): 9.869490584811727
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large-scale generative models have demonstrated impressive capacity in producing visually compelling images, with increasing applications in medical imaging. However, they continue to grapple with the challenge of image hallucination and the generation of anatomically inaccurate outputs. These limitations are mainly due to the sole reliance on textual inputs and lack of spatial control over the generated images, hindering the potential usefulness of such models in real-life settings. We present XReal, a novel controllable diffusion model for generating realistic chest X-ray images through precise anatomy and pathology location control. Our lightweight method can seamlessly integrate spatial control in a pre-trained text-to-image diffusion model without fine-tuning, retaining its existing knowledge while enhancing its generation capabilities. XReal outperforms state-of-the-art x-ray diffusion models in quantitative and qualitative metrics while showing 13% and 10% anatomy and pathology realism gain, respectively, based on the expert radiologist evaluation. Our model holds promise for advancing generative models in medical imaging, offering greater precision and adaptability while inviting further exploration in this evolving field. A large synthetically generated data with annotations and code is publicly available at https://github.com/BioMedIA-MBZUAI/XReal.
- Abstract(参考訳): 大規模生成モデルは、視覚的に魅力的な画像を生成するための優れた能力を示しており、医療画像の応用が増加している。
しかし、画像幻覚と解剖学的に不正確なアウトプットの生成の難しさに悩まされ続けている。
これらの制限は主に、テキスト入力のみに依存することと、生成された画像に対する空間制御が欠如していることによるものであり、実際の環境でのそのようなモデルの有用性を妨げている。
本稿では,胸部X線像を高精度な解剖学的,病理的位置制御により生成する新しい制御可能な拡散モデルXRealを提案する。
我々の軽量な手法は、微調整をすることなく、事前訓練されたテキスト-画像拡散モデルに空間制御をシームレスに統合し、既存の知識を維持しつつ、生成能力を向上することができる。
XRealは、専門的な放射線学者の評価に基づいて、13%と10%の解剖学と病理リアリズムのゲインを示しながら、定量的および定性的な測定で最先端のX線拡散モデルより優れている。
我々のモデルは、医療画像における生成モデルの発展を約束し、より精度と適応性を提供しながら、この進化する分野におけるさらなる探索を招いている。
アノテーションとコードを備えた大規模な合成データもhttps://github.com/BioMedIA-MBzuAI/XRealで公開されている。
関連論文リスト
- Unraveling Normal Anatomy via Fluid-Driven Anomaly Randomization [3.513196894656874]
UNA(Unraveling Normal Anatomy, Unraveling Normal Anatomy)を導入した。
本研究では,現実的な病理プロファイルを無制限に生成する流体駆動型異常ランダム化手法を提案する。
健常な脳解剖の再構築におけるUNAの有効性を実証し,その異常検出への直接的応用を示す。
論文 参考訳(メタデータ) (2025-01-23T04:17:20Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
大規模なデータセットのトレーニングによるスケーリングは、画像生成の品質と忠実度を高め、拡散モデルによる操作を可能にすることが示されている。
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
本研究は,異なる微調整方式と組み合わせた場合,様々なシナリオにおいて顕著な性能向上を示すものである。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - Multi-Conditioned Denoising Diffusion Probabilistic Model (mDDPM) for Medical Image Synthesis [22.0080610434872]
アノテーションを用いた合成画像の制御生成フレームワークを提案する。
本手法は, 解剖学的に忠実に表現できる, 注記式肺CT画像を作成することができることを示す。
本実験は, この自然の制御された生成フレームワークが, ほぼすべての最先端画像生成モデルを超えることを実証した。
論文 参考訳(メタデータ) (2024-09-07T01:19:02Z) - Anatomically-Controllable Medical Image Generation with Segmentation-Guided Diffusion Models [11.835841459200632]
解剖学的に制御可能な医用画像生成を支援する拡散モデルに基づく手法を提案する。
また, ランダムマスクアブレーショントレーニングアルゴリズムを導入し, 解剖学的制約の組合せの条件付けを可能にする。
SegGuidedDiffは、生成した画像の忠実さを新たな最先端に到達して、解剖学的マスクを入力します。
論文 参考訳(メタデータ) (2024-02-07T19:35:09Z) - XrayGPT: Chest Radiographs Summarization using Medical Vision-Language
Models [60.437091462613544]
我々は,会話型医療ビジョン言語モデルであるXrayGPTを紹介する。
胸部X線写真に関するオープンエンドの質問を分析し、答えることができる。
自由テキストラジオグラフィーレポートから217kの対話的かつ高品質な要約を生成する。
論文 参考訳(メタデータ) (2023-06-13T17:59:59Z) - Trade-offs in Fine-tuned Diffusion Models Between Accuracy and
Interpretability [5.865936619867771]
生成拡散モデルにおける従来の計測値とモデル解釈可能性による画像の忠実度との間に連続的なトレードオフが生じる。
我々は、真に解釈可能な生成モデルを開発するための設計原則のセットを提示する。
論文 参考訳(メタデータ) (2023-03-31T09:11:26Z) - Patched Diffusion Models for Unsupervised Anomaly Detection in Brain MRI [55.78588835407174]
本稿では,正常脳解剖のパッチベース推定法として拡散モデルの生成タスクを再構築する手法を提案する。
腫瘍と多発性硬化症について検討し,既存のベースラインと比較して25.1%の改善がみられた。
論文 参考訳(メタデータ) (2023-03-07T09:40:22Z) - Multi-Domain Balanced Sampling Improves Out-of-Distribution
Generalization of Chest X-ray Pathology Prediction Models [67.2867506736665]
そこで本研究では, 簡単なバッチサンプリング手法を用いた胸部X線像の分布外一般化法を提案する。
複数のトレーニングデータセット間のバランスの取れたサンプリングは、バランスを取らずにトレーニングされたベースラインモデルよりもパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-12-27T15:28:01Z) - SQUID: Deep Feature In-Painting for Unsupervised Anomaly Detection [76.01333073259677]
無線画像からの異常検出のための空間認識型メモリキューを提案する(略してSQUID)。
SQUIDは, 微細な解剖学的構造を逐次パターンに分類でき, 推測では画像中の異常(見えない/修正されたパターン)を識別できる。
論文 参考訳(メタデータ) (2021-11-26T13:47:34Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。