論文の概要: FetalFlex: Anatomy-Guided Diffusion Model for Flexible Control on Fetal Ultrasound Image Synthesis
- arxiv url: http://arxiv.org/abs/2503.14906v1
- Date: Wed, 19 Mar 2025 05:16:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 15:22:21.709586
- Title: FetalFlex: Anatomy-Guided Diffusion Model for Flexible Control on Fetal Ultrasound Image Synthesis
- Title(参考訳): FetalFlex:胎児超音波画像合成におけるフレキシブル制御のための解剖誘導拡散モデル
- Authors: Yaofei Duan, Tao Tan, Zhiyuan Zhu, Yuhao Huang, Yuanji Zhang, Rui Gao, Patrick Cheong-Iao Pang, Xinru Gao, Guowei Tao, Xiang Cong, Zhou Li, Lianying Liang, Guangzhi He, Linliang Yin, Xuedong Deng, Xin Yang, Dong Ni,
- Abstract要約: これらの課題に対処するために、Flexible Fetal USイメージ生成フレームワーク(FetalFlex)を紹介します。
FetalFlexには、制御性を高めるための事前調整モジュールが組み込まれており、一貫したテクスチャと外観を保証するための再塗装戦略が導入されている。
マルチセンターデータセットの実験では、FetalFlexが複数の画像品質メトリクスで最先端のパフォーマンスを達成したことが示されている。
- 参考スコア(独自算出の注目度): 16.640351512021017
- License:
- Abstract: Fetal ultrasound (US) examinations require the acquisition of multiple planes, each providing unique diagnostic information to evaluate fetal development and screening for congenital anomalies. However, obtaining a comprehensive, multi-plane annotated fetal US dataset remains challenging, particularly for rare or complex anomalies owing to their low incidence and numerous subtypes. This poses difficulties in training novice radiologists and developing robust AI models, especially for detecting abnormal fetuses. In this study, we introduce a Flexible Fetal US image generation framework (FetalFlex) to address these challenges, which leverages anatomical structures and multimodal information to enable controllable synthesis of fetal US images across diverse planes. Specifically, FetalFlex incorporates a pre-alignment module to enhance controllability and introduces a repaint strategy to ensure consistent texture and appearance. Moreover, a two-stage adaptive sampling strategy is developed to progressively refine image quality from coarse to fine levels. We believe that FetalFlex is the first method capable of generating both in-distribution normal and out-of-distribution abnormal fetal US images, without requiring any abnormal data. Experiments on multi-center datasets demonstrate that FetalFlex achieved state-of-the-art performance across multiple image quality metrics. A reader study further confirms the close alignment of the generated results with expert visual assessments. Furthermore, synthetic images by FetalFlex significantly improve the performance of six typical deep models in downstream classification and anomaly detection tasks. Lastly, FetalFlex's anatomy-level controllable generation offers a unique advantage for anomaly simulation and creating paired or counterfactual data at the pixel level. The demo is available at: https://dyf1023.github.io/FetalFlex/.
- Abstract(参考訳): 胎児超音波検査は複数の平面の取得を必要とし、それぞれが胎児の発生と先天性異常のスクリーニングを評価するためのユニークな診断情報を提供する。
しかしながら、包括的で多面的アノテートされた胎児のデータセットを取得することは、特に稀または複雑な異常のために、その頻度が低く、多くのサブタイプがあるため、依然として困難である。
これは、初心者放射線科医の訓練や、特に異常な胎児を検出するための堅牢なAIモデルの開発に困難をもたらす。
本研究では,これらの課題に対処するフレキシブル胎児US画像生成フレームワーク(FetalFlex)を導入し,解剖学的構造とマルチモーダル情報を活用し,多様な平面にまたがる胎児US画像の制御可能な合成を可能にする。
具体的には、FetalFlexには、制御性を高めるための事前調整モジュールが組み込まれており、一貫したテクスチャと外観を保証するための再塗装戦略が導入されている。
さらに,画像品質を粗いレベルから細かいレベルまで段階的に改善する2段階適応サンプリング戦略を開発した。
We believe that FetalFlex is a first method to generate both in-distriion normal and out-of-distriion unusual fetal US images, without any normal data。
マルチセンターデータセットの実験では、FetalFlexが複数の画像品質メトリクスで最先端のパフォーマンスを達成したことが示されている。
読者研究は、生成した結果の密接なアライメントと、専門家による視覚的評価をさらに確認する。
さらに、FetalFlexによる合成画像は、下流分類と異常検出タスクにおける6つの典型的な深層モデルの性能を大幅に向上させた。
最後に、FetalFlexの解剖レベル制御可能な生成は、異常シミュレーションにユニークな利点を提供し、ピクセルレベルでペアまたはカウンターファクトのデータを作成する。
デモは、https://dyf1023.github.io/FetalFlex/.comで公開されている。
関連論文リスト
- FetalCLIP: A Visual-Language Foundation Model for Fetal Ultrasound Image Analysis [0.676810348604193]
FetalCLIPは胎児超音波画像の普遍的な表現を生成できる視覚言語基盤モデルである。
テキストと組み合わせた210,035個の胎児超音波画像から,マルチモーダル・ラーニング・アプローチを用いて事前訓練を行った。
論文 参考訳(メタデータ) (2025-02-20T18:30:34Z) - DiffDoctor: Diagnosing Image Diffusion Models Before Treating [57.82359018425674]
DiffDoctorは2段階のパイプラインで、画像拡散モデルがより少ないアーティファクトを生成するのを支援する。
我々は100万以上の欠陥のある合成画像のデータセットを収集し、効率的なHuman-in-the-loopアノテーションプロセスを構築した。
次に、学習したアーティファクト検出器が第2段階に関与し、ピクセルレベルのフィードバックを提供することで拡散モデルを最適化する。
論文 参考訳(メタデータ) (2025-01-21T18:56:41Z) - Synomaly Noise and Multi-Stage Diffusion: A Novel Approach for Unsupervised Anomaly Detection in Ultrasound Imaging [32.99597899937902]
拡散モデルに基づく新しい教師なし異常検出フレームワークを提案する。
提案手法は, 合成ノイズ関数と多段拡散過程を組み込む。
提案手法は頸動脈US,脳MRI,肝CTを用いて検討した。
論文 参考訳(メタデータ) (2024-11-06T15:43:51Z) - Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [88.34095233600719]
FAPromptは、より正確なZSADのためにきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
画像レベルおよび画素レベルのZSADタスクにおいて、最先端の手法を少なくとも3%-5%のAUC/APで大幅に上回っている。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Towards Realistic Ultrasound Fetal Brain Imaging Synthesis [0.7315240103690552]
臨床データ不足、患者のプライバシ、一般的には異常の稀な発生、データ収集と検証の専門家の限られたため、一般の超音波胎児画像データセットはほとんどない。
このようなデータ不足に対処するため、私たちは1つのパブリックデータセットから胎児の超音波脳面の画像を生成するために、GAN(Generative Adversarial Network)ベースのモデル、拡散超解像-GANとトランスフォーマーベース-GANを提案した。
論文 参考訳(メタデータ) (2023-04-08T07:07:20Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Dual-distribution discrepancy with self-supervised refinement for
anomaly detection in medical images [29.57501199670898]
我々は、既知の正規画像と未ラベル画像を利用するために、一級半教師付き学習(OC-SSL)を導入する。
再構成ネットワークのアンサンブルは、正規画像の分布と、正規画像と未ラベル画像の両方の分布をモデル化するように設計されている。
本稿では,異常を直接検出するのではなく,異常スコアを改良する自己教師型学習の新しい視点を提案する。
論文 参考訳(メタデータ) (2022-10-09T11:18:45Z) - Deep Anomaly Generation: An Image Translation Approach of Synthesizing
Abnormal Banded Chromosome Images [0.0]
我々は,現実的な単一染色体画像の生成を可能にする条件付き対位ネットワークを実装した。
自己生成2次元染色体セグメンテーションラベルマップに基づく画像から画像への変換手法を用いる。
本手法は構造異常を伴う染色体データセットのデータ増大に活用できると考えている。
論文 参考訳(メタデータ) (2021-09-20T17:16:23Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。