論文の概要: LatentFM: A Latent Flow Matching Approach for Generative Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2512.04821v1
- Date: Thu, 04 Dec 2025 14:06:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.203598
- Title: LatentFM: A Latent Flow Matching Approach for Generative Medical Image Segmentation
- Title(参考訳): LatentFM: 医用画像生成のための潜時流マッチング手法
- Authors: Huynh Trinh Ngoc, Hoang Anh Nguyen Kim, Toan Nguyen Hai, Long Tran Quoc,
- Abstract要約: 医用画像セグメンテーションのためのフローベースモデルであるLatentFMを提案する。
複数の潜在表現をサンプリングすることにより,多様なセグメンテーション出力を合成する。
提案手法は,潜在空間において高い効率を保ちながら,より優れたセグメンテーション精度を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative models have achieved remarkable progress with the emergence of flow matching (FM). It has demonstrated strong generative capabilities and attracted significant attention as a simulation-free flow-based framework capable of learning exact data densities. Motivated by these advances, we propose LatentFM, a flow-based model operating in the latent space for medical image segmentation. To model the data distribution, we first design two variational autoencoders (VAEs) to encode both medical images and their corresponding masks into a lower-dimensional latent space. We then estimate a conditional velocity field that guides the flow based on the input image. By sampling multiple latent representations, our method synthesizes diverse segmentation outputs whose pixel-wise variance reliably captures the underlying data distribution, enabling both highly accurate and uncertainty-aware predictions. Furthermore, we generate confidence maps that quantify the model certainty, providing clinicians with richer information for deeper analysis. We conduct experiments on two datasets, ISIC-2018 and CVC-Clinic, and compare our method with several prior baselines, including both deterministic and generative approach models. Through comprehensive evaluations, both qualitative and quantitative results show that our approach achieves superior segmentation accuracy while remaining highly efficient in the latent space.
- Abstract(参考訳): 生成モデルは、フローマッチング(FM)の出現によって顕著な進歩を遂げた。
強力な生成能力を示し、正確なデータ密度を学習できるシミュレーション不要なフローベースフレームワークとして大きな注目を集めている。
これらの進歩を動機として,医療画像セグメント化のためのフローベースモデルであるLatentFMを提案する。
データ分散をモデル化するために、まず2つの変分オートエンコーダ(VAE)を設計し、医療画像とそれに対応するマスクの両方を低次元の潜在空間に符号化する。
次に,入力画像に基づいて流れを誘導する条件速度場を推定する。
複数の潜在表現をサンプリングすることにより,画素幅のばらつきが基礎となるデータ分布を確実に捕捉し,高精度かつ不確実性を考慮した予測を可能にする,多様なセグメンテーション出力を合成する。
さらに、モデル確実性を定量化する信頼マップを生成し、より深い分析を行うためのリッチな情報を提供する。
我々はISIC-2018とCVC-Clinicの2つのデータセットで実験を行い、決定論的および生成的アプローチモデルを含むいくつかの事前ベースラインと比較した。
総合的な評価を通じて,定性的かつ定量的な結果から,本手法は潜在空間において高い効率を保ちながら,より優れたセグメンテーション精度を達成できることを示す。
関連論文リスト
- Efficient Flow Matching using Latent Variables [9.363347684114474]
我々は、texttLatent-CFM$は、最先端のフローマッチングモデルよりも、トレーニングや計算が大幅に少ないため、生成品質が向上していることを示す。
また、物理過程から生じる空間場の生成的モデリングについても検討する。
論文 参考訳(メタデータ) (2025-05-07T14:59:23Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - FlowSDF: Flow Matching for Medical Image Segmentation Using Distance Transforms [60.195642571004804]
本稿では,セグメンテーションマスクの暗黙分布を表現するために,画像誘導型条件付きフローマッチングフレームワークであるFlowSDFを紹介する。
本フレームワークは,セグメンテーションマスクの正確なサンプリングと関連する統計指標の計算を可能にする。
論文 参考訳(メタデータ) (2024-05-28T11:47:12Z) - Cross-model Mutual Learning for Exemplar-based Medical Image Segmentation [25.874281336821685]
Exemplar-based Medical Image(CMEMS)のためのクロスモデル相互学習フレームワーク
外来医用画像のためのクロスモデル相互学習フレームワーク(CMEMS)について紹介する。
論文 参考訳(メタデータ) (2024-04-18T00:18:07Z) - DiffBoost: Enhancing Medical Image Segmentation via Text-Guided Diffusion Model [3.890243179348094]
医療応用のための堅牢で成功したディープラーニングモデルを開発するためには、大規模で大きな変動のある高品質なデータが不可欠である。
本稿では,DiffBoostと呼ばれる医用画像合成のための制御可能な拡散モデルを提案する。
近年の拡散確率モデルを利用して、現実的で多様な合成医用画像データを生成する。
論文 参考訳(メタデータ) (2023-10-19T16:18:02Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation [41.608617301275935]
医療用ボリュームセグメンテーションのための新しいエンドツーエンドフレームワークDiff-UNetを提案する。
提案手法では,拡散モデルを標準U字型アーキテクチャに統合し,入力ボリュームから意味情報を効率的に抽出する。
われわれは,MRI,肝腫瘍,多臓器CTの3種類の脳腫瘍について検討した。
論文 参考訳(メタデータ) (2023-03-18T04:06:18Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。