論文の概要: MedIL: Implicit Latent Spaces for Generating Heterogeneous Medical Images at Arbitrary Resolutions
- arxiv url: http://arxiv.org/abs/2504.09322v1
- Date: Sat, 12 Apr 2025 19:52:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-23 08:14:46.771346
- Title: MedIL: Implicit Latent Spaces for Generating Heterogeneous Medical Images at Arbitrary Resolutions
- Title(参考訳): MedIL: 任意解像度で不均一な医用画像を生成するための暗黙の潜伏空間
- Authors: Tyler Spears, Shen Zhu, Yinzhu Jin, Aman Shrivastava, P. Thomas Fletcher,
- Abstract要約: MedILは、異質なサイズと解像度で医療画像をエンコードするために開発された、一級のオートエンコーダである。
我々は,MedILが大規模マルチサイト・マルチレゾリューションデータセットに対して臨床的に関連性のある特徴をいかに圧縮し,保存するかを示す。
- 参考スコア(独自算出の注目度): 2.2427832125073732
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we introduce MedIL, a first-of-its-kind autoencoder built for encoding medical images with heterogeneous sizes and resolutions for image generation. Medical images are often large and heterogeneous, where fine details are of vital clinical importance. Image properties change drastically when considering acquisition equipment, patient demographics, and pathology, making realistic medical image generation challenging. Recent work in latent diffusion models (LDMs) has shown success in generating images resampled to a fixed-size. However, this is a narrow subset of the resolutions native to image acquisition, and resampling discards fine anatomical details. MedIL utilizes implicit neural representations to treat images as continuous signals, where encoding and decoding can be performed at arbitrary resolutions without prior resampling. We quantitatively and qualitatively show how MedIL compresses and preserves clinically-relevant features over large multi-site, multi-resolution datasets of both T1w brain MRIs and lung CTs. We further demonstrate how MedIL can influence the quality of images generated with a diffusion model, and discuss how MedIL can enhance generative models to resemble raw clinical acquisitions.
- Abstract(参考訳): 本研究では,医用画像の異種サイズと画像生成のための解像度を符号化する一級オートエンコーダであるMedILを紹介する。
医療画像は、しばしば大きく、異種であり、細部が重要な臨床的重要性を持つ。
画像特性は, 取得機器, 患者人口, 病理などを考えると劇的に変化し, 現実的な医用画像生成が困難になる。
遅延拡散モデル(LDMs)の最近の研究は、固定サイズに再サンプリングされた画像の生成に成功している。
しかし、これは画像取得に固有の解像度の狭いサブセットであり、微細な解剖学的詳細を捨てる再サンプリングである。
MedILは暗黙の神経表現を利用してイメージを連続的な信号として扱う。
我々は,MedILがT1w脳MRIおよび肺CTの多地点多解像度データセットに対して,臨床的に関連性のある特徴をどのように圧縮し,保存するかを定量的に,質的に示す。
さらに, 拡散モデルを用いて生成した画像の品質にMedILがどのような影響を与えるかを示すとともに, MedILが生検に類似した生成モデルをどのように拡張できるかを議論する。
関連論文リスト
- Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。
本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文 参考訳(メタデータ) (2025-04-20T01:54:18Z) - MedLoRD: A Medical Low-Resource Diffusion Model for High-Resolution 3D CT Image Synthesis [1.7026856033070354]
MedLoRDは,計算資源制約環境向けに設計された生成拡散モデルである。
MedLoRDは512$times$512$times$256までの高次元医療ボリュームを生成することができる。
冠動脈CT(Corary Computed Tomography Angiography)や肺CT(Lung Computed Tomography)データセットなど,複数のモードで評価されている。
論文 参考訳(メタデータ) (2025-03-17T14:22:49Z) - Using Synthetic Images to Augment Small Medical Image Datasets [3.7522420000453]
我々は,高解像度医用画像を生成するため,現在のGAN法であるStyleGAN2の条件変種を開発した。
6つのデータセットから合成された実画像を用いて、セマンティックセグメンテーションの下流タスクのモデルを訓練する。
生成した医用画像の品質と,この拡張がセグメンテーション性能に及ぼす影響をその後評価した。
論文 参考訳(メタデータ) (2025-03-02T17:02:11Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - 3D MedDiffusion: A 3D Medical Diffusion Model for Controllable and High-quality Medical Image Generation [47.701856217173244]
制御可能な高品質な3次元医用画像生成のための3Dメディカルディフュージョン(3Dメドディフュージョン)モデル
3D MedDiffusionは、パッチワイドエンコーディングによって医療画像を潜在空間に圧縮する、新しくて高効率なPatch-Volume Autoencoderを組み込んでいる。
3D MedDiffusion は, 再生品質において最先端の手法を超越し, スパースビューCT再構成, 高速MRI再構成, データ拡張などのタスクに強い一般化性を示すことを示す。
論文 参考訳(メタデータ) (2024-12-17T16:25:40Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - End-to-end autoencoding architecture for the simultaneous generation of
medical images and corresponding segmentation masks [3.1133049660590615]
ハミルトン変分オートエンコーダ(HVAE)に基づくエンドツーエンドアーキテクチャを提案する。
従来の変分オートエンコーダ(VAE)と比較して後部分布近似が向上する。
本手法は, 生成的逆境条件より優れ, 画像品質の向上を示す。
論文 参考訳(メタデータ) (2023-11-17T11:56:53Z) - DiffBoost: Enhancing Medical Image Segmentation via Text-Guided Diffusion Model [3.890243179348094]
医療応用のための堅牢で成功したディープラーニングモデルを開発するためには、大規模で大きな変動のある高品質なデータが不可欠である。
本稿では,DiffBoostと呼ばれる医用画像合成のための制御可能な拡散モデルを提案する。
近年の拡散確率モデルを利用して、現実的で多様な合成医用画像データを生成する。
論文 参考訳(メタデータ) (2023-10-19T16:18:02Z) - Introducing Shape Prior Module in Diffusion Model for Medical Image
Segmentation [7.7545714516743045]
拡散確率モデル(DDPM)を利用したVerseDiff-UNetというエンドツーエンドフレームワークを提案する。
我々のアプローチは拡散モデルを標準のU字型アーキテクチャに統合する。
本手法はX線画像から得られた脊椎画像の1つのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-09-12T03:05:00Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z) - Generative Adversarial U-Net for Domain-free Medical Image Augmentation [49.72048151146307]
注釈付き医用画像の不足は、医用画像コンピューティングの分野における最大の課題の1つだ。
本稿では,生成逆U-Netという新しい生成手法を提案する。
当社の新しいモデルは、ドメインフリーで、さまざまな医療画像に汎用性があります。
論文 参考訳(メタデータ) (2021-01-12T23:02:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。