論文の概要: Bringing together invertible UNets with invertible attention modules for memory-efficient diffusion models
- arxiv url: http://arxiv.org/abs/2504.10883v1
- Date: Tue, 15 Apr 2025 05:26:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-24 04:55:50.210853
- Title: Bringing together invertible UNets with invertible attention modules for memory-efficient diffusion models
- Title(参考訳): メモリ効率拡散モデルのための可逆的注意モジュールを持つ可逆ユニセットを結合する
- Authors: Karan Jain, Mohammad Nayeem Teli,
- Abstract要約: 高次元医用データセットの拡散モデルのための1つのGPUメモリ効率トレーニングのための新しいアーキテクチャを提案する。
提案モデルは,非可逆アテンションモジュールを持つ非可逆UNetアーキテクチャを用いて構築される。
この新モデルは、多数の画像生成タスクに適用できるが、3D BraTS 2020データセットにそのメモリ効率を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have recently gained state of the art performance on many image generation tasks. However, most models require significant computational resources to achieve this. This becomes apparent in the application of medical image synthesis due to the 3D nature of medical datasets like CT-scans, MRIs, electron microscope, etc. In this paper we propose a novel architecture for a single GPU memory-efficient training for diffusion models for high dimensional medical datasets. The proposed model is built by using an invertible UNet architecture with invertible attention modules. This leads to the following two contributions: 1. denoising diffusion models and thus enabling memory usage to be independent of the dimensionality of the dataset, and 2. reducing the energy usage during training. While this new model can be applied to a multitude of image generation tasks, we showcase its memory-efficiency on the 3D BraTS2020 dataset leading to up to 15\% decrease in peak memory consumption during training with comparable results to SOTA while maintaining the image quality.
- Abstract(参考訳): 拡散モデルは、最近、多くの画像生成タスクで最先端のパフォーマンスを得た。
しかし、ほとんどのモデルはこれを達成するのにかなりの計算資源を必要とする。
これは、CTスキャン、MRI、電子顕微鏡などの医学データセットの3D性質による医用画像合成の応用において明らかになる。
本稿では,高次元医用データセットの拡散モデルのための単一のGPUメモリ効率トレーニングのための新しいアーキテクチャを提案する。
提案モデルは,非可逆アテンションモジュールを持つ非可逆UNetアーキテクチャを用いて構築される。
これは以下の2つの貢献につながります。
一 拡散モデルを通知し、メモリ使用をデータセットの寸法によらないようにし、
2. 訓練中のエネルギー使用量を減らすこと。
この新モデルは画像生成タスクに適用できるが、3D BraTS2020データセットのメモリ効率は最大15倍まで低下し、画像品質を維持しながらSOTAに匹敵する結果が得られる。
関連論文リスト
- Memory-Efficient 3D High-Resolution Medical Image Synthesis Using CRF-Guided GANs [47.873227167456136]
本稿では、条件付きランダムフィールド(CRF)を用いて依存関係をモデル化する、エンドツーエンドの新しいGANアーキテクチャを提案する。
私たちのアーキテクチャは、メモリ使用量が少なく、複雑さも少ないが、最先端のアーキテクチャよりも優れています。
論文 参考訳(メタデータ) (2025-03-13T21:31:15Z) - SegResMamba: An Efficient Architecture for 3D Medical Image Segmentation [2.979183050755201]
本稿では,SegResMambaという医用画像の効率的な3次元分割モデルを提案する。
我々のモデルは、他の最先端(SOTA)アーキテクチャと比較して、トレーニング中に半分未満のメモリを使用します。
論文 参考訳(メタデータ) (2025-03-10T18:40:28Z) - HoloDiffusion: Training a 3D Diffusion Model using 2D Images [71.1144397510333]
我々は,2次元画像のみを監督のために配置した,エンドツーエンドでトレーニング可能な新しい拡散装置を導入する。
我々の拡散モデルはスケーラブルで、頑健に訓練されており、既存の3次元生成モデルへのアプローチに対して、サンプルの品質と忠実さの点で競争力があることを示す。
論文 参考訳(メタデータ) (2023-03-29T07:35:56Z) - Memory-Efficient 3D Denoising Diffusion Models for Medical Image Processing [0.9424565541639366]
本稿では,3次元拡散モデルにおける資源消費の削減法について述べる。
本論文の主な貢献は,メモリ効率のパッチベース拡散モデルである。
提案した拡散モデルは,任意の画像生成タスクに適用できるが,BraTS 2020データセットの腫瘍セグメンテーションタスクについて評価する。
論文 参考訳(メタデータ) (2023-03-27T15:10:19Z) - Solving 3D Inverse Problems using Pre-trained 2D Diffusion Models [33.343489006271255]
拡散モデルは、高品質なサンプルを持つ新しい最先端の生成モデルとして登場した。
そこで本研究では, モデルに基づく2次元拡散を, 全次元にわたるコヒーレントな再構成を達成できるように, 実験時の残りの方向で先行する2次元拡散を拡大することを提案する。
提案手法は,1つのコモディティGPU上で動作可能であり,新しい最先端技術を確立する。
論文 参考訳(メタデータ) (2022-11-19T10:32:21Z) - GLEAM: Greedy Learning for Large-Scale Accelerated MRI Reconstruction [50.248694764703714]
アンロールされたニューラルネットワークは、最近最先端の加速MRI再構成を達成した。
これらのネットワークは、物理ベースの一貫性とニューラルネットワークベースの正規化を交互に組み合わせることで、反復最適化アルゴリズムをアンロールする。
我々は,高次元画像設定のための効率的なトレーニング戦略である加速度MRI再構成のためのグレディ・ラーニングを提案する。
論文 参考訳(メタデータ) (2022-07-18T06:01:29Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z) - Modelling the Distribution of 3D Brain MRI using a 2D Slice VAE [66.63629641650572]
本研究では,2次元スライスVAEとガウスモデルを組み合わせた3次元MR脳の体積分布をモデル化する手法を提案する。
また,本研究では,脳解剖学に適合するセグメンテーションの精度を定量的に評価する新たなボリューム評価手法を提案する。
論文 参考訳(メタデータ) (2020-07-09T13:23:15Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。