論文の概要: WaveDiT: Distribution-Aware Wavelet Flow Matching for Efficient 3D Brain MRI Synthesis
- arxiv url: http://arxiv.org/abs/2606.08670v1
- Date: Sun, 07 Jun 2026 15:21:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.371452
- Title: WaveDiT: Distribution-Aware Wavelet Flow Matching for Efficient 3D Brain MRI Synthesis
- Title(参考訳): WaveDiT: 効率的な3次元脳MRI合成のための分布認識ウェーブレットフローマッチング
- Authors: Danilo Danese, Angela Lombardi, Giuseppe Fasano, Matteo Attimonelli, Tommaso Di Noia,
- Abstract要約: 大規模な階層的バランスの取れたデータセットは、信頼できる神経画像バイオマーカーに不可欠である。
WaveDiTは、3次元ハール離散ウェーブレット変換の係数空間で動作する条件付きフローマッチングフレームワークである。
単一の現代的なGPU上で、実用的およびメモリ時間の制約の下で、フル解像度の3D合成をサポートする。
- 参考スコア(独自算出の注目度): 7.371811584771131
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large and demographically balanced datasets are essential for reliable neuroimaging biomarkers. Full-resolution 3D brain MRI synthesis can support data augmentation in this setting, but existing approaches either incur prohibitive computational cost at volumetric scale or rely on lossy latent compression that may compromise anatomical detail. As a result, practical 3D generative augmentation often requires specialized compute infrastructure. We propose WaveDiT, a conditional flow matching framework operating in the coefficient space of a 3D Haar Discrete Wavelet Transform. The model combines factorized spatio-depth attention with band-wise heteroscedastic uncertainty modeling derived from higher-order wavelet statistics. Predicted log-variance is integrated directly into both the flow objective and conditioning pathway, enabling adaptive precision consistent with the heavy-tailed and input-dependent variance structure of anatomical detail. This formulation supports full-resolution 3D synthesis under practical memory and time constraints on a single modern GPU. Evaluation on a multi-site cohort demonstrates improved alignment between generated and real MRI distributions, together with enhanced downstream brain age prediction and region-level anatomical agreement relative to diffusion, latent, and wavelet-based baselines. Code is available at https://github.com/sisinflab/WaveDiT
- Abstract(参考訳): 大規模かつ人口統計学的にバランスの取れたデータセットは、信頼できる神経画像バイオマーカーに不可欠である。
フル解像度の3D脳MRI合成は、この設定でデータ拡張をサポートすることができるが、既存のアプローチでは、ボリュームスケールでの計算コストが禁じられているか、解剖学的詳細を損なう可能性のある遅延圧縮に依存している。
結果として、実用的な3D生成拡張は、しばしば特別な計算インフラを必要とする。
本稿では,3次元離散ウェーブレット変換の係数空間で動作する条件付きフローマッチングフレームワークであるWaveDiTを提案する。
このモデルは、高次ウェーブレット統計から導かれる帯域幅の不確実性モデリングと分解されたスポース深度注意を結合する。
予測された対数分散は、フロー目標と条件付け経路の両方に直接統合され、解剖学的詳細の重み付きおよび入力依存の分散構造に整合した適応精度が実現される。
この定式化は、1つの現代的なGPU上で、実用的なメモリと時間制約の下で、フル解像度の3D合成をサポートする。
マルチサイトコホートの評価では、生成されたMRI分布と実際のMRI分布のアライメントの改善が示され、下流脳年齢予測と拡散、潜伏、ウェーブレットベースラインに対する領域レベルの解剖学的合意が強化された。
コードはhttps://github.com/sisinflab/WaveDiTで入手できる。
関連論文リスト
- Wavelet-Fusion Diffusion Model for Multimodal Brain MRI Synthesis with Modality and Metadata Conditioning [0.0]
マルチモーダルMRI(Multimodal MRI)は、異なる画像モダリティが解剖学的、組織学的、病理学的特徴を捉える神経画像解析に補完的な情報を提供する。
大規模な構造MRIリソースはますます利用可能になっているが、そのモダリティのカバレッジは、パブリックおよびプール化されたニューロイメージングデータセットで不均一であることが多い。
本研究では,Wavelet-Fusion 変分オートエンコーダ (WF-VAE) と条件付き3次元U-Net拡散モデルを組み合わせた。
論文 参考訳(メタデータ) (2026-05-30T11:57:27Z) - EPC-3D-Diff: Equivariant Physics Consistent Conditional 3D Latent Diffusion for CBCT to CT Synthesis [36.790666885042356]
CBCTからCT合成のための新しい条件付き3次元潜伏拡散フレームワークであるEPC-3D-Diffを提案する。
我々は、体積の平面内回転がその射影の角シフトに対応するという事実を利用する。
我々は,反復スキャンを含む頭部CBCT/CTファントムデータセットと,患者の賢明な分割を用いた臨床データについて検証した。
EPC-3D-Diffは、技術手法の状況と比較して、PSNRにおける+7.4 dB(ファントム)と+1.8 dB(クリニカルデータ)の大幅な改善を実現している。
論文 参考訳(メタデータ) (2026-05-19T20:34:09Z) - MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models [59.180043227905294]
MedPrunerは、3次元医用画像の効率的な理解のためのトレーニング不要でモデルに依存しない階層的トークンプレーニングフレームワークである。
我々は、MedPrunerによって、MedGemmaのようなモデルが元の性能を維持したり、超えたりすることが可能であり、ビジュアルトークンの5%以下を維持していることを示す。
論文 参考訳(メタデータ) (2026-03-12T07:37:00Z) - Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis [9.857855424798732]
本稿では,3次元MRIの統一合成のための完全性知覚を備えた潜時拡散モデルCoPeDiTを提案する。
CoPeDiTは最先端の手法よりも優れ、優れた堅牢性、一般化可能性、柔軟性を実現している。
論文 参考訳(メタデータ) (2026-02-20T18:05:39Z) - Improving 2D Diffusion Models for 3D Medical Imaging with Inter-Slice Consistent Stochasticity [47.52394044948656]
ICS(Inter-Slice Consistentity)は、拡散サンプリング中のインタースライス一貫性を促進する戦略である。
ISCSは、追加の計算コストなしで、任意の2Dトレーニングされた拡散ベースの3D再構成パイプラインにドロップすることができる。
論文 参考訳(メタデータ) (2026-02-04T02:54:08Z) - FlowLet: Conditional 3D Brain MRI Synthesis using Wavelet Flow Matching [7.371811584771131]
年齢条件付き3次元MRIを合成する条件生成フレームワークであるFlowLetを提案する。
実験により、FlowLetはサンプリングステップの少ない高忠実度ボリュームを生成することが示された。
論文 参考訳(メタデータ) (2026-01-08T18:36:29Z) - Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Accelerating 3D Photoacoustic Computed Tomography with End-to-End Physics-Aware Neural Operators [74.65171736966131]
光音響計算トモグラフィ(PACT)は、光コントラストと超音波分解能を組み合わせることで、光拡散限界を超える深部像を実現する。
現在の実装では、高密度トランスデューサアレイと長い取得時間を必要とし、臨床翻訳を制限している。
本研究では,センサ計測からボリューム再構成まで,逆音響マッピングを直接学習する物理認識モデルであるPanoを紹介する。
論文 参考訳(メタデータ) (2025-09-11T23:12:55Z) - A Skull-Adaptive Framework for AI-Based 3D Transcranial Focused Ultrasound Simulation [1.662610796043078]
経頭蓋集束超音波(TFUS)は、非侵襲的な脳刺激と治療介入の新たなモダリティである。
TFUScapesは、解剖学的に現実的な人間の頭蓋骨を通して、最初の大規模で高解像度のtFUSシミュレーションデータセットである。
DeepTFUSは、入力された3次元CTボリュームとトランスデューサ位置から直接正規化された圧力場を推定するディープラーニングモデルである。
論文 参考訳(メタデータ) (2025-05-19T11:37:51Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。