論文の概要: FractMorph: A Fractional Fourier-Based Multi-Domain Transformer for Deformable Image Registration
- arxiv url: http://arxiv.org/abs/2508.12445v1
- Date: Sun, 17 Aug 2025 17:42:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.774646
- Title: FractMorph: A Fractional Fourier-Based Multi-Domain Transformer for Deformable Image Registration
- Title(参考訳): FractMorph: 変形可能な画像登録のためのフラクショナルフーリエベースマルチドメイン変換器
- Authors: Shayan Kebriti, Shahabedin Nabavi, Ali Gooya,
- Abstract要約: クロスイメージ特徴マッチングを向上する新しい3次元デュアル並列変換器アーキテクチャであるFractMorphを提案する。
軽量なU-Netスタイルのネットワークは、変換器に富んだ特徴から密度変形場を予測する。
ACDCの心臓MRIデータセットでは、FractMorphは、全体のDice similarity Coefficient(DSC)が86.45%、平均構造当たりのDSCが75.15%、95パーセントのHausdorff(HD95)が1.54mmで、最先端のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 0.8974864761374345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deformable image registration (DIR) is a crucial and challenging technique for aligning anatomical structures in medical images and is widely applied in diverse clinical applications. However, existing approaches often struggle to capture fine-grained local deformations and large-scale global deformations simultaneously within a unified framework. We present FractMorph, a novel 3D dual-parallel transformer-based architecture that enhances cross-image feature matching through multi-domain fractional Fourier transform (FrFT) branches. Each Fractional Cross-Attention (FCA) block applies parallel FrFTs at fractional angles of 0{\deg}, 45{\deg}, 90{\deg}, along with a log-magnitude branch, to effectively extract local, semi-global, and global features at the same time. These features are fused via cross-attention between the fixed and moving image streams. A lightweight U-Net style network then predicts a dense deformation field from the transformer-enriched features. On the ACDC cardiac MRI dataset, FractMorph achieves state-of-the-art performance with an overall Dice Similarity Coefficient (DSC) of 86.45%, an average per-structure DSC of 75.15%, and a 95th-percentile Hausdorff distance (HD95) of 1.54 mm on our data split. We also introduce FractMorph-Light, a lightweight variant of our model with only 29.6M parameters, which maintains the superior accuracy of the main model while using approximately half the memory. Our results demonstrate that multi-domain spectral-spatial attention in transformers can robustly and efficiently model complex non-rigid deformations in medical images using a single end-to-end network, without the need for scenario-specific tuning or hierarchical multi-scale networks. The source code of our implementation is available at https://github.com/shayankebriti/FractMorph.
- Abstract(参考訳): 変形性画像登録(DIR)は、医用画像における解剖学的構造を整列させる重要な技術であり、多様な臨床応用に広く応用されている。
しかし、既存のアプローチはしばしば、統一されたフレームワーク内で、きめ細かい局所的な変形と大規模な大域的な変形を同時に捉えるのに苦労する。
本稿ではFractMorphを提案する。FractMorphは、FrFT(Multi-domain fractional Fourier transform)ブランチを介して、クロスイメージ特徴マッチングを強化する新しい3Dデュアル並列トランスフォーマーベースのアーキテクチャである。
各フラクショナルクロスアテンション(FCA)ブロックは、0{\deg}, 45{\deg}, 90{\deg} の分数角で平行なFrFTを対数法分岐とともに適用し、局所的、半球的、大域的特徴を同時に抽出する。
これらの機能は、固定された画像ストリームと移動中の画像ストリームの間の相互アテンションを通じて融合される。
軽量なU-Netスタイルのネットワークは、変換器に富んだ特徴から密度変形場を予測する。
ACDCの心臓MRIデータセットにおいて、FractMorphは、全体のDice similarity Coefficient (DSC)が86.45%、平均構造当たりのDSCが75.15%、95パーセントのHausdorff距離(HD95)が1.54mmという最先端のパフォーマンスを達成した。
また、FractMorph-Lightは29.6Mのパラメータしか持たない軽量なモデルであり、約半分のメモリを使用しながら、メインモデルの優れた精度を維持する。
以上の結果から,変圧器におけるマルチドメインスペクトル空間の注意は,シナリオ固有のチューニングや階層的マルチスケールネットワークを必要とせずに,単一のエンドツーエンドネットワークを用いて医療画像の複雑な非剛性変形を堅牢かつ効率的にモデル化できることが示唆された。
私たちの実装のソースコードはhttps://github.com/shayankebriti/FractMorph.comで公開されています。
関連論文リスト
- FF-PNet: A Pyramid Network Based on Feature and Field for Brain Image Registration [9.405928062479017]
特徴および変形場(FF-PNet)に基づく新しいピラミッド登録ネットワークを構築する。
粗い特徴抽出のために, 微細な画像変形のための残留特徴融合モジュール (RFFM) を設計し, 残留変形場融合モジュール (RDFFM) を提案する。
これら2つのモジュールの並列操作により、モデルは複雑な画像の変形を効果的に処理できる。
論文 参考訳(メタデータ) (2025-05-08T04:27:11Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Cascaded Cross-Attention Networks for Data-Efficient Whole-Slide Image
Classification Using Transformers [0.11219061154635457]
全スライディングイメージングは、組織標本の高解像度画像のキャプチャとデジタル化を可能にする。
高解像度情報を効果的に活用するための候補としてトランスフォーマーアーキテクチャが提案されている。
本稿では,抽出されたパッチ数と線形にスケールするクロスアテンション機構に基づく新しいカスケード型クロスアテンションネットワーク(CCAN)を提案する。
論文 参考訳(メタデータ) (2023-05-11T16:42:24Z) - HiFuse: Hierarchical Multi-Scale Feature Fusion Network for Medical
Image Classification [16.455887856811465]
本稿では,医用画像分類のためのHiFuseと呼ばれる3分岐階層型マルチスケール機能融合ネットワーク構造を提案する。
提案したISICデータセットの精度はベースラインより7.6%高く、Covid-19データセットは21.5%、Kvasirデータセットは10.4%である。
論文 参考訳(メタデータ) (2022-09-21T09:30:20Z) - BATFormer: Towards Boundary-Aware Lightweight Transformer for Efficient
Medical Image Segmentation [26.405243756778606]
本稿では,計算複雑性の低い大規模グローバルインタラクションを構築するための境界対応軽量トランス (BATFormer) を提案する。
BATFormerは、平均、右心室、心筋、左心室それぞれ92.84%、91.97%、90.26%、96.30%の成績を収めている。
論文 参考訳(メタデータ) (2022-06-29T05:37:16Z) - Adaptive Split-Fusion Transformer [90.04885335911729]
本稿では,適応重みによる畳み込みと注目の分岐を異なる方法で扱うための適応分割変換器(ASF-former)を提案する。
ImageNet-1Kのような標準ベンチマークの実験では、我々のASFフォーマーはCNN、トランスフォーマー、ハイブリッドパイロットを精度で上回っている。
論文 参考訳(メタデータ) (2022-04-26T10:00:28Z) - Automatic size and pose homogenization with spatial transformer network
to improve and accelerate pediatric segmentation [51.916106055115755]
空間変換器ネットワーク(STN)を利用することにより、ポーズとスケール不変の新たなCNNアーキテクチャを提案する。
私たちのアーキテクチャは、トレーニング中に一緒に見積もられる3つのシーケンシャルモジュールで構成されています。
腹部CTスキャナーを用いた腎および腎腫瘍の分節法について検討した。
論文 参考訳(メタデータ) (2021-07-06T14:50:03Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。