論文の概要: Fourier-Net: Fast Image Registration with Band-limited Deformation
- arxiv url: http://arxiv.org/abs/2211.16342v1
- Date: Tue, 29 Nov 2022 16:24:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 16:49:56.132090
- Title: Fourier-Net: Fast Image Registration with Band-limited Deformation
- Title(参考訳): Fourier-Net:バンド制限変形による高速画像登録
- Authors: Xi Jia, Joseph Bartlett, Wei Chen, Siyang Song, Tianyang Zhang,
Xinxing Cheng, Wenqi Lu, Zhaowen Qiu, Jinming Duan
- Abstract要約: 教師なし画像登録では、全解像度空間領域における密度変位場を予測するためにU-Netスタイルのネットワークが一般的である。
本稿では,パラメータフリーモデル駆動デコーダを用いて,U-Netスタイルネットワークにおける拡張パスを置き換えるフーリエネットを提案する。
- 参考スコア(独自算出の注目度): 16.894559169947055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised image registration commonly adopts U-Net style networks to
predict dense displacement fields in the full-resolution spatial domain. For
high-resolution volumetric image data, this process is however resource
intensive and time-consuming. To tackle this problem, we propose the
Fourier-Net, replacing the expansive path in a U-Net style network with a
parameter-free model-driven decoder. Specifically, instead of our Fourier-Net
learning to output a full-resolution displacement field in the spatial domain,
we learn its low-dimensional representation in a band-limited Fourier domain.
This representation is then decoded by our devised model-driven decoder
(consisting of a zero padding layer and an inverse discrete Fourier transform
layer) to the dense, full-resolution displacement field in the spatial domain.
These changes allow our unsupervised Fourier-Net to contain fewer parameters
and computational operations, resulting in faster inference speeds. Fourier-Net
is then evaluated on two public 3D brain datasets against various
state-of-the-art approaches. For example, when compared to a recent
transformer-based method, i.e., TransMorph, our Fourier-Net, only using
0.22$\%$ of its parameters and 6.66$\%$ of the mult-adds, achieves a 0.6\%
higher Dice score and an 11.48$\times$ faster inference speed. Code is
available at \url{https://github.com/xi-jia/Fourier-Net}.
- Abstract(参考訳): 教師なし画像登録では、全解像度空間領域における密度変位場を予測するためにU-Netスタイルのネットワークが一般的である。
高解像度のボリューム画像データの場合、このプロセスはリソース集約的で時間を要する。
そこで本研究では,u-net方式ネットワークにおける拡張パスをパラメータフリーモデル駆動デコーダに置き換え,フーリエネットを提案する。
具体的には,空間領域内のフルレゾリューション変位場を出力するフーリエネット学習の代わりに,その低次元表現を帯域制限フーリエ領域で学習する。
この表現は、我々が考案したモデル駆動デコーダ(ゼロパディング層と逆離散フーリエ変換層)によって空間領域内の密度の高い全解像度変位場にデコードされる。
これらの変更により、教師なしのfourier-netは、パラメータと計算操作が少なくなり、推論速度が速くなります。
fourier-netは、さまざまな最先端のアプローチに対して、2つの公開3d脳データセットで評価される。
例えば、最近の変換器ベースの手法であるTransMorphと比較して、我々のフーリエネットはパラメータの0.22$\%とmult-addsの6.66$\%しか使用せず、Diceスコアが0.6\%、推論速度が11.48$\times$である。
コードは \url{https://github.com/xi-jia/fourier-net} で入手できる。
関連論文リスト
- WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - FourierMamba: Fourier Learning Integration with State Space Models for Image Deraining [71.46369218331215]
Image derainingは雨が降る画像から雨の跡を取り除き、透明な背景を復元することを目的としている。
本稿では,FourierMambaという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-29T18:58:59Z) - Fourier-Net+: Leveraging Band-Limited Representation for Efficient 3D
Medical Image Registration [62.53130123397081]
U-Netスタイルのネットワークは、高密度変位場を予測するために、教師なし画像登録に一般的に利用される。
まず,コストのかかるU-Netスタイルの拡張パスをパラメータフリーモデル駆動デコーダに置き換えるFourier-Netを提案する。
次に、Fourier-Net+を導入し、さらに画像の帯域制限空間表現を入力とし、U-Netスタイルのネットワークの収縮経路における畳み込み層の数を減少させる。
論文 参考訳(メタデータ) (2023-07-06T13:57:12Z) - Neural Fourier Filter Bank [18.52741992605852]
本稿では, 効率的かつ高精度な再構築手法を提案する。
ウェーブレットにインスパイアされた我々は、信号が空間的にも周波数的にも分解されるニューラルネットワークを学習する。
論文 参考訳(メタデータ) (2022-12-04T03:45:08Z) - Deep Fourier Up-Sampling [100.59885545206744]
フーリエ領域のアップサンプリングは、そのような局所的な性質に従わないため、より難しい。
これらの問題を解決するために理論的に健全なDeep Fourier Up-Sampling (FourierUp)を提案する。
論文 参考訳(メタデータ) (2022-10-11T06:17:31Z) - Fourier Disentangled Space-Time Attention for Aerial Video Recognition [54.80846279175762]
本稿では,UAVビデオ行動認識のためのFAR(Fourier Activity Recognition)アルゴリズムを提案する。
我々の定式化は、人間のエージェントを背景から自然に分離するために、新しいフーリエオブジェクト・ディコンタングルメント法を用いています。
我々はUAV Human RGB、UAV Human Night、Drone Action、NEC Droneを含む複数のUAVデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2022-03-21T01:24:53Z) - Seeing Implicit Neural Representations as Fourier Series [13.216389226310987]
Inlicit Neural Representation (INR)は低次元問題領域における高周波関数を表現するために多層パーセプトロンを使用する。
これらの表現は、複雑な3Dオブジェクトやシーンに関連するタスクについて、最先端の結果を得た。
この研究は2つの方法間の接続を分析し、フーリエ写像されたパーセプトロンが構造的に1つの隠蔽層SIRENと似ていることを示す。
論文 参考訳(メタデータ) (2021-09-01T08:40:20Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - Fourier Image Transformer [10.315102237565734]
自動回帰画像補完タスクは,低解像度入力による高分解能出力の予測と同等であることを示した。
CT(Computerd Tomography)画像再構成の文脈において,本手法の有用性を示す。
論文 参考訳(メタデータ) (2021-04-06T14:48:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。