論文の概要: Encoder-Only Image Registration
- arxiv url: http://arxiv.org/abs/2509.00451v1
- Date: Sat, 30 Aug 2025 10:45:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.238374
- Title: Encoder-Only Image Registration
- Title(参考訳): Encoder-Only Image Registration
- Authors: Xiang Chen, Renjiu Hu, Jinwei Zhang, Yuxi Zhang, Xinyao Yue, Min Liu, Yaonan Wang, Hang Zhang,
- Abstract要約: 我々は,Horn-Schunck光流方程式を用いて,畳み込みニューラルネットワーク(ConvNets)が登録性能に与える影響を分析する。
本稿では,高精度かつ効率の良いトレードオフを実現するために,調和化専用画像登録(EOIR)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 34.91318675984238
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based techniques have significantly improved the accuracy and speed of deformable image registration. However, challenges such as reducing computational complexity and handling large deformations persist. To address these challenges, we analyze how convolutional neural networks (ConvNets) influence registration performance using the Horn-Schunck optical flow equation. Supported by prior studies and our empirical experiments, we observe that ConvNets play two key roles in registration: linearizing local intensities and harmonizing global contrast variations. Based on these insights, we propose the Encoder-Only Image Registration (EOIR) framework, designed to achieve a better accuracy-efficiency trade-off. EOIR separates feature learning from flow estimation, employing only a 3-layer ConvNet for feature extraction and a set of 3-layer flow estimators to construct a Laplacian feature pyramid, progressively composing diffeomorphic deformations under a large-deformation model. Results on five datasets across different modalities and anatomical regions demonstrate EOIR's effectiveness, achieving superior accuracy-efficiency and accuracy-smoothness trade-offs. With comparable accuracy, EOIR provides better efficiency and smoothness, and vice versa. The source code of EOIR will be publicly available on https://github.com/XiangChen1994/EOIR.
- Abstract(参考訳): 学習に基づく技術は、変形可能な画像登録の精度と速度を大幅に改善した。
しかし、計算複雑性の低減や大きな変形の処理といった課題は継続する。
これらの課題に対処するために、Hhorn-Schunck光流方程式を用いて畳み込みニューラルネットワーク(ConvNets)が登録性能に与える影響を分析する。
先行研究と実証実験により,ConvNetsは局所強度の線形化とグローバルコントラストの変動の調和という2つの重要な役割を担っていることが明らかとなった。
これらの知見に基づいて,より精度・効率の良いトレードオフを実現するために,Encoder-Only Image Registration (EOIR) フレームワークを提案する。
EOIRは、特徴抽出に3層ConvNetと3層フロー推定器のみを使用し、ラプラシアの特徴ピラミッドを構築し、大規模な変形モデルの下で段階的に微分同相変形を構成する。
異なるモダリティと解剖学的領域にわたる5つのデータセットの結果は、EOIRの有効性を示し、より優れた精度効率と正確さのトレードオフを実現している。
同等の精度で、EOIRはより良い効率と滑らかさを提供し、その逆も提供する。
EOIRのソースコードはhttps://github.com/XiangChen1994/EOIRで公開されている。
関連論文リスト
- VoxelOpt: Voxel-Adaptive Message Passing for Discrete Optimization in Deformable Abdominal CT Registration [15.78340001680369]
離散最適化に基づく変形可能な画像登録フレームワークであるVoxelOptを提案する。
学習ベースの長所と反復的手法を組み合わせて、登録精度と実行時のバランスを改善する。
腹部CTの登録では、これらの変更により、VoxelOptは、ラベルの監督によって訓練された最先端の学習ベースの手法と一致しながら、効率と正確性の両方において、リード反復性を上回っている。
論文 参考訳(メタデータ) (2025-06-24T19:44:04Z) - WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - $\texttt{NePhi}$: Neural Deformation Fields for Approximately Diffeomorphic Medical Image Registration [16.388101540950295]
NePhiは変形を機能的に表現し、メモリ消費の設計空間において大きな柔軟性をもたらす。
我々は,NePhiが単一解像度の登録設定において,ボクセルに基づく表現の精度に一致することを示す。
マルチレゾリューション登録では,現在のSOTA学習ベース登録手法とインスタンス最適化の精度を一致させる。
論文 参考訳(メタデータ) (2023-09-13T21:21:50Z) - Unifying Flow, Stereo and Depth Estimation [121.54066319299261]
本稿では3つの動作と3次元知覚タスクのための統一的な定式化とモデルを提案する。
これら3つのタスクを、統一された高密度対応マッチング問題として定式化する。
我々のモデルは、モデルアーキテクチャとパラメータがタスク間で共有されているため、自然にクロスタスク転送を可能にします。
論文 参考訳(メタデータ) (2022-11-10T18:59:54Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - Adaptive Fourier Neural Operators: Efficient Token Mixers for
Transformers [55.90468016961356]
本稿では,Fourierドメインのミキシングを学習する効率的なトークンミキサーを提案する。
AFNOは、演算子学習の原則的基礎に基づいている。
65kのシーケンスサイズを処理でき、他の効率的な自己認識機構より優れている。
論文 参考訳(メタデータ) (2021-11-24T05:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。