論文の概要: Encoder-Only Image Registration
- arxiv url: http://arxiv.org/abs/2509.00451v1
- Date: Sat, 30 Aug 2025 10:45:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.238374
- Title: Encoder-Only Image Registration
- Title(参考訳): Encoder-Only Image Registration
- Authors: Xiang Chen, Renjiu Hu, Jinwei Zhang, Yuxi Zhang, Xinyao Yue, Min Liu, Yaonan Wang, Hang Zhang,
- Abstract要約: 我々は,Horn-Schunck光流方程式を用いて,畳み込みニューラルネットワーク(ConvNets)が登録性能に与える影響を分析する。
本稿では,高精度かつ効率の良いトレードオフを実現するために,調和化専用画像登録(EOIR)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 34.91318675984238
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based techniques have significantly improved the accuracy and speed of deformable image registration. However, challenges such as reducing computational complexity and handling large deformations persist. To address these challenges, we analyze how convolutional neural networks (ConvNets) influence registration performance using the Horn-Schunck optical flow equation. Supported by prior studies and our empirical experiments, we observe that ConvNets play two key roles in registration: linearizing local intensities and harmonizing global contrast variations. Based on these insights, we propose the Encoder-Only Image Registration (EOIR) framework, designed to achieve a better accuracy-efficiency trade-off. EOIR separates feature learning from flow estimation, employing only a 3-layer ConvNet for feature extraction and a set of 3-layer flow estimators to construct a Laplacian feature pyramid, progressively composing diffeomorphic deformations under a large-deformation model. Results on five datasets across different modalities and anatomical regions demonstrate EOIR's effectiveness, achieving superior accuracy-efficiency and accuracy-smoothness trade-offs. With comparable accuracy, EOIR provides better efficiency and smoothness, and vice versa. The source code of EOIR will be publicly available on https://github.com/XiangChen1994/EOIR.
- Abstract(参考訳): 学習に基づく技術は、変形可能な画像登録の精度と速度を大幅に改善した。
しかし、計算複雑性の低減や大きな変形の処理といった課題は継続する。
これらの課題に対処するために、Hhorn-Schunck光流方程式を用いて畳み込みニューラルネットワーク(ConvNets)が登録性能に与える影響を分析する。
先行研究と実証実験により,ConvNetsは局所強度の線形化とグローバルコントラストの変動の調和という2つの重要な役割を担っていることが明らかとなった。
これらの知見に基づいて,より精度・効率の良いトレードオフを実現するために,Encoder-Only Image Registration (EOIR) フレームワークを提案する。
EOIRは、特徴抽出に3層ConvNetと3層フロー推定器のみを使用し、ラプラシアの特徴ピラミッドを構築し、大規模な変形モデルの下で段階的に微分同相変形を構成する。
異なるモダリティと解剖学的領域にわたる5つのデータセットの結果は、EOIRの有効性を示し、より優れた精度効率と正確さのトレードオフを実現している。
同等の精度で、EOIRはより良い効率と滑らかさを提供し、その逆も提供する。
EOIRのソースコードはhttps://github.com/XiangChen1994/EOIRで公開されている。
関連論文リスト
- Self-Supervised Learning via Flow-Guided Neural Operator on Time-Series Data [57.85958428020496]
Flow-Guided Neural Operator (FGNO)は、演算子学習とフローマッチングを組み合わせた新しいフレームワークである。
FGNOは、短時間フーリエ変換を用いて関数空間のマッピングを学習し、異なる時間分解能を統一する。
推論中にノイズのある入力を使用する以前の生成SSL法とは異なり、ノイズのある表現を学習しながら、クリーンな入力を用いて表現抽出を行う。
論文 参考訳(メタデータ) (2026-02-12T18:54:57Z) - Towards Real-world Lens Active Alignment with Unlabeled Data via Domain Adaptation [18.724828089521733]
光シミュレーション上に構築されたデジタルツインパイプラインは、大規模ラベル付きデータを生成する上で大きな利点がある。
ドメイン適応は、実世界の堅牢なパフォーマンスを持つシミュレーション訓練されたモデルを効果的に提供します。
論文 参考訳(メタデータ) (2026-01-07T09:13:20Z) - FlowLUT: Efficient Image Enhancement via Differentiable LUTs and Iterative Flow Matching [10.213645938731338]
FlowLUTは、LUTの効率性、複数プリエント、フローマッチングされた再構成画像のパラメータ非依存特性を統合する、新しいエンドツーエンドモデルである。
軽量な融合予測ネットワークは複数の3D LUT上で動作し、シーン適応色補正には$mathcalO(1)$の複雑さがある。
モデル全体は、知覚的および構造的忠実性を含む複合損失関数の下で共同最適化される。
論文 参考訳(メタデータ) (2025-09-28T03:22:01Z) - VoxelOpt: Voxel-Adaptive Message Passing for Discrete Optimization in Deformable Abdominal CT Registration [15.78340001680369]
離散最適化に基づく変形可能な画像登録フレームワークであるVoxelOptを提案する。
学習ベースの長所と反復的手法を組み合わせて、登録精度と実行時のバランスを改善する。
腹部CTの登録では、これらの変更により、VoxelOptは、ラベルの監督によって訓練された最先端の学習ベースの手法と一致しながら、効率と正確性の両方において、リード反復性を上回っている。
論文 参考訳(メタデータ) (2025-06-24T19:44:04Z) - WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - $\texttt{NePhi}$: Neural Deformation Fields for Approximately Diffeomorphic Medical Image Registration [16.388101540950295]
NePhiは変形を機能的に表現し、メモリ消費の設計空間において大きな柔軟性をもたらす。
我々は,NePhiが単一解像度の登録設定において,ボクセルに基づく表現の精度に一致することを示す。
マルチレゾリューション登録では,現在のSOTA学習ベース登録手法とインスタンス最適化の精度を一致させる。
論文 参考訳(メタデータ) (2023-09-13T21:21:50Z) - Unifying Flow, Stereo and Depth Estimation [121.54066319299261]
本稿では3つの動作と3次元知覚タスクのための統一的な定式化とモデルを提案する。
これら3つのタスクを、統一された高密度対応マッチング問題として定式化する。
我々のモデルは、モデルアーキテクチャとパラメータがタスク間で共有されているため、自然にクロスタスク転送を可能にします。
論文 参考訳(メタデータ) (2022-11-10T18:59:54Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - Adaptive Fourier Neural Operators: Efficient Token Mixers for
Transformers [55.90468016961356]
本稿では,Fourierドメインのミキシングを学習する効率的なトークンミキサーを提案する。
AFNOは、演算子学習の原則的基礎に基づいている。
65kのシーケンスサイズを処理でき、他の効率的な自己認識機構より優れている。
論文 参考訳(メタデータ) (2021-11-24T05:44:31Z) - Learning a Model-Driven Variational Network for Deformable Image
Registration [89.9830129923847]
VR-Netは、教師なしの変形可能な画像登録のための新しいカスケード可変ネットワークである。
登録精度において最先端のディープラーニング手法よりも優れています。
ディープラーニングの高速推論速度と変分モデルのデータ効率を維持している。
論文 参考訳(メタデータ) (2021-05-25T21:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。