論文の概要: CARL: A Framework for Equivariant Image Registration
- arxiv url: http://arxiv.org/abs/2405.16738v1
- Date: Mon, 27 May 2024 01:06:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-28 19:25:57.226759
- Title: CARL: A Framework for Equivariant Image Registration
- Title(参考訳): CARL: 同種画像登録のためのフレームワーク
- Authors: Hastings Greer, Lin Tian, Francois-Xavier Vialard, Roland Kwitt, Raul San Jose Estepar, Marc Niethammer,
- Abstract要約: 画像登録は、一対の画像間の空間対応を推定する。
形式的には、推定子は所望の画像変換のクラスに同値であるべきである。
本稿では,多段階$[W,U]$等分散を座標アテンション機構と変位予測層を併用して実現する方法を示す。
- 参考スコア(独自算出の注目度): 17.976933318883333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image registration estimates spatial correspondences between a pair of images. These estimates are typically obtained via numerical optimization or regression by a deep network. A desirable property of such estimators is that a correspondence estimate (e.g., the true oracle correspondence) for an image pair is maintained under deformations of the input images. Formally, the estimator should be equivariant to a desired class of image transformations. In this work, we present careful analyses of the desired equivariance properties in the context of multi-step deep registration networks. Based on these analyses we 1) introduce the notions of $[U,U]$ equivariance (network equivariance to the same deformations of the input images) and $[W,U]$ equivariance (where input images can undergo different deformations); we 2) show that in a suitable multi-step registration setup it is sufficient for overall $[W,U]$ equivariance if the first step has $[W,U]$ equivariance and all others have $[U,U]$ equivariance; we 3) show that common displacement-predicting networks only exhibit $[U,U]$ equivariance to translations instead of the more powerful $[W,U]$ equivariance; and we 4) show how to achieve multi-step $[W,U]$ equivariance via a coordinate-attention mechanism combined with displacement-predicting refinement layers (CARL). Overall, our approach obtains excellent practical registration performance on several 3D medical image registration tasks and outperforms existing unsupervised approaches for the challenging problem of abdomen registration.
- Abstract(参考訳): 画像登録は、一対の画像間の空間対応を推定する。
これらの推定は一般にディープネットワークによる数値最適化や回帰によって得られる。
このような推定器の望ましい特性は、入力画像の変形の下で、画像対に対する対応推定(例えば、真のオラクル対応)を維持することである。
形式的には、推定子は所望の画像変換のクラスに同値であるべきである。
本研究では,多段階深層登録網の文脈における所望の等価性について慎重に分析する。
これらの分析に基づく。
1)$[U,U]$同値(入力画像の同じ変形に対するネットワーク同値)と$[W,U]$同値(入力画像が異なる変形を行うことができる場合)の概念を導入する。
2) 適度な多段階登録設定において、第1段階が$[W,U]$同値であり、他のすべてのステップが$[U,U]$同値である場合、全体的な$[W,U]$同値に対して十分であることを示す。
3) 共通の変位予測ネットワークは、より強力な$[W,U]$同値ではなく、翻訳に対して$[U,U]$同値しか示さないことを示す。
4) 多段階$[W,U]$等分を座標アテンション機構と変位予測精錬層(CARL)を組み合わせて達成する方法を示す。
提案手法は,複数の3次元医用画像登録タスクにおいて優れた実用的登録性能を達成し,腹部登録の課題に対して既存の教師なしアプローチよりも優れていた。
関連論文リスト
- $SE(3)$ Equivariant Ray Embeddings for Implicit Multi-View Depth Estimation [45.26823569257832]
本稿では,同変多視点学習の深度推定への応用について検討する。
位置符号化には球高調波を用い、3次元回転同値性を確保する。
我々はPerceiver IOアーキテクチャ内で、特殊同変エンコーダとデコーダを開発する。
論文 参考訳(メタデータ) (2024-11-11T19:34:47Z) - Relaxed Equivariance via Multitask Learning [7.905957228045955]
マルチタスク学習と等価性を近似するトレーニング手法であるREMULを紹介する。
制約のないモデルは、追加の単純な等分散損失を最小化することにより、近似対称性を学習できることが示される。
提案手法は, 等変ベースラインと比較して, 推論時の10倍, トレーニング時の2.5倍の速さで, 競争性能が向上する。
論文 参考訳(メタデータ) (2024-10-23T13:50:27Z) - Approximately Piecewise E(3) Equivariant Point Networks [30.619367345806438]
本稿では,近似的ピースワイズ-$E(3)$等変点ネットワークを構築するためのフレームワークであるAPENを紹介する。
第一の洞察は、より微細な分割に関して同値な関数もまた真の分割に関して同値を維持することである。
本稿では,パートベース対称性を示す2つのデータ型を用いたAPENの有効性を示す。
論文 参考訳(メタデータ) (2024-02-13T15:34:39Z) - Improving Equivariance in State-of-the-Art Supervised Depth and Normal
Predictors [29.562054614079788]
最先端の深度と正規の予測器は、性能が強いにもかかわらず、驚くほど同値ではないことがわかった。
これを改善するために,平均化手順と自己整合性損失からなる同変正則化手法を提案する。
我々のアプローチはCNNとTransformerアーキテクチャの両方に適用でき、テスト中に余分なコストがかからず、教師付きおよび半教師付き学習性能が向上する。
論文 参考訳(メタデータ) (2023-09-28T17:51:05Z) - Transformers as Support Vector Machines [54.642793677472724]
自己アテンションの最適化幾何と厳密なSVM問題との間には,形式的等価性を確立する。
勾配降下に最適化された1層変圧器の暗黙バイアスを特徴付ける。
これらの発見は、最適なトークンを分離し選択するSVMの階層としてのトランスフォーマーの解釈を刺激していると信じている。
論文 参考訳(メタデータ) (2023-08-31T17:57:50Z) - Equivariant Similarity for Vision-Language Foundation Models [134.77524524140168]
本研究は、主要な訓練目的だけでなく、下流タスクをサポートするためのコアデリバリであるマルチモーダル類似性関数に焦点を当てる。
一致した2組のトレーニングペアから効率よく計算できる正規化損失であるEqSimを提案する。
既存の評価セットと比較すると、EqBenは"視覚的最小限の変化"に最初に焦点を当てている。
論文 参考訳(メタデータ) (2023-03-25T13:22:56Z) - The Lie Derivative for Measuring Learned Equivariance [84.29366874540217]
我々は、CNN、トランスフォーマー、ミキサーアーキテクチャにまたがる数百の事前訓練されたモデルの同値性について検討する。
その結果,不等式違反の多くは,不等式などのユビキタスネットワーク層における空間エイリアスに関連付けられることがわかった。
例えば、トランスはトレーニング後の畳み込みニューラルネットワークよりも同種である。
論文 参考訳(メタデータ) (2022-10-06T15:20:55Z) - Equivariance Discovery by Learned Parameter-Sharing [153.41877129746223]
データから解釈可能な等価性を発見する方法について検討する。
具体的には、モデルのパラメータ共有方式に対する最適化問題として、この発見プロセスを定式化する。
また,ガウスデータの手法を理論的に解析し,研究された発見スキームとオラクルスキームの間の平均2乗ギャップを限定する。
論文 参考訳(メタデータ) (2022-04-07T17:59:19Z) - PDO-eConvs: Partial Differential Operator Based Equivariant Convolutions [71.60219086238254]
我々は、畳み込みと偏微分作用素(PDO)の接続から問題に対処する。
実装において、ほぼ同変の畳み込み(PDO-eConvs)を導出し、PDOの数値スキームを用いてシステムを識別する。
回転したMNISTと自然画像分類の実験により、PDO-eConvsは競合的に機能するが、より効率的にパラメータを使用することが示された。
論文 参考訳(メタデータ) (2020-07-20T18:57:26Z) - Relative Pose Estimation of Calibrated Cameras with Known
$\mathrm{SE}(3)$ Invariants [65.2314683780204]
既知の$mathrmSE(3)$不変量で制約されたカメラの相対ポーズ推定問題について完全な研究を行う。
これらの問題は、相対的なポーズ推定のための点対の最小数を減少させる。
合成データと実データを用いた実験では,従来の相対ポーズ推定法と比較して性能が向上した。
論文 参考訳(メタデータ) (2020-07-15T13:55:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。