論文の概要: RealKeyMorph: Keypoints in Real-world Coordinates for Resolution-agnostic Image Registration
- arxiv url: http://arxiv.org/abs/2506.10344v1
- Date: Thu, 12 Jun 2025 04:40:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.572344
- Title: RealKeyMorph: Keypoints in Real-world Coordinates for Resolution-agnostic Image Registration
- Title(参考訳): RealKeyMorph:解像度に依存しない画像登録のための実世界のコーディネートキーポイント
- Authors: Mina C. Moghadam, Alan Q. Wang, Omer Taub, Martin R. Prince, Mert R. Sabuncu,
- Abstract要約: RealKeyMorph (RKM) は画像登録の解像度に依存しない方法である。
RKMは、登録フレームワークであるKeyMorphの拡張である。
腹部MRIの2次元スタックの登録作業におけるRKMの利点と脳データセットの解像度の異なる3次元ボリュームについて述べる。
- 参考スコア(独自算出の注目度): 5.861861370040607
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Many real-world settings require registration of a pair of medical images that differ in spatial resolution, which may arise from differences in image acquisition parameters like pixel spacing, slice thickness, and field-of-view. However, all previous machine learning-based registration techniques resample images onto a fixed resolution. This is suboptimal because resampling can introduce artifacts due to interpolation. To address this, we present RealKeyMorph (RKM), a resolution-agnostic method for image registration. RKM is an extension of KeyMorph, a registration framework which works by training a network to learn corresponding keypoints for a given pair of images, after which a closed-form keypoint matching step is used to derive the transformation that aligns them. To avoid resampling and enable operating on the raw data, RKM outputs keypoints in real-world coordinates of the scanner. To do this, we leverage the affine matrix produced by the scanner (e.g., MRI machine) that encodes the mapping from voxel coordinates to real world coordinates. By transforming keypoints into real-world space and integrating this into the training process, RKM effectively enables the extracted keypoints to be resolution-agnostic. In our experiments, we demonstrate the advantages of RKM on the registration task for orthogonal 2D stacks of abdominal MRIs, as well as 3D volumes with varying resolutions in brain datasets.
- Abstract(参考訳): 多くの実世界の設定では、空間解像度が異なる一対の医療画像の登録が必要であり、これはピクセル間隔、スライス厚さ、視野などの画像取得パラメータの違いから生じる可能性がある。
しかし、これまでの機械学習ベースの登録技術はすべて、画像を固定解像度に再サンプリングした。
補間によるアーティファクトの再利用が可能であるため、これは準最適である。
そこで我々はRealKeyMorph(RKM)を提案する。
RKMはKeyMorphの拡張であり、ネットワークをトレーニングして与えられた画像の対応するキーポイントを学習し、その後、クローズドフォームのキーポイントマッチングステップを使用して、それらを整列させる変換を導出する。
サンプルの再サンプリングを回避し、生データの操作を可能にするため、RKMはスキャナの実際の座標のキーポイントを出力する。
これを実現するために,ボクセル座標から実世界座標へのマッピングを符号化するスキャナ(例えばMRI)によって生成されたアフィン行列を利用する。
キーポイントを実世界空間に変換し、これをトレーニングプロセスに統合することにより、RKMは抽出したキーポイントを分解能に依存しないものにする。
実験では, 腹部MRIの直交2次元スタックの登録作業におけるRKMの利点と, 脳データセットの解像度の異なる3次元ボリュームについて検討した。
関連論文リスト
- Keypoint Detection and Description for Raw Bayer Images [10.443350617606972]
キーポイント検出と局所的特徴記述は、ロボット知覚における基本的なタスクであり、SLAM、ロボットのローカライゼーション、特徴マッチング、ポーズ推定、および3Dマッピングのようなアプリケーションに不可欠である。
既存の手法は主にRGB画像で動作するが,画像信号処理(ISP)の必要性を回避して,生画像を直接処理する新しいネットワークを提案する。
この研究は、生画像に特化してキーポイント検出と特徴記述ネットワークを開発する最初の試みであり、リソース制約のある環境に対してより効率的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-03-11T17:54:12Z) - GlobalMamba: Global Image Serialization for Vision Mamba [73.50475621164037]
視覚マンバは、視覚トークンの数に対して線形複雑度で強い性能を示した。
既存のほとんどの方法はパッチベースの画像トークン化を採用し、因果処理のためにそれらを1Dシーケンスにフラット化する。
本稿では,グローバルな画像シリアライズ手法を提案し,その画像を因果トークンのシーケンスに変換する。
論文 参考訳(メタデータ) (2024-10-14T09:19:05Z) - Differentiable Registration of Images and LiDAR Point Clouds with
VoxelPoint-to-Pixel Matching [58.10418136917358]
カメラからの2D画像とLiDARからの3Dポイントクラウドの間のクロスモダリティ登録は、コンピュータビジョンとロボットトレーニングにおいて重要な課題である。
ニューラルネットワークで学習した点パターンと画素パターンのマッチングによる2次元3次元対応の推定
我々は、異なる潜在画素空間を介して3次元特徴を表現するために、構造化されたモダリティマッチングソルバを学習する。
論文 参考訳(メタデータ) (2023-12-07T05:46:10Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - A Robust and Interpretable Deep Learning Framework for Multi-modal
Registration via Keypoints [10.913822141584795]
ディープラーニングベースの画像登録フレームワークであるKeyMorphを紹介する。
KeyMorphは対応するキーポイントを自動的に検出する。
我々は現在の最先端手法を超越した登録精度を示す。
論文 参考訳(メタデータ) (2023-04-19T19:35:25Z) - Anatomy-aware and acquisition-agnostic joint registration with SynthMorph [6.017634371712142]
アフィン画像登録は、医用画像解析の基盤となっている。
ディープラーニング(DL)メソッドは、画像対を出力変換にマッピングする関数を学ぶ。
ほとんどのアフィン法は、ユーザが調整したい解剖学に依存しない。つまり、アルゴリズムが画像のすべての構造を考慮すれば、登録は不正確なものになる。
われわれはこれらの欠点をSynthMorphで解決する。これは高速で対称で、微分型で使い易いDLツールで、任意の脳画像の関節アフィン変形性登録を行う。
論文 参考訳(メタデータ) (2023-01-26T18:59:33Z) - Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。
事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。
実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T09:43:19Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。