論文の概要: Scale and Rotation Estimation of Similarity-Transformed Images via Cross-Correlation Maximization Based on Auxiliary Function Method
- arxiv url: http://arxiv.org/abs/2509.22686v1
- Date: Thu, 18 Sep 2025 03:22:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 05:29:07.788487
- Title: Scale and Rotation Estimation of Similarity-Transformed Images via Cross-Correlation Maximization Based on Auxiliary Function Method
- Title(参考訳): 補助関数法による相互相関最大化による類似度変換画像のスケールと回転推定
- Authors: Shinji Yamashita, Yuma Kinoshita, Hitoshi Kiya,
- Abstract要約: 本稿では,2つの画像間のスケールと回転を,サブピクセル精度で共同で推定できる高効率アルゴリズムを提案する。
画像アライメントは、異なる視点から撮影された画像を空間的に登録する重要なプロセスとして機能する。
- 参考スコア(独自算出の注目度): 2.192057999494216
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a highly efficient algorithm capable of jointly estimating scale and rotation between two images with sub-pixel precision. Image alignment serves as a critical process for spatially registering images captured from different viewpoints, and finds extensive use in domains such as medical imaging and computer vision. Traditional phase-correlation techniques are effective in determining translational shifts; however, they are inadequate when addressing scale and rotation changes, which often arise due to camera zooming or rotational movements. In this paper, we propose a novel algorithm that integrates scale and rotation estimation based on the Fourier transform in log-polar coordinates with a cross-correlation maximization strategy, leveraging the auxiliary function method. By incorporating sub-pixel-level cross-correlation our method enables precise estimation of both scale and rotation. Experimental results demonstrate that the proposed method achieves lower mean estimation errors for scale and rotation than conventional Fourier transform-based techniques that rely on discrete cross-correlation.
- Abstract(参考訳): 本稿では,2つの画像間のスケールと回転を,サブピクセル精度で共同で推定できる高効率アルゴリズムを提案する。
画像アライメントは、異なる視点から撮影された画像を空間的に登録するための重要なプロセスとして機能し、医療画像やコンピュータビジョンなどの領域で広く利用されている。
従来の位相相関技術は翻訳のシフトを決定するのに有効であるが、カメラのズームや回転の動きによって生じるスケールや回転の変化に対処するには不十分である。
本稿では,対数極座標におけるフーリエ変換に基づくスケールと回転推定を,補助関数法を利用して相互相関最大化戦略と統合する新しいアルゴリズムを提案する。
サブピクセルレベルのクロスコリレーションを組み込むことで,スケールと回転を正確に推定することができる。
実験により,提案手法は離散的相互相関に依存する従来のフーリエ変換法よりも,スケールと回転の平均推定誤差が低いことを示す。
関連論文リスト
- Exploring Kernel Transformations for Implicit Neural Representations [57.2225355625268]
入射神経表現(INR)は、ニューラルネットワークを利用して、対応する属性に座標をマッピングすることで、信号を表現する。
この研究は、モデル自体を変更せずに入出力のカーネル変換の効果を探求する先駆者となった。
我々の発見の副産物は、スケールとシフトを組み合わせて、INRを無視できないオーバーヘッドで著しく向上させる、単純で効果的な方法である。
論文 参考訳(メタデータ) (2025-04-07T04:43:50Z) - Verification of Geometric Robustness of Neural Networks via Piecewise Linear Approximation and Lipschitz Optimisation [57.10353686244835]
我々は、回転、スケーリング、せん断、翻訳を含む入力画像の幾何学的変換に対するニューラルネットワークの検証の問題に対処する。
提案手法は, 分枝・分枝リプシッツと組み合わせたサンプリングおよび線形近似を用いて, 画素値に対する楽音線形制約を求める。
提案手法では,既存の手法よりも最大32%の検証ケースが解決されている。
論文 参考訳(メタデータ) (2024-08-23T15:02:09Z) - Adaptive Federated Learning Over the Air [108.62635460744109]
オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。
解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文 参考訳(メタデータ) (2024-03-11T09:10:37Z) - Estimating Extreme 3D Image Rotation with Transformer Cross-Attention [13.82735766201496]
画像ペアのアクティベーションマップ間の相互アテンションを計算するために,CNN特徴マップとTransformer-Encoderを利用するクロスアテンションベースのアプローチを提案する。
一般的に使用されている画像回転データセットやベンチマークに適用した場合、現代の最先端のスキームよりも優れた性能を示すことが実験的に示されている。
論文 参考訳(メタデータ) (2023-03-05T09:07:26Z) - Motion Estimation for Large Displacements and Deformations [7.99536002595393]
粗い微細なスキームに基づく変分光学フロー技術はスパースマッチングを補間し、色、勾配、滑らかさを条件としたエネルギーモデルを局所的に最適化する。
本稿では, この問題に対処し, 大きな変位と変形に対する変動運動推定フレームワークであるHybridFlowを提案する。
論文 参考訳(メタデータ) (2022-06-24T18:53:22Z) - Data-Driven Interpolation for Super-Scarce X-Ray Computed Tomography [1.3535770763481902]
浅層ニューラルネットワークを訓練し、隣接する2つの取得を中間角度で推定された測定値に組み合わせる。
これにより、標準的な方法で再構成できる拡張された測定シーケンスが得られる。
バイオメディカルデータセットを用いた2次元および3次元イメージングの結果を得た。
論文 参考訳(メタデータ) (2022-05-16T15:42:41Z) - Dual-Flow Transformation Network for Deformable Image Registration with
Region Consistency Constraint [95.30864269428808]
現在のディープラーニング(DL)ベースの画像登録アプローチは、畳み込みニューラルネットワークを利用して、ある画像から別の画像への空間変換を学習する。
一対のイメージ内のROIの類似性を最大化する領域整合性制約を持つ新しいデュアルフロー変換ネットワークを提案する。
4つの公開3次元MRIデータセットを用いた実験により,提案手法は精度と一般化において最高の登録性能が得られることを示した。
論文 参考訳(メタデータ) (2021-12-04T05:30:44Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。