論文の概要: Auto-regressive transformation for image alignment
- arxiv url: http://arxiv.org/abs/2505.04864v1
- Date: Thu, 08 May 2025 00:28:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.707046
- Title: Auto-regressive transformation for image alignment
- Title(参考訳): 画像アライメントのための自己回帰変換
- Authors: Kanggeon Lee, Soochahn Lee, Kyoung Mu Lee,
- Abstract要約: 画像アライメントのための既存の手法は、特徴領域、極大スケールと視野差、大きな変形を含む場合である。
本稿では,自己回帰フレームワーク内の粗粒度変換を反復的に推定する新しい手法である自己回帰変換(ART)を提案する。
ネットワークは各スケールでランダムにサンプリングされた点を用いて変換を洗練する。
クロスアテンション層からのガイダンスを取り入れることで、モデルは重要な領域に焦点を当て、困難で機能制限のある条件でも正確なアライメントを確保する。
- 参考スコア(独自算出の注目度): 46.12916700236777
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing methods for image alignment struggle in cases involving feature-sparse regions, extreme scale and field-of-view differences, and large deformations, often resulting in suboptimal accuracy. Robustness to these challenges improves through iterative refinement of the transformation field while focusing on critical regions in multi-scale image representations. We thus propose Auto-Regressive Transformation (ART), a novel method that iteratively estimates the coarse-to-fine transformations within an auto-regressive framework. Leveraging hierarchical multi-scale features, our network refines the transformations using randomly sampled points at each scale. By incorporating guidance from the cross-attention layer, the model focuses on critical regions, ensuring accurate alignment even in challenging, feature-limited conditions. Extensive experiments across diverse datasets demonstrate that ART significantly outperforms state-of-the-art methods, establishing it as a powerful new method for precise image alignment with broad applicability.
- Abstract(参考訳): 画像アライメントのための既存の手法は、特徴分離領域、極端なスケールと視野の違い、大きな変形を伴い、しばしば最適以下の精度をもたらす。
これらの課題に対するロバスト性は、マルチスケール画像表現における臨界領域に着目しながら、変換フィールドの反復的洗練によって改善される。
そこで我々は,自己回帰フレームワーク内の粗粒度変換を反復的に推定する新しい手法である自己回帰変換(ART)を提案する。
階層的マルチスケール機能を活用することで、ネットワークは各スケールでランダムにサンプリングされた点を用いて変換を洗練する。
クロスアテンション層からのガイダンスを取り入れることで、モデルは重要な領域に焦点を当て、困難で機能制限のある条件でも正確なアライメントを確保する。
さまざまなデータセットにわたる大規模な実験により、ARTは最先端の手法よりも大幅に優れており、幅広い適用性を備えた高精度な画像アライメントのための強力な新しい方法として確立されている。
関連論文リスト
- Feature Alignment with Equivariant Convolutions for Burst Image Super-Resolution [52.55429225242423]
本稿では,同変畳み込みに基づくアライメントを特徴とするBurst Image Super-Resolution (BISR) のための新しいフレームワークを提案する。
これにより、アライメント変換は画像領域の明示的な監督を通じて学習でき、特徴領域に容易に適用できる。
BISRベンチマークの実験は、定量的メトリクスと視覚的品質の両方において、我々のアプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2025-03-11T11:13:10Z) - Spatially-Attentive Patch-Hierarchical Network with Adaptive Sampling
for Motion Deblurring [34.751361664891235]
そこで本稿では,異なる空間領域にまたがる大きなぼやけた変化を扱うために,画素適応化と特徴注意設計を提案する。
提案手法は,最先端のデブロワーリングアルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2024-02-09T01:00:09Z) - Real-World Image Variation by Aligning Diffusion Inversion Chain [53.772004619296794]
生成した画像と実世界の画像の間にはドメインギャップがあり、これは実世界の画像の高品質なバリエーションを生成する上での課題である。
実世界画像のアライメントによる変化(RIVAL)と呼ばれる新しい推論パイプラインを提案する。
我々のパイプラインは、画像生成プロセスとソース画像の反転チェーンを整列させることにより、画像の変動の生成品質を向上させる。
論文 参考訳(メタデータ) (2023-05-30T04:09:47Z) - Image Deformation Estimation via Multi-Objective Optimization [13.159751065619544]
自由形変形モデルは、画像上の制御点格子を操作することにより、幅広い非剛体変形を表現することができる。
フィットネスランドスケープの複雑さのため,変形画像にモデルを直接適合させることは困難である。
論文 参考訳(メタデータ) (2021-06-08T06:52:12Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - Improving the generalization of network based relative pose regression:
dimension reduction as a regularizer [16.63174637692875]
最先端のビジュアルローカライゼーション手法は、RANSACフレームワーク内の幾何に基づく解法を用いてポーズ推定を行う。
エンドツーエンドの学習に基づく回帰ネットワークは、正確なピクセルレベルの対応の要求を回避するためのソリューションを提供する。
本稿では,絶対像特徴値からポーズ回帰解法を分離するために,ネットワーク内に学習可能なマッチング層を明示的に追加する。
我々はこの次元正規化戦略を2層ピラミッドベースのフレームワークで実装し、局所化結果を粗いものから細かいものへと回帰する。
論文 参考訳(メタデータ) (2020-10-24T06:20:46Z) - Transformation Consistency Regularization- A Semi-Supervised Paradigm
for Image-to-Image Translation [18.870983535180457]
本稿では,画像から画像への変換において,より困難な状況に陥るトランスフォーメーション一貫性の規則化を提案する。
我々は,画像の着色,分解,超解像の3つの異なる応用に対して,アルゴリズムの有効性を評価する。
提案手法はデータ効率が著しく向上し,画像再構成を行うにはラベル付きサンプルの約10~20%しか必要としない。
論文 参考訳(メタデータ) (2020-07-15T17:41:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。