論文の概要: Multimodal Image Matching based on Frequency-domain Information of Local Energy Response
- arxiv url: http://arxiv.org/abs/2503.20827v1
- Date: Wed, 26 Mar 2025 02:12:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:52:56.082867
- Title: Multimodal Image Matching based on Frequency-domain Information of Local Energy Response
- Title(参考訳): 局所エネルギー応答の周波数領域情報に基づくマルチモーダル画像マッチング
- Authors: Meng Yang, Jun Chen, Wenping Gong, Longsheng Wei, Xin Tian,
- Abstract要約: 複雑な非線形強度差、非線形局所幾何学的歪み、ノイズ、回転変換はマルチモーダル画像マッチングの主要な課題である。
FILERと呼ばれる局所エネルギー応答の周波数領域情報に基づく手法を提案する。
FILERは他の最先端アルゴリズムよりも優れ、堅牢性と堅牢性が高いことを示す。
- 参考スコア(独自算出の注目度): 13.23135346395644
- License:
- Abstract: Complicated nonlinear intensity differences, nonlinear local geometric distortions, noises and rotation transformation are main challenges in multimodal image matching. In order to solve these problems, we propose a method based on Frequency-domain Information of Local Energy Response called FILER. The core of FILER is the local energy response model based on frequency-domain information, which can overcome the effect of nonlinear intensity differences. To improve the robustness to local nonlinear geometric distortions and noises, we design a new edge structure enhanced feature detector and convolutional feature weighted descriptor, respectively. In addition, FILER overcomes the sensitivity of the frequency-domain information to the rotation angle and achieves rotation invariance. Extensive experiments multimodal image pairs show that FILER outperforms other state-of-the-art algorithms and has good robustness and universality.
- Abstract(参考訳): 複雑な非線形強度差、非線形局所幾何学的歪み、ノイズ、回転変換はマルチモーダル画像マッチングの主要な課題である。
これらの問題を解決するために、FILERと呼ばれる局所エネルギー応答の周波数領域情報に基づく手法を提案する。
FILERの中核は周波数領域情報に基づく局所エネルギー応答モデルであり、非線形強度差の影響を克服することができる。
局所非線形幾何歪みと雑音に対するロバスト性を改善するため,新しいエッジ構造拡張特徴検出器と畳み込み特徴重み付きディスクリプタを設計した。
さらに、FILERは周波数領域情報の回転角に対する感度を克服し、回転不変性を実現する。
大規模なマルチモーダル画像ペア実験により、FILERは他の最先端アルゴリズムよりも優れ、堅牢性と普遍性に優れることが示された。
関連論文リスト
- MAP Image Recovery with Guarantees using Locally Convex Multi-Scale Energy (LC-MUSE) Model [12.218356507147583]
データ多様体の周囲の局所的に強く凸したマルチスケールの深部エネルギーモデルを提案する。
画像に基づく逆問題では学習エネルギーモデルを使用し、定式化はいくつかの望ましい性質を提供する。
並列磁気共鳴(MR)画像再構成の文脈において,提案手法は最先端の凸正則化器よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2025-02-05T16:00:55Z) - RLE: A Unified Perspective of Data Augmentation for Cross-Spectral Re-identification [59.5042031913258]
非線型モダリティの相違は主に、異なる材料の表面に作用する様々な線形変換に由来する。
本稿では,MRLE(Modrate Random Linear Enhancement)とRRLE(Radical Random Linear Enhancement)を含むRLE(Random Linear Enhancement)戦略を提案する。
実験結果は、RLEの優位性と有効性を示すだけでなく、クロススペクトル再同定のための汎用データ拡張としての可能性も確認した。
論文 参考訳(メタデータ) (2024-11-02T12:13:37Z) - Beyond Position: the emergence of wavelet-like properties in Transformers [7.3645788720974465]
本稿では, ロータリー位置埋め込み(RoPE)の理論的限界を効果的に補償する頑健なウェーブレット様特性をトランスフォーマーモデルがいかに発展させるかを検討する。
本研究では,ウェーブレット変換に類似したマルチレゾリューション処理を実装するために,注目ヘッドが自然に進化することを示す。
論文 参考訳(メタデータ) (2024-10-23T17:48:28Z) - FreqINR: Frequency Consistency for Implicit Neural Representation with Adaptive DCT Frequency Loss [5.349799154834945]
本稿では、新しい任意スケール超解像法であるFreqINR(FreqINR)について述べる。
トレーニングでは,適応離散コサイン変換周波数損失(adaptive Discrete Cosine Transform Frequency Loss,ADFL)を用いて,HR画像と地絡画像の周波数ギャップを最小化する。
推論の際には,低分解能(LR)画像と地軸画像のスペクトルコヒーレンスを維持するために受容場を拡張した。
論文 参考訳(メタデータ) (2024-08-25T03:53:17Z) - NeuRBF: A Neural Fields Representation with Adaptive Radial Basis
Functions [93.02515761070201]
本稿では,信号表現に一般放射状基底を用いる新しいタイプのニューラルネットワークを提案する。
提案手法は, 空間適応性が高く, ターゲット信号により密着可能な, フレキシブルなカーネル位置と形状を持つ一般ラジアルベース上に構築する。
ニューラルラジアンス場再構成に適用した場合,本手法はモデルサイズが小さく,訓練速度が同等である最先端のレンダリング品質を実現する。
論文 参考訳(メタデータ) (2023-09-27T06:32:05Z) - Exploring Invariant Representation for Visible-Infrared Person
Re-Identification [77.06940947765406]
異なるスペクトルを横断する歩行者にアイデンティティを関連付けることを目的とした、クロススペクトルの人物再識別は、モダリティの相違の主な課題に直面している。
本稿では、ロバスト機能マイニングネットワーク(RFM)と呼ばれるエンドツーエンドのハイブリッド学習フレームワークにおいて、画像レベルと特徴レベルの両方の問題に対処する。
RegDBとSYSU-MM01という2つの標準的なクロススペクトル人物識別データセットの実験結果により,最先端の性能が示された。
論文 参考訳(メタデータ) (2023-02-02T05:24:50Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - Multi-scale data reconstruction of turbulent rotating flows with Gappy
POD, Extended POD and Generative Adversarial Networks [2.0722840259036546]
本研究では, 回転する乱流スナップショットを空間的損傷(塗装)で再構成するために, 線形および非線形ツールを用いた。
統計的特性と瞬時速度場の両方を正確に再現することに注力する。
意外なことに、ポイントワイド再構成に関して、非線形GANは線形POD技術よりも優れていない。
論文 参考訳(メタデータ) (2022-10-21T12:44:39Z) - Amplitude-Phase Recombination: Rethinking Robustness of Convolutional
Neural Networks in Frequency Domain [31.182376196295365]
CNNは、トレーニング画像の高周波成分と密接に関連する局所最適値に収束する傾向にある。
現在の画像の位相スペクトルとイントラクタ画像の振幅スペクトルを再結合して設計されたデータ拡張に関する新しい視点。
論文 参考訳(メタデータ) (2021-08-19T04:04:41Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。