論文の概要: RIFT2: Speeding-up RIFT with A New Rotation-Invariance Technique
- arxiv url: http://arxiv.org/abs/2303.00319v1
- Date: Wed, 1 Mar 2023 08:32:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-02 15:34:51.448551
- Title: RIFT2: Speeding-up RIFT with A New Rotation-Invariance Technique
- Title(参考訳): RIFT2:回転不変技術を用いた高速化RIFT
- Authors: Jiayuan Li, Pengcheng Shi, Qingwu Hu, and Yongjun Zhang
- Abstract要約: マルチモーダル画像マッチングは,マルチソース画像情報融合のための重要な前提条件である。
本稿では,RIFT2と呼ばれる改良された放射偏光感応性特徴変換法を提案する。
RIFT2 は RIFT と同等の性能を持つと同時に、より高速で、メモリ消費も少ない。
- 参考スコア(独自算出の注目度): 8.65905433949223
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal image matching is an important prerequisite for multisource image
information fusion. Compared with the traditional matching problem, multimodal
feature matching is more challenging due to the severe nonlinear radiation
distortion (NRD). Radiation-variation insensitive feature transform
(RIFT)~\cite{li2019rift} has shown very good robustness to NRD and become a
baseline method in multimodal feature matching. However, the high computational
cost for rotation invariance largely limits its usage in practice. In this
paper, we propose an improved RIFT method, called RIFT2. We develop a new
rotation invariance technique based on dominant index value, which avoids the
construction process of convolution sequence ring. Hence, it can speed up the
running time and reduce the memory consumption of the original RIFT by almost 3
times in theory. Extensive experiments show that RIFT2 achieves similar
matching performance to RIFT while being much faster and having less memory
consumption. The source code will be made publicly available in
\url{https://github.com/LJY-RS/RIFT2-multimodal-matching-rotation}
- Abstract(参考訳): マルチモーダル画像マッチングは、多元画像情報融合の重要な前提条件である。
従来のマッチング問題と比較すると,強い非線形放射歪み(NRD)のため,マルチモーダル特徴マッチングは困難である。
放射変量不感性特徴変換(RIFT)~\cite{li2019rift} は、NRDに対して非常に優れたロバスト性を示し、マルチモーダル特徴マッチングにおけるベースライン法となった。
しかし、回転不変性に対する高い計算コストは、実際にの使用を著しく制限する。
本稿では,改良されたRIFT法であるRIFT2を提案する。
本研究では,畳み込み列リングの構成過程を回避し,優性指数値に基づく新しい回転不変性手法を開発した。
これにより、実行時間を短縮し、理論上は元のRIFTのメモリ消費を約3倍削減することができる。
大規模な実験により、RIFT2はRIFTと同等の性能を示しながら、より高速で、メモリ消費も少ないことがわかった。
ソースコードは \url{https://github.com/LJY-RS/RIFT2-multimodal-matching-rotation} で公開されている。
関連論文リスト
- BurstM: Deep Burst Multi-scale SR using Fourier Space with Optical Flow [16.548851451690908]
マルチフレーム超解像(MFSR)は単一画像超解像(SISR)よりも高い性能を達成する
最近のMFSRアプローチは、変形可能な畳み込みネットワーク(DCN)に適応してフレームを整列させる。
光フローを用いたフーリエ空間を用いたディープバーストマルチスケールSR(BurstM)を提案する。
論文 参考訳(メタデータ) (2024-09-21T15:30:57Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - Invertible Residual Rescaling Models [46.28263683643467]
Invertible Rescaling Networks (IRNs)とその変種は、画像再スケーリングのような様々な画像処理タスクにおいて顕著な成果をみせた。
Invertible Residual Rescaling Models (IRRM) は,高解像度画像と高解像度画像との複射を特定の分布で学習することにより,画像再スケーリングを実現する。
我々のIRRMは,x4再スケーリングにおいて,それぞれ最低0.3dBのPSNRゲインを有し,60%のパラメータと50%のFLOPしか使用していない。
論文 参考訳(メタデータ) (2024-05-05T14:14:49Z) - Reciprocal Attention Mixing Transformer for Lightweight Image Restoration [6.3159191692241095]
本稿では,RAMiT(Reciprocal Attention Mixing Transformer)という軽量画像復元ネットワークを提案する。
二次元(空間とチャネル)の自己アテンションを、異なる数のマルチヘッドと並行して使用する。
超高分解能、カラーデノイング、グレースケールデノナイジング、低照度向上、デラリニングなど、複数の軽量IRタスクにおける最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-05-19T06:55:04Z) - Multi-scale Transformer Network with Edge-aware Pre-training for
Cross-Modality MR Image Synthesis [52.41439725865149]
クロスモダリティ磁気共鳴(MR)画像合成は、与えられたモダリティから欠落するモダリティを生成するために用いられる。
既存の(教師付き学習)手法は、効果的な合成モデルを訓練するために、多くのペア化されたマルチモーダルデータを必要とすることが多い。
マルチスケールトランスフォーマーネットワーク(MT-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T11:40:40Z) - Orthonormal Convolutions for the Rotation Based Iterative
Gaussianization [64.44661342486434]
本稿では、画像ガウス化を可能にする回転型反復ガウス化RBIGの拡張について詳述する。
RBIGの回転は主成分分析や独立成分分析に基づくため、画像では小さな画像パッチや孤立画素に制限されている。
emphConvolutional RBIG:この問題を緩和する拡張として,RBIGの回転が畳み込みであることを示す。
論文 参考訳(メタデータ) (2022-06-08T12:56:34Z) - DONet: Dual-Octave Network for Fast MR Image Reconstruction [98.04121143761017]
Dual-Octave Network (DONet) はMRデータの実像と虚像の両方からマルチスケールの空間周波数特徴を学習することができる。
私達のフレームワークは3つの魅力的な利点を提供します。
論文 参考訳(メタデータ) (2021-05-12T21:41:02Z) - Dual-Octave Convolution for Accelerated Parallel MR Image Reconstruction [75.35200719645283]
本稿では,実物と虚構の両方から,多次元空間周波数特徴を学習可能なDual-Octave Convolution(Dual-OctConv)を提案する。
オクターブ畳み込みによる複雑な操作を改質することで、MR画像のよりリッチな表現を捉える強力な能力を示す。
論文 参考訳(メタデータ) (2021-04-12T10:51:05Z) - MuCAN: Multi-Correspondence Aggregation Network for Video
Super-Resolution [63.02785017714131]
ビデオ超解像(VSR)は、複数の低解像度フレームを使用して、各フレームに対して高解像度の予測を生成することを目的としている。
フレーム間およびフレーム内は、時間的および空間的情報を利用するための鍵となるソースである。
VSRのための効果的なマルチ対応アグリゲーションネットワーク(MuCAN)を構築した。
論文 参考訳(メタデータ) (2020-07-23T05:41:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。