論文の概要: PCNet: A Structure Similarity Enhancement Method for Multispectral and
Multimodal Image Registration
- arxiv url: http://arxiv.org/abs/2106.05124v1
- Date: Wed, 9 Jun 2021 15:00:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-10 15:07:46.412556
- Title: PCNet: A Structure Similarity Enhancement Method for Multispectral and
Multimodal Image Registration
- Title(参考訳): pcnet:マルチスペクトルおよびマルチモーダル画像登録のための構造類似性向上手法
- Authors: Si-Yuan Cao, Hui-Liang Shen, Lun Luo, Shu-Jie Chen, and Chunguang Li
- Abstract要約: 非線形強度と勾配変動のため、マルチスペクトルまたはマルチモーダル画像の登録は困難である。
本稿では,構造類似性を高め,非線形強度と勾配変動を軽減する位相整合性ネットワーク(PCNet)を提案する。
類似性強化トレーニングのおかげで、PCNetは元の位相同期アルゴリズムより2/3少ない機能チャネルで性能を向上する。
- 参考スコア(独自算出の注目度): 14.087940804673586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multispectral and multimodal image processing is important in the community
of computer vision and computational photography. As the acquired multispectral
and multimodal data are generally misaligned due to the alternation or movement
of the image device, the image registration procedure is necessary. The
registration of multispectral or multimodal image is challenging due to the
non-linear intensity and gradient variation. To cope with this challenge, we
propose the phase congruency network (PCNet), which is able to enhance the
structure similarity and alleviate the non-linear intensity and gradient
variation. The images can then be aligned using the similarity enhanced
features produced by the network. PCNet is constructed under the guidance of
the phase congruency prior. The network contains three trainable layers
accompany with the modified learnable Gabor kernels according to the phase
congruency theory. Thanks to the prior knowledge, PCNet is extremely
light-weight and can be trained on quite a small amount of multispectral data.
PCNet can be viewed to be fully convolutional and hence can take input of
arbitrary sizes. Once trained, PCNet is applicable on a variety of
multispectral and multimodal data such as RGB/NIR and flash/no-flash images
without additional further tuning. Experimental results validate that PCNet
outperforms current state-of-the-art registration algorithms, including the
deep-learning based ones that have the number of parameters hundreds times
compared to PCNet. Thanks to the similarity enhancement training, PCNet
outperforms the original phase congruency algorithm with two-thirds less
feature channels.
- Abstract(参考訳): マルチスペクトルおよびマルチモーダル画像処理は、コンピュータビジョンと計算写真の分野で重要である。
取得したマルチスペクトルおよびマルチモーダルデータは、画像装置の交替または移動により一般に不整合であるため、画像登録手順が必要である。
非線形強度と勾配変動のため、マルチスペクトルまたはマルチモーダル画像の登録は困難である。
そこで本研究では,この課題に対処するために,構造類似性を高め,非線形強度と勾配変動を緩和する位相合同ネットワーク(pcnet)を提案する。
画像は、ネットワークが生成する類似性強化機能を使用してアライメントすることができる。
PCNetは相整合の指導のもと構築される。
このネットワークは、位相合同理論に従って改良された学習可能なガボールカーネルを伴う3つの学習可能な層を含む。
これまでの知識のおかげで、PCNetは非常に軽量であり、非常に少量のマルチスペクトルデータをトレーニングすることができる。
pcnetは完全に畳み込みであると見なすことができ、任意のサイズの入力を受けることができる。
トレーニングが完了すると、PCNetはRGB/NIRやフラッシュ/フラッシュフラッシュ画像などの様々なマルチスペクトルおよびマルチモーダルデータに適用できる。
実験の結果、PCNetはPCNetと比較して数百倍のパラメータを持つディープラーニングベースアルゴリズムなど、現在の最先端の登録アルゴリズムよりも優れていることが示された。
類似性強化トレーニングのおかげで、PCNetは元の位相同期アルゴリズムより2/3少ない機能チャネルで性能を向上する。
関連論文リスト
- Practical Compact Deep Compressed Sensing [9.747987976900085]
汎用画像CSのためのPCNetという,実用的でコンパクトなネットワークを提案する。
PCNetでは、ディープ条件フィルタリングステップとデュアルブランチ高速サンプリングステップからなる新しい協調サンプリング演算子が設計されている。
我々のPCNetは、再構成のための改良された勾配降下アルゴリズム付きネットワークを備えている。
論文 参考訳(メタデータ) (2024-11-20T07:17:16Z) - WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring [25.36888929483233]
そこで本研究では,シングルインプットとマルチアウトプット(SIMO)に基づくマルチスケールネットワークを提案する。
実世界の軌道特性を学習可能なウェーブレット変換モジュールと組み合わせて、ぼやけた画像から鋭い画像へのステップバイステップ遷移の方向連続性と周波数特性に着目した。
論文 参考訳(メタデータ) (2023-12-29T02:59:40Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - Multi-scale Transformer Network with Edge-aware Pre-training for
Cross-Modality MR Image Synthesis [52.41439725865149]
クロスモダリティ磁気共鳴(MR)画像合成は、与えられたモダリティから欠落するモダリティを生成するために用いられる。
既存の(教師付き学習)手法は、効果的な合成モデルを訓練するために、多くのペア化されたマルチモーダルデータを必要とすることが多い。
マルチスケールトランスフォーマーネットワーク(MT-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T11:40:40Z) - Optimizing Vision Transformers for Medical Image Segmentation and
Few-Shot Domain Adaptation [11.690799827071606]
我々はCS-Unet(Convolutional Swin-Unet)トランスフォーマーブロックを提案し、パッチ埋め込み、プロジェクション、フィードフォワードネットワーク、サンプリングおよびスキップ接続に関連する設定を最適化する。
CS-Unetはゼロからトレーニングすることができ、各機能プロセスフェーズにおける畳み込みの優位性を継承する。
実験によると、CS-Unetは事前トレーニングなしで、パラメータが少ない2つの医療用CTおよびMRIデータセットに対して、最先端の他のデータセットを大きなマージンで上回っている。
論文 参考訳(メタデータ) (2022-10-14T19:18:52Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Rethinking Coarse-to-Fine Approach in Single Image Deblurring [19.195704769925925]
マルチインプットマルチアウトプットU-netを用いた高速かつ高精度なデブロアリングネットワーク設計を提案する。
提案したネットワークは、精度と計算複雑性の両方の観点から最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-08-11T06:37:01Z) - Domain Adaptor Networks for Hyperspectral Image Recognition [35.95313368586933]
本稿では,3チャンネルカラー画像に基づいてトレーニングしたネットワークを,多数のチャネルを持つハイパースペクトル領域に適応させる問題について考察する。
画像ネットのような大規模カラー画像データセットでトレーニングされたネットワークと互換性のある入力をマップするドメインアダプタネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-03T15:06:39Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。