論文の概要: Reducing the feature divergence of RGB and near-infrared images using
Switchable Normalization
- arxiv url: http://arxiv.org/abs/2106.03088v1
- Date: Sun, 6 Jun 2021 10:48:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 18:07:28.273190
- Title: Reducing the feature divergence of RGB and near-infrared images using
Switchable Normalization
- Title(参考訳): スイッチブル正規化によるRGBと近赤外画像の特徴ばらつきの低減
- Authors: Siwei Yang, Shaozuo Yu, Bingchen Zhao, Yin Wang
- Abstract要約: 特徴のばらつきを考慮に入れずに、異なるモダリティを鼻で組み合わせることで、準最適結果が得られることを示す。
We apply a Switchable Normalization block to our DeepLabV3 segmentation model to improve the feature divergence。
我々のモデルは、以前公表されたベースラインよりも平均IoUが10%近く改善されている。
- 参考スコア(独自算出の注目度): 16.629441817143803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual pattern recognition over agricultural areas is an important
application of aerial image processing. In this paper, we consider the
multi-modality nature of agricultural aerial images and show that naively
combining different modalities together without taking the feature divergence
into account can lead to sub-optimal results. Thus, we apply a Switchable
Normalization block to our DeepLabV3 segmentation model to alleviate the
feature divergence. Using the popular symmetric Kullback Leibler divergence
measure, we show that our model can greatly reduce the divergence between RGB
and near-infrared channels. Together with a hybrid loss function, our model
achieves nearly 10\% improvements in mean IoU over previously published
baseline.
- Abstract(参考訳): 農業地域における視覚パターン認識は航空画像処理の重要な応用である。
本稿では, 農業用空中画像のマルチモーダル性について考察し, 特徴のばらつきを考慮せずに, 異なるモダリティを相乗的に組み合わせることで, 準最適結果が得られることを示す。
そこで我々は,DeepLabV3セグメンテーションモデルにスイッチ可能な正規化ブロックを適用し,特徴分散を緩和する。
一般的な対称Kulback Leibler分散測定を用いて、我々のモデルはRGBと近赤外チャネルのばらつきを大幅に低減できることを示す。
このモデルでは, ハイブリッド損失関数とともに, これまでに公表したベースラインよりも平均IoUが10倍近く改善されている。
関連論文リスト
- Contourlet Refinement Gate Framework for Thermal Spectrum Distribution Regularized Infrared Image Super-Resolution [54.293362972473595]
画像超解像(SR)は、高解像度(HR)画像を低解像度(LR)画像から再構成することを目的としている。
SRタスクに対処する現在のアプローチは、RGB画像の特徴を抽出するか、同様の劣化パターンを仮定するものである。
スペクトル分布の忠実さを保ちつつ、赤外線変調特性を復元するコントゥーレット改質ゲートフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-19T14:24:03Z) - Towards Degradation-Robust Reconstruction in Generalizable NeRF [58.33351079982745]
GNeRF(Generalizable Radiance Field)は,シーンごとの最適化を回避する手段として有効であることが証明されている。
GNeRFの強靭性は, ソース画像に現れる様々な種類の劣化に対して限定的に研究されている。
論文 参考訳(メタデータ) (2024-11-18T16:13:47Z) - Symmetric Uncertainty-Aware Feature Transmission for Depth
Super-Resolution [52.582632746409665]
カラー誘導DSRのためのSymmetric Uncertainty-aware Feature Transmission (SUFT)を提案する。
本手法は最先端の手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T06:35:59Z) - Exploring Invariant Representation for Visible-Infrared Person
Re-Identification [77.06940947765406]
異なるスペクトルを横断する歩行者にアイデンティティを関連付けることを目的とした、クロススペクトルの人物再識別は、モダリティの相違の主な課題に直面している。
本稿では、ロバスト機能マイニングネットワーク(RFM)と呼ばれるエンドツーエンドのハイブリッド学習フレームワークにおいて、画像レベルと特徴レベルの両方の問題に対処する。
RegDBとSYSU-MM01という2つの標準的なクロススペクトル人物識別データセットの実験結果により,最先端の性能が示された。
論文 参考訳(メタデータ) (2023-02-02T05:24:50Z) - Unsupervised Misaligned Infrared and Visible Image Fusion via
Cross-Modality Image Generation and Registration [59.02821429555375]
我々は、教師なし不整合赤外線と可視画像融合のための頑健な相互モダリティ生成登録パラダイムを提案する。
登録された赤外線画像と可視画像とを融合させるため,IFM (Feature Interaction Fusion Module) を提案する。
論文 参考訳(メタデータ) (2022-05-24T07:51:57Z) - Towards Homogeneous Modality Learning and Multi-Granularity Information
Exploration for Visible-Infrared Person Re-Identification [16.22986967958162]
Visible-infrared person re-identification (VI-ReID) は、可視・赤外線カメラビューを介して人物画像の集合を検索することを目的とした、困難かつ必須の課題である。
従来の手法では, GAN (Generative Adversarial Network) を用いて, モーダリティ・コンシデント・データを生成する手法が提案されている。
そこで本研究では、視線外デュアルモード学習をグレーグレー単一モード学習問題として再構成する、統一されたダークラインスペクトルであるAligned Grayscale Modality (AGM)を用いて、モード間マッチング問題に対処する。
論文 参考訳(メタデータ) (2022-04-11T03:03:19Z) - Differentiable Rendering for Synthetic Aperture Radar Imagery [0.0]
本稿では,3次元コンピュータグラフィックスの手法とニューラルレンダリングを組み合わせた合成開口レーダ(SAR)画像の微分可能レンダリング手法を提案する。
高忠実度シミュレーションSARデータを用いた限られたSAR画像からの3次元オブジェクト再構成の逆画像問題に対するアプローチを実証する。
論文 参考訳(メタデータ) (2022-04-04T05:27:40Z) - Multi-Scale Cascading Network with Compact Feature Learning for
RGB-Infrared Person Re-Identification [35.55895776505113]
マルチスケールパートアウェアカスケードフレームワーク(MSPAC)は、マルチスケールの細かい機能を部分からグローバルに集約することによって策定されます。
したがって、クロスモダリティ相関は、特徴的モダリティ不変な特徴学習のための顕著な特徴を効率的に探索することができる。
論文 参考訳(メタデータ) (2020-12-12T15:39:11Z) - Learning Selective Mutual Attention and Contrast for RGB-D Saliency
Detection [145.4919781325014]
クロスモーダル情報を効果的に融合する方法は、RGB-Dの有能な物体検出の鍵となる問題である。
多くのモデルは特徴融合戦略を用いるが、低次点対点融合法によって制限されている。
本研究では,異なるモダリティから注目とコンテキストを融合させることにより,新たな相互注意モデルを提案する。
論文 参考訳(メタデータ) (2020-10-12T08:50:10Z) - Cross-Modality Paired-Images Generation for RGB-Infrared Person
Re-Identification [29.92261627385826]
本稿では,大域的セットレベルと細粒度インスタンスレベルのアライメントを両立させることを提案する。
本手法は,モダリティに特有な特徴を明示的に除去し,モダリティの変動を低減できる。
我々のモデルはランク1とmAPで9.2%と7.7%を得ることができる。
論文 参考訳(メタデータ) (2020-02-10T22:15:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。