論文の概要: MGML: Multi-Granularity Multi-Level Feature Ensemble Network for Remote
Sensing Scene Classification
- arxiv url: http://arxiv.org/abs/2012.14569v1
- Date: Tue, 29 Dec 2020 02:18:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 20:49:03.431097
- Title: MGML: Multi-Granularity Multi-Level Feature Ensemble Network for Remote
Sensing Scene Classification
- Title(参考訳): MGML:リモートセンシングシーン分類のための多層多層特徴アンサンブルネットワーク
- Authors: Qi Zhao, Shuchang Lyu, Yuewen Li, Yujing Ma, Lijiang Chen
- Abstract要約: 本稿では,多言語多層特徴アンサンブルネットワーク(MGML-FENet)を提案する。
提案ネットワークは、従来の最新(SOTA)ネットワークよりも優れたパフォーマンスを実現します。
- 参考スコア(独自算出の注目度): 15.856162817494726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing (RS) scene classification is a challenging task to predict
scene categories of RS images. RS images have two main characters: large
intra-class variance caused by large resolution variance and confusing
information from large geographic covering area. To ease the negative influence
from the above two characters. We propose a Multi-granularity Multi-Level
Feature Ensemble Network (MGML-FENet) to efficiently tackle RS scene
classification task in this paper. Specifically, we propose Multi-granularity
Multi-Level Feature Fusion Branch (MGML-FFB) to extract multi-granularity
features in different levels of network by channel-separate feature generator
(CS-FG). To avoid the interference from confusing information, we propose
Multi-granularity Multi-Level Feature Ensemble Module (MGML-FEM) which can
provide diverse predictions by full-channel feature generator (FC-FG). Compared
to previous methods, our proposed networks have ability to use structure
information and abundant fine-grained features. Furthermore, through ensemble
learning method, our proposed MGML-FENets can obtain more convincing final
predictions. Extensive classification experiments on multiple RS datasets (AID,
NWPU-RESISC45, UC-Merced and VGoogle) demonstrate that our proposed networks
achieve better performance than previous state-of-the-art (SOTA) networks. The
visualization analysis also shows the good interpretability of MGML-FENet.
- Abstract(参考訳): リモートセンシング(RS)シーン分類は、RS画像のシーンカテゴリを予測する上で難しい課題である。
rs画像には2つの主要文字がある: 大きな解像度のばらつきによるクラス内の大きなばらつきと、大きな地理的被覆領域からの混乱した情報。
上記2文字からの負の影響を緩和する。
本稿では,多言語多層特徴集合ネットワーク(MGML-FENet)を提案する。
具体的には、チャネル分離機能生成器(CS-FG)を用いて、異なるレベルのネットワークにおいて、多粒度特徴を抽出する多粒度多層機能融合ブランチ(MGML-FFB)を提案する。
混乱する情報からの干渉を避けるため,全チャネル特徴生成器(FC-FG)による多様な予測を提供する多言語多層特徴集合モジュール(MGML-FEM)を提案する。
従来の手法と比較して,提案するネットワークは構造情報や細かな特徴を豊富に活用できる。
さらに,本提案手法はアンサンブル学習により,より説得力のある最終予測が得られる。
複数のRSデータセット(AID, NWPU-RESISC45, UC-Merced, VGoogle)の大規模な分類実験により, 提案したネットワークは, 従来のSOTA(State-of-the-art)ネットワークよりも優れた性能を示すことが示された。
また,mgml-fenetの良好な解釈性を示す。
関連論文リスト
- All Grains, One Scheme (AGOS): Learning Multi-grain Instance
Representation for Aerial Scene Classification [31.412401135677744]
本稿では,これらの課題に対処するための新しい枠組みである1つのスキーム(AGOS)を提案する。
マルチグラインド認識モジュール(MGP)、マルチブランチマルチインスタンス表現モジュール(MBMIR)、自己整合セマンティックフュージョン(SSF)モジュールで構成される。
当社のAGOSは柔軟で,既存のCNNにプラグイン・アンド・プレイで容易に対応できる。
論文 参考訳(メタデータ) (2022-05-06T17:10:44Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Multi-Representation Adaptation Network for Cross-domain Image
Classification [20.615155915233693]
画像分類では、十分なラベルを取得するのに高価で時間がかかることが多い。
既存のアプローチは、主に単一の構造によって抽出された表現の分布を整列させる。
クロスドメイン画像分類における分類精度を劇的に向上させる多表現適応を提案する。
論文 参考訳(メタデータ) (2022-01-04T06:34:48Z) - Progressive Multi-stage Interactive Training in Mobile Network for
Fine-grained Recognition [8.727216421226814]
再帰型モザイク発電機(RMG-PMSI)を用いたプログレッシブ多段階インタラクティブトレーニング手法を提案する。
まず、異なる位相の異なる画像を生成する再帰モザイク発生器(RMG)を提案する。
次に、異なるステージの特徴は、異なるステージの対応する特徴を強化し補完するマルチステージインタラクション(MSI)モジュールを通過する。
RMG-PMSIは高い堅牢性と伝達性で性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-12-08T10:50:03Z) - Multi-Content Complementation Network for Salient Object Detection in
Optical Remote Sensing Images [108.79667788962425]
光リモートセンシング画像(RSI-SOD)における有能な物体検出は、いまだに課題である。
本稿では, RSI-SOD における複数コンテンツの相補性を検討するために, MCCNet (Multi-Content Complementation Network) を提案する。
MCCMでは、前景機能、エッジ機能、背景機能、グローバル画像レベル機能など、RSI-SODにとって重要な複数の機能について検討する。
論文 参考訳(メタデータ) (2021-12-02T04:46:40Z) - Specificity-preserving RGB-D Saliency Detection [103.3722116992476]
本稿では,RGB-Dサリエンシ検出のための特異性保存ネットワーク(SP-Net)を提案する。
2つのモダリティ特化ネットワークと共有学習ネットワークを採用し、個別および共有唾液マップを生成する。
6つのベンチマークデータセットの実験では、SP-Netは他の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-08-18T14:14:22Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - Efficient and Accurate Multi-scale Topological Network for Single Image
Dehazing [31.543771270803056]
本稿では,入力画像自体の特徴抽出と利用に注意を払います。
本稿では,マルチスケールトポロジカルネットワーク (mstn) を提案する。
一方、我々は、異なるスケールで機能の選択と融合を達成するために、マルチスケール機能融合モジュール(MFFM)と適応機能選択モジュール(AFSM)を設計します。
論文 参考訳(メタデータ) (2021-02-24T08:53:14Z) - Efficient Human Pose Estimation by Learning Deeply Aggregated
Representations [67.24496300046255]
深く集約された表現を学習することで、効率的な人間ポーズ推定ネットワーク(DANet)を提案する。
私たちのネットワークは、より小さなモデルの複雑さで、同等またはより良い精度を達成できます。
論文 参考訳(メタデータ) (2020-12-13T10:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。