論文の概要: Long-Range Correlation Supervision for Land-Cover Classification from
Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2309.04225v1
- Date: Fri, 8 Sep 2023 09:19:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-11 13:54:50.265831
- Title: Long-Range Correlation Supervision for Land-Cover Classification from
Remote Sensing Images
- Title(参考訳): リモートセンシング画像を用いたLong-Range correlation Supervision for Land-Cover Classification
- Authors: Dawen Yu, Shunping Ji
- Abstract要約: 本研究では,SLCNetと呼ばれる土地被覆分類のための新しい教師付き長距離相関手法を提案する。
SLCNetでは、同じカテゴリを共有するピクセルは高い相関関係があり、異なるカテゴリを持つピクセルは関連性が低い。
コンピュータビジョン、医療、リモートセンシングコミュニティの高度なセグメンテーション手法と比較すると、SLCNetはすべてのデータセットで最先端のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 4.8951183832371
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-range dependency modeling has been widely considered in modern deep
learning based semantic segmentation methods, especially those designed for
large-size remote sensing images, to compensate the intrinsic locality of
standard convolutions. However, in previous studies, the long-range dependency,
modeled with an attention mechanism or transformer model, has been based on
unsupervised learning, instead of explicit supervision from the objective
ground truth. In this paper, we propose a novel supervised long-range
correlation method for land-cover classification, called the supervised
long-range correlation network (SLCNet), which is shown to be superior to the
currently used unsupervised strategies. In SLCNet, pixels sharing the same
category are considered highly correlated and those having different categories
are less relevant, which can be easily supervised by the category consistency
information available in the ground truth semantic segmentation map. Under such
supervision, the recalibrated features are more consistent for pixels of the
same category and more discriminative for pixels of other categories,
regardless of their proximity. To complement the detailed information lacking
in the global long-range correlation, we introduce an auxiliary adaptive
receptive field feature extraction module, parallel to the long-range
correlation module in the encoder, to capture finely detailed feature
representations for multi-size objects in multi-scale remote sensing images. In
addition, we apply multi-scale side-output supervision and a hybrid loss
function as local and global constraints to further boost the segmentation
accuracy. Experiments were conducted on three remote sensing datasets. Compared
with the advanced segmentation methods from the computer vision, medicine, and
remote sensing communities, the SLCNet achieved a state-of-the-art performance
on all the datasets.
- Abstract(参考訳): 長距離依存モデリングは、現代のディープラーニングに基づくセマンティックセグメンテーション法、特に大規模リモートセンシング画像用に設計されたものにおいて、標準畳み込みの固有局所性を補うものとして広く考えられている。
しかし、従来の研究では、注意機構やトランスフォーマーモデルでモデル化された長距離依存は、客観的根拠真理からの明示的な監督ではなく、教師なし学習に基づいている。
本稿では,現在使用されている非教師付き戦略よりも優れていることを示す,教師付き長距離相関ネットワーク(SLCNet)と呼ばれる,土地被覆分類のための新しい教師付き長距離相関手法を提案する。
SLCNetでは、同じカテゴリを共有するピクセルは高い相関関係にあり、異なるカテゴリを持つピクセルは関連性が低く、基底真理セグメンテーションマップで利用可能なカテゴリ一貫性情報によって容易に管理できる。
このような監督の下で、補正された特徴は、同じカテゴリのピクセルに対してより一貫性があり、その近接に関係なく、他のカテゴリのピクセルに対してより差別的である。
大域的長距離相関に欠ける詳細な情報を補完するために、エンコーダの長距離相関モジュールと並行して、補助的適応受容場特徴抽出モジュールを導入し、マルチスケールリモートセンシング画像における多次元物体の特徴表現を微細にとらえる。
さらに,マルチスケールのサイドアウトプット監視とハイブリッド損失関数を局所的およびグローバル制約として適用し,セグメント化精度をさらに高める。
3つのリモートセンシングデータセットで実験を行った。
コンピュータビジョン、医療、リモートセンシングコミュニティの高度なセグメンテーション手法と比較すると、SLCNetはすべてのデータセットで最先端のパフォーマンスを達成した。
関連論文リスト
- Hierarchical Attention and Parallel Filter Fusion Network for Multi-Source Data Classification [33.26466989592473]
マルチソースデータ分類のための階層的注意と並列フィルタ融合ネットワークを提案する。
提案手法は,各データセットの総合精度(OA)の91.44%と80.51%を達成する。
論文 参考訳(メタデータ) (2024-08-22T23:14:22Z) - Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - DQnet: Cross-Model Detail Querying for Camouflaged Object Detection [54.82390534024954]
カモフラージュされた物体検出のための畳み込みニューラルネットワーク(CNN)は、完全な対象範囲を無視しながら局所的な識別領域を活性化する傾向がある。
本稿では,CNNの内在的特性から部分的活性化が引き起こされることを論じる。
完全なオブジェクト範囲を活性化できる特徴マップを得るために,クロスモデル詳細クエリネットワーク(DQnet)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-16T06:23:58Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Scale Aware Adaptation for Land-Cover Classification in Remote Sensing
Imagery [4.793219747021116]
リモートセンシング画像を用いた土地被覆分類は重要な地球観測課題である。
リモートセンシングイメージでディープセグメンテーションモデルをトレーニングするためのベンチマークデータセットは小さい傾向がある。
クロスロケーションおよびクロススケールの土地被覆分類を行うためのスケール認識型対人学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-08T05:15:43Z) - Multi-Attention-Network for Semantic Segmentation of Fine Resolution
Remote Sensing Images [10.835342317692884]
リモートセンシング画像におけるセマンティックセグメンテーションの精度は、ディープ畳み込みニューラルネットワークによって著しく向上した。
本稿では,これらの問題に対処するマルチアテンション・ネットワーク(MANet)を提案する。
線形複雑性を伴うカーネル注意の新たなアテンション機構が提案され,注目される計算負荷の低減が図られた。
論文 参考訳(メタデータ) (2020-09-03T09:08:02Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z) - Hybrid Multiple Attention Network for Semantic Segmentation in Aerial
Images [24.35779077001839]
グローバルな相関関係を適応的に捉えるために,Hybrid Multiple Attention Network (HMANet) という新しいアテンションベースのフレームワークを提案する。
本稿では,機能的冗長性を低減し,自己注意機構の効率を向上させるため,単純で効果的な領域シャッフルアテンション(RSA)モジュールを提案する。
論文 参考訳(メタデータ) (2020-01-09T07:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。