論文の概要: Hi-ResNet: A High-Resolution Remote Sensing Network for Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2305.12691v2
- Date: Tue, 23 May 2023 04:32:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 10:50:44.532846
- Title: Hi-ResNet: A High-Resolution Remote Sensing Network for Semantic
Segmentation
- Title(参考訳): Hi-ResNet: セマンティックセグメンテーションのための高分解能リモートセンシングネットワーク
- Authors: Yuxia Chen, Pengcheng Fang, Jianhui Yu, Xiaoling Zhong, Xiaoming
Zhang, Tianrui Li
- Abstract要約: 高分解能リモートセンシング(HRS)セマンティックセマンティクスは、高分解能カバレッジ領域からキーオブジェクトを抽出する。
HRS画像内の同じカテゴリのオブジェクトは、多様な地理的環境におけるスケールと形状の顕著な違いを示す。
効率的なネットワーク構造を持つ高分解能リモートセンシングネットワーク(Hi-ResNet)を提案する。
- 参考スコア(独自算出の注目度): 7.216053041550996
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-resolution remote sensing (HRS) semantic segmentation extracts key
objects from high-resolution coverage areas. However, objects of the same
category within HRS images generally show significant differences in scale and
shape across diverse geographical environments, making it difficult to fit the
data distribution. Additionally, a complex background environment causes
similar appearances of objects of different categories, which precipitates a
substantial number of objects into misclassification as background. These
issues make existing learning algorithms sub-optimal. In this work, we solve
the above-mentioned problems by proposing a High-resolution remote sensing
network (Hi-ResNet) with efficient network structure designs, which consists of
a funnel module, a multi-branch module with stacks of information aggregation
(IA) blocks, and a feature refinement module, sequentially, and Class-agnostic
Edge Aware (CEA) loss. Specifically, we propose a funnel module to downsample,
which reduces the computational cost, and extract high-resolution semantic
information from the initial input image. Secondly, we downsample the processed
feature images into multi-resolution branches incrementally to capture image
features at different scales and apply IA blocks, which capture key latent
information by leveraging attention mechanisms, for effective feature
aggregation, distinguishing image features of the same class with variant
scales and shapes. Finally, our feature refinement module integrate the CEA
loss function, which disambiguates inter-class objects with similar shapes and
increases the data distribution distance for correct predictions. With
effective pre-training strategies, we demonstrated the superiority of Hi-ResNet
over state-of-the-art methods on three HRS segmentation benchmarks.
- Abstract(参考訳): 高分解能リモートセンシング(HRS)セマンティックセマンティクスは、高分解能カバレッジ領域からキーオブジェクトを抽出する。
しかし、HRS画像内の同じカテゴリのオブジェクトは、様々な地理的環境におけるスケールと形状の顕著な違いを示し、データ分布に適合することが困難である。
さらに、複雑な背景環境は異なるカテゴリのオブジェクトに類似した外観をもたらし、かなりの数のオブジェクトが背景として誤分類される。
これらの問題は、既存の学習アルゴリズムを最適化する。
本研究では,ファンネルモジュール,情報集約スタック(ia)ブロックを有するマルチブランチモジュール,機能改良モジュール,シーケンシャルかつクラス非依存なエッジ認識(cea)損失からなる効率的なネットワーク構造設計により,高解像度リモートセンシングネットワーク(hi-resnet)を提案することで,上記の課題を解決する。
具体的には,計算コストを低減し,初期入力画像から高分解能な意味情報を抽出するファンネルモジュールを提案する。
第2に,処理された特徴画像を段階的にマルチレゾリューションに分解し,異なるスケールで画像特徴をキャプチャし,IAブロックを適用し,注意機構を利用して重要な潜時情報をキャプチャし,特徴集約を効果的に行い,同一クラスの画像特徴を異なるスケールと形状で識別する。
最後に,cea損失関数を統合し,クラス間オブジェクトの類似形状を曖昧にし,正確な予測のためにデータ分布距離を増加させる。
実効的な事前学習戦略により、3つのHRSセグメンテーションベンチマークの最先端手法よりもHi-ResNetの方が優れていることを示した。
関連論文リスト
- De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - LoG-CAN: local-global Class-aware Network for semantic segmentation of
remote sensing images [4.124381172041927]
リモートセンシング画像にグローバルクラス認識(GCA)モジュールとローカルクラス認識(LCA)モジュールを備えたマルチスケールセマンティックセマンティックセマンティクスネットワークであるLoG-CANを提案する。
特に、LCAモジュールは、背景干渉を回避するためにクラスワイドコンテキストモデリングのグローバル表現をキャプチャし、LCAモジュールは、クラス内のばらつきを減らすために、クラスをグローバルクラス表現と間接的に関連付ける、中間認識要素としてローカルクラス表現を生成する。
論文 参考訳(メタデータ) (2023-03-14T09:44:29Z) - Transformation-Invariant Network for Few-Shot Object Detection in Remote
Sensing Images [15.251042369061024]
FSOD(Few-shot Object Detection)は、トレーニングのために大量のラベル付きデータを頼りにしている。
リモートセンシング画像におけるオブジェクトのスケールと向きのバリエーションは、既存のFSOD法に重大な課題をもたらす。
特徴ピラミッドネットワークの統合と,クエリ機能向上のためのプロトタイプ機能の利用を提案する。
論文 参考訳(メタデータ) (2023-03-13T02:21:38Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - High-resolution Depth Maps Imaging via Attention-based Hierarchical
Multi-modal Fusion [84.24973877109181]
誘導DSRのための新しい注意に基づく階層型マルチモーダル融合ネットワークを提案する。
本手法は,再現精度,動作速度,メモリ効率の点で最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:28:33Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。