論文の概要: DeepTriNet: A Tri-Level Attention Based DeepLabv3+ Architecture for
Semantic Segmentation of Satellite Images
- arxiv url: http://arxiv.org/abs/2310.06848v1
- Date: Tue, 5 Sep 2023 18:35:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 03:20:45.891444
- Title: DeepTriNet: A Tri-Level Attention Based DeepLabv3+ Architecture for
Semantic Segmentation of Satellite Images
- Title(参考訳): DeepTriNet: 衛星画像のセマンティックセグメンテーションのための三層アテンションに基づくDeepLabv3+アーキテクチャ
- Authors: Tareque Bashar Ovi, Shakil Mosharrof, Nomaiya Bashree, Md Shofiqul
Islam, and Muhammad Nazrul Islam
- Abstract要約: 本研究では,衛星画像のセマンティックセグメンテーションのための3レベルアテンションに基づくDeepLabv3+アーキテクチャ(DeepTriNet)を提案する。
提案手法は, 圧縮・励起ネットワーク (SENets) とトリレベルアテンションユニット (TAUs) をバニラのDeepLabv3+アーキテクチャと組み合わせたものである。
提案したDeepTriNetは、精度が98%と77%、IoU 80%と58%、精度が88%と68%で、それぞれ4クラスのLand-Cover.aiデータセットと15クラスのGID-2データセットで79%と55%のリコールで、従来の多くの手法よりも優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The segmentation of satellite images is crucial in remote sensing
applications. Existing methods face challenges in recognizing small-scale
objects in satellite images for semantic segmentation primarily due to ignoring
the low-level characteristics of the underlying network and due to containing
distinct amounts of information by different feature maps. Thus, in this
research, a tri-level attention-based DeepLabv3+ architecture (DeepTriNet) is
proposed for the semantic segmentation of satellite images. The proposed hybrid
method combines squeeze-and-excitation networks (SENets) and tri-level
attention units (TAUs) with the vanilla DeepLabv3+ architecture, where the TAUs
are used to bridge the semantic feature gap among encoders output and the
SENets used to put more weight on relevant features. The proposed DeepTriNet
finds which features are the more relevant and more generalized way by its
self-supervision rather we annotate them. The study showed that the proposed
DeepTriNet performs better than many conventional techniques with an accuracy
of 98% and 77%, IoU 80% and 58%, precision 88% and 68%, and recall of 79% and
55% on the 4-class Land-Cover.ai dataset and the 15-class GID-2 dataset
respectively. The proposed method will greatly contribute to natural resource
management and change detection in rural and urban regions through efficient
and semantic satellite image segmentation
- Abstract(参考訳): 衛星画像のセグメンテーションはリモートセンシング応用において重要である。
既存の手法では,衛星画像のセマンティックセグメンテーションにおける小型物体の認識には,基盤となるネットワークの低レベル特性を無視したり,異なる特徴マップによって異なる量の情報を含むため,課題に直面している。
そこで本研究では,衛星画像のセマンティックセグメンテーションのために,三レベルアテンションに基づくDeepLabv3+アーキテクチャ(DeepTriNet)を提案する。
提案手法は, 圧縮・励起ネットワーク(SENet)とトリレベルアテンションユニット(TAU)をバニラのDeepLabv3+アーキテクチャと組み合わせ, TAUはエンコーダ出力とSENetのセマンティック特徴ギャップを橋渡しする。
提案されたDeepTriNetは、アノテートするのではなく、自己スーパービジョンによってどの機能がより関連性があり、より一般化されているかを見つける。
提案したDeepTriNetは、精度98%と77%、IoU 80%と58%、精度88%と68%で、それぞれ4クラスのLand-Cover.aiデータセットと15クラスのGID-2データセットで79%と55%をリコールした。
提案手法は,効率的かつセマンティックな衛星画像セグメンテーションにより,農村・都市における自然資源管理と変化検出に大きく貢献する。
関連論文リスト
- Evaluating the Efficacy of Cut-and-Paste Data Augmentation in Semantic Segmentation for Satellite Imagery [4.499833362998487]
本研究では,衛星画像のセマンティックセグメンテーションにおけるカット・アンド・ペースト拡張手法の有効性について検討した。
私たちは、通常ラベル付きインスタンスを必要とするこの拡張を、セマンティックセグメンテーションのケースに適用します。
評価のためにDynamicEarthNetデータセットとU-Netモデルを用いて、この拡張により、テストセットのmIoUスコアが37.9から44.1に大幅に向上することを発見した。
論文 参考訳(メタデータ) (2024-04-08T17:18:30Z) - Spatial Layout Consistency for 3D Semantic Segmentation [0.7614628596146599]
本稿では,ALTMの点雲のボクセルに基づくセマンティックセマンティックセグメンテーションを実現するための,新しいディープ畳み込みニューラルネットワーク(DCNN)手法を提案する。
提案する深層学習手法であるセマンティック・ユーティリティ・ネットワーク(SUNet)は多次元・多次元ネットワークである。
実験により,SuNetの空間的レイアウトの整合性とマルチレゾリューション機能アグリゲーションにより,性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-03-02T03:24:21Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - DeepSSN: a deep convolutional neural network to assess spatial scene
similarity [11.608756441376544]
本稿では,深部空間シーンネットワーク(Deep Space Scene Network,DeepSSN)を提案する。
提案したDeepSSNを用いて,スケッチマップを用いた空間問合せをユーザが入力する空間シーン探索システムを開発した。
提案手法は,データ拡張後の131,300個のラベル付きシーンサンプルを含むマルチソース・コンバウンド・マップデータを用いて検証する。
論文 参考訳(メタデータ) (2022-02-07T23:53:20Z) - An Attention-Fused Network for Semantic Segmentation of
Very-High-Resolution Remote Sensing Imagery [26.362854938949923]
注目融合ネットワーク(AFNet)という,新しい畳み込みニューラルネットワークアーキテクチャを提案する。
ISPRS Vaihingen 2DデータセットとISPRS Potsdam 2Dデータセットで、総精度91.7%、平均F1スコア90.96%の最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-05-10T06:23:27Z) - GANav: Group-wise Attention Network for Classifying Navigable Regions in
Unstructured Outdoor Environments [54.21959527308051]
本稿では,RGB画像から,オフロード地形および非構造環境における安全かつ航行可能な領域を識別する新しい学習手法を提案する。
本手法は,粒度の粗いセマンティックセグメンテーションを用いて,そのナビビリティレベルに基づいて地形分類群を分類する。
RUGD と RELLIS-3D のデータセットを広範囲に評価することにより,我々の学習アルゴリズムがナビゲーションのためのオフロード地形における視覚知覚の精度を向上させることを示す。
論文 参考訳(メタデータ) (2021-03-07T02:16:24Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - PP-LinkNet: Improving Semantic Segmentation of High Resolution Satellite
Imagery with Multi-stage Training [4.694536172504848]
道路網と建築物のフットプリント抽出は、地図の更新、交通規制、都市計画、ライドシェアリング、災害対応テキストテットックなど、多くのアプリケーションにとって不可欠である。
論文 参考訳(メタデータ) (2020-10-14T10:23:48Z) - KiU-Net: Overcomplete Convolutional Architectures for Biomedical Image
and Volumetric Segmentation [71.79090083883403]
トラディショナル・エンコーダ・デコーダに基づく手法は, より小さな構造を検出でき, 境界領域を正確に分割できない。
本稿では,(1)入力の細部と正確なエッジを捉えることを学ぶ完全畳み込みネットワークKite-Netと,(2)高レベルの特徴を学習するU-Netの2つの枝を持つKiU-Netを提案する。
提案手法は,より少ないパラメータとより高速な収束の利点により,最近のすべての手法と比較して性能が向上する。
論文 参考訳(メタデータ) (2020-10-04T19:23:33Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。