論文の概要: Dense Dilated Convolutions Merging Network for Land Cover Classification
- arxiv url: http://arxiv.org/abs/2003.04027v1
- Date: Mon, 9 Mar 2020 10:31:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 09:01:02.035676
- Title: Dense Dilated Convolutions Merging Network for Land Cover Classification
- Title(参考訳): 土地被覆分類のためのDense Dilated Convolutions Merging Network
- Authors: Qinghui Liu, Michael Kampffmeyer, Robert Jessen, and Arnt-B{\o}rre
Salberg
- Abstract要約: リモートセンシング画像のランドカバー分類は、限られた量の注釈付きデータのために難しい課題である。
本稿では,高密度拡張畳み込みネットワーク(DDCM-Net)と呼ばれる新しいアーキテクチャを提案する。
提案するDDCM-Netの有効性,堅牢性,柔軟性を,ISPRS Potsdam および Vaihingen データセット上で実証する。
- 参考スコア(独自算出の注目度): 8.932848548221532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Land cover classification of remote sensing images is a challenging task due
to limited amounts of annotated data, highly imbalanced classes, frequent
incorrect pixel-level annotations, and an inherent complexity in the semantic
segmentation task. In this article, we propose a novel architecture called the
dense dilated convolutions' merging network (DDCM-Net) to address this task.
The proposed DDCM-Net consists of dense dilated image convolutions merged with
varying dilation rates. This effectively utilizes rich combinations of dilated
convolutions that enlarge the network's receptive fields with fewer parameters
and features compared with the state-of-the-art approaches in the remote
sensing domain. Importantly, DDCM-Net obtains fused local- and global-context
information, in effect incorporating surrounding discriminative capability for
multiscale and complex-shaped objects with similar color and textures in very
high-resolution aerial imagery. We demonstrate the effectiveness, robustness,
and flexibility of the proposed DDCM-Net on the publicly available ISPRS
Potsdam and Vaihingen data sets, as well as the DeepGlobe land cover data set.
Our single model, trained on three-band Potsdam and Vaihingen data sets,
achieves better accuracy in terms of both mean intersection over union (mIoU)
and F1-score compared with other published models trained with more than
three-band data. We further validate our model on the DeepGlobe data set,
achieving state-of-the-art result 56.2% mIoU with much fewer parameters and at
a lower computational cost compared with related recent work. Code available at
https://github.com/samleoqh/DDCM-Semantic-Segmentation-PyTorch
- Abstract(参考訳): リモートセンシング画像のランドカバー分類は、限られた量の注釈付きデータ、高度に不均衡なクラス、頻繁な不正確なピクセルレベルのアノテーション、セマンティックセグメンテーションタスクにおける固有の複雑さによる課題である。
本稿では,この課題に対処するために,高密度拡張畳み込み結合ネットワーク (ddcm-net) と呼ばれる新しいアーキテクチャを提案する。
提案するddcm-netは,拡張率の異なる拡張画像畳み込みにより構成する。
これは、リモートセンシング領域における最先端のアプローチと比較して、より少ないパラメータと特徴でネットワークの受容フィールドを拡大する拡張畳み込みの豊富な組み合わせを効果的に利用する。
ddcm-netは,高分解能空中画像において,色やテクスチャに類似したマルチスケール・複雑形状の物体の周辺識別機能を組み込んだ,融合した局所的・グローバル的コンテキスト情報を得る。
提案するDDCM-Netの有効性,堅牢性,柔軟性をISPRS Potsdam と Vaihingen のデータセットおよび DeepGlobe の土地被覆データセット上で実証する。
我々の1つのモデルは3バンドのポツダムとヴァイヒンゲンのデータセットで訓練され、3バンド以上のデータで訓練された他のモデルと比較して平均交叉(mIoU)とF1スコアの両方で精度が向上する。
我々は、DeepGlobeデータセットのモデルをさらに検証し、56.2% mIoUをパラメータの少ない状態で達成し、最近の研究と比較して計算コストを下げた。
https://github.com/samleoqh/DDCM-Semantic-Segmentation-PyTorchで公開されているコード
関連論文リスト
- Adjacent-Level Feature Cross-Fusion With 3-D CNN for Remote Sensing
Image Change Detection [20.776673215108815]
AFCF3D-Netという名前の3次元畳み込みを伴う新しい近接レベル特徴融合ネットワークを提案する。
提案されたAFCF3D-Netは、3つの挑戦的なリモートセンシングCDデータセットで検証されている。
論文 参考訳(メタデータ) (2023-02-10T08:21:01Z) - Improved distinct bone segmentation in upper-body CT through
multi-resolution networks [0.39583175274885335]
上半身CTと異なる骨分画では、大きな視野と計算的な3Dアーキテクチャが必要とされる。
これにより、空間的コンテキストの欠如により、細部や局所的な誤差を欠いた低解像度な結果が得られる。
本稿では,異なる解像度で動作する複数の3次元U-Netを組み合わせたエンドツーエンドのトレーニング可能なセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2023-01-31T14:46:16Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - RSI-Net: Two-Stream Deep Neural Network Integrating GCN and Atrous CNN
for Semantic Segmentation of High-resolution Remote Sensing Images [3.468780866037609]
本稿では,リモートセンシング画像(RSI-Net)のセマンティックセグメンテーションのための2ストリームディープニューラルネットワークを提案する。
実験はVayhingen、Potsdam、Gaofen RSIデータセットで実施されている。
その結果,6つの最先端RSIセマンティックセグメンテーション法と比較して,総合的精度,F1スコア,カッパ係数において,RSI-Netの優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-19T15:57:20Z) - RGB-D Saliency Detection via Cascaded Mutual Information Minimization [122.8879596830581]
既存のRGB-Dサリエンシ検出モデルは、RGBと深さを効果的にマルチモーダル学習を実現するために明示的に奨励するものではない。
本稿では,RGB画像と深度データ間のマルチモーダル情報を「明示的」にモデル化するために,相互情報最小化による新しい多段階学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-15T12:31:27Z) - Similarity-Aware Fusion Network for 3D Semantic Segmentation [87.51314162700315]
本研究では,3次元セマンティックセグメンテーションのための2次元画像と3次元点雲を適応的に融合する類似性認識融合ネットワーク(SAFNet)を提案する。
我々は、入力とバックプロジェクションされた(2Dピクセルから)点雲の間の幾何学的および文脈的類似性を初めて学習する、後期融合戦略を採用している。
SAFNetは、様々なデータ完全性にまたがって、既存の最先端の核融合ベースのアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2021-07-04T09:28:18Z) - Comprehensive Graph-conditional Similarity Preserving Network for
Unsupervised Cross-modal Hashing [97.44152794234405]
教師なしクロスモーダルハッシュ(UCMH)は近年ホットトピックとなっている。
本稿では,dgcpn(deep graph-neighbor coherence preservation network)を考案する。
DGCPNは3種類のデータ類似性を利用して、損失を保存する包括的な類似性を管理する。
論文 参考訳(メタデータ) (2020-12-25T07:40:59Z) - Multi-scale Attention U-Net (MsAUNet): A Modified U-Net Architecture for
Scene Segmentation [1.713291434132985]
画像からコンテキスト情報を用いたシーンセグメンテーションのためのマルチスケールアテンションネットワークを提案する。
このネットワークは、局所的な特徴をグローバルな特徴にマップし、精度を向上し、識別画像領域を強調する。
我々はPascalVOC2012とADE20kという2つの標準データセットでモデルを評価した。
論文 参考訳(メタデータ) (2020-09-15T08:03:41Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Pairwise Relation Learning for Semi-supervised Gland Segmentation [90.45303394358493]
病理組織像における腺分節に対するPRS2モデルを提案する。
このモデルはセグメンテーションネットワーク(S-Net)とペア関係ネットワーク(PR-Net)から構成される。
我々は,GlaSデータセットの最近の5つの手法とCRAGデータセットの最近の3つの手法を比較した。
論文 参考訳(メタデータ) (2020-08-06T15:02:38Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。