論文の概要: Bidirectional Multi-scale Attention Networks for Semantic Segmentation
of Oblique UAV Imagery
- arxiv url: http://arxiv.org/abs/2102.03099v1
- Date: Fri, 5 Feb 2021 11:02:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-08 14:41:21.927497
- Title: Bidirectional Multi-scale Attention Networks for Semantic Segmentation
of Oblique UAV Imagery
- Title(参考訳): 斜めUAV画像のセマンティックセグメンテーションのための双方向マルチスケールアテンションネットワーク
- Authors: Ye Lyu, George Vosselman, Gui-Song Xia, Michael Ying Yang
- Abstract要約: 本稿では、より適応的で効果的な特徴抽出のために、複数スケールの特徴を双方向に融合する新しい双方向多スケールアテンションネットワークを提案する。
当モデルでは,平均和合(mIoU)スコア70.80%でSOTA(State-of-the-art)を達成した。
- 参考スコア(独自算出の注目度): 30.524771772192757
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation for aerial platforms has been one of the fundamental
scene understanding task for the earth observation. Most of the semantic
segmentation research focused on scenes captured in nadir view, in which
objects have relatively smaller scale variation compared with scenes captured
in oblique view. The huge scale variation of objects in oblique images limits
the performance of deep neural networks (DNN) that process images in a single
scale fashion. In order to tackle the scale variation issue, in this paper, we
propose the novel bidirectional multi-scale attention networks, which fuse
features from multiple scales bidirectionally for more adaptive and effective
feature extraction. The experiments are conducted on the UAVid2020 dataset and
have shown the effectiveness of our method. Our model achieved the
state-of-the-art (SOTA) result with a mean intersection over union (mIoU) score
of 70.80%.
- Abstract(参考訳): 航空プラットフォームにおけるセマンティクスセグメンテーションは、地球観測における基本的なシーン理解タスクの1つである。
セマンティックセグメンテーションのほとんどの研究は、斜視で捉えたシーンに比べて、物体のスケールの変化が比較的小さい、ナディルビューで捉えたシーンに焦点を当てている。
斜め画像におけるオブジェクトの大規模変動は、単一のスケールで画像を処理するディープニューラルネットワーク(DNN)のパフォーマンスを制限する。
そこで本論文では,複数のスケールの特徴を双方向に融合させ,より適応的かつ効果的な特徴抽出を行う,新しい双方向マルチスケール注意ネットワークを提案する。
実験はUAVid2020データセット上で行われ,本手法の有効性を示した。
私達のモデルは70.80%の連合(mIoU)スコア上の平均交差の最先端の(SOTA)結果を達成しました。
関連論文リスト
- Scale Attention for Learning Deep Face Representation: A Study Against
Visual Scale Variation [69.45176408639483]
我々はスケール空間理論に頼って凸層を再構築する。
我々はSCale AttentioN Conv Neural Network(textbfSCAN-CNN)という新しいスタイルを構築した。
単発方式として、推論はマルチショット融合よりも効率的である。
論文 参考訳(メタデータ) (2022-09-19T06:35:04Z) - Semantic Labeling of High Resolution Images Using EfficientUNets and
Transformers [5.177947445379688]
畳み込みニューラルネットワークとディープトランスを組み合わせた新しいセグメンテーションモデルを提案する。
提案手法は,最先端技術と比較してセグメント化精度が向上することを示す。
論文 参考訳(メタデータ) (2022-06-20T12:03:54Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Multi-Scale Feature Fusion: Learning Better Semantic Segmentation for
Road Pothole Detection [9.356003255288417]
本稿では,単一モーダルなセマンティックセグメンテーションに基づく新しいポットホール検出手法を提案する。
まず、畳み込みニューラルネットワークを用いて入力画像から視覚的特徴を抽出する。
チャネルアテンションモジュールは、異なるフィーチャーマップの一貫性を高めるために、チャネル機能を再考する。
論文 参考訳(メタデータ) (2021-12-24T15:07:47Z) - AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large
Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。
本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-19T03:30:22Z) - CDN-MEDAL: Two-stage Density and Difference Approximation Framework for
Motion Analysis [3.337126420148156]
本稿では,2つの畳み込みニューラルネットワークを用いた2段階変化検出手法を提案する。
筆者らの2段階フレームワークは, 約3.5Kのパラメータを含むが, 複雑な動きパターンに対する迅速な収束は維持されている。
論文 参考訳(メタデータ) (2021-06-07T16:39:42Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。