論文の概要: Deep Fusion of Local and Non-Local Features for Precision Landslide
Recognition
- arxiv url: http://arxiv.org/abs/2002.08547v1
- Date: Thu, 20 Feb 2020 03:18:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 08:12:36.460093
- Title: Deep Fusion of Local and Non-Local Features for Precision Landslide
Recognition
- Title(参考訳): 高精度地すべり認識のための局所・非局所特徴の深部融合
- Authors: Qing Zhu, Lin Chen, Han Hu, Binzhi Xu, Yeting Zhang, Haifeng Li
- Abstract要約: 本稿では,局所的特徴と非局所的特徴を融合して文脈問題を克服する効果的な手法を提案する。
リモートセンシングコミュニティで広く採用されているU-Netアーキテクチャを基盤として,さらに2つのモジュールを利用する。
実験により,提案手法は最先端の汎用的セマンティックセグメンテーション手法よりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 17.896249114628336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precision mapping of landslide inventory is crucial for hazard mitigation.
Most landslides generally co-exist with other confusing geological features,
and the presence of such areas can only be inferred unambiguously at a large
scale. In addition, local information is also important for the preservation of
object boundaries. Aiming to solve this problem, this paper proposes an
effective approach to fuse both local and non-local features to surmount the
contextual problem. Built upon the U-Net architecture that is widely adopted in
the remote sensing community, we utilize two additional modules. The first one
uses dilated convolution and the corresponding atrous spatial pyramid pooling,
which enlarged the receptive field without sacrificing spatial resolution or
increasing memory usage. The second uses a scale attention mechanism to guide
the up-sampling of features from the coarse level by a learned weight map. In
implementation, the computational overhead against the original U-Net was only
a few convolutional layers. Experimental evaluations revealed that the proposed
method outperformed state-of-the-art general-purpose semantic segmentation
approaches. Furthermore, ablation studies have shown that the two models
afforded extensive enhancements in landslide-recognition performance.
- Abstract(参考訳): 地すべり在庫の精密マッピングは, リスク軽減に不可欠である。
ほとんどの地すべりは、概して他の紛らわしい地質学的特徴と共存しており、そのような地域の存在は、大規模で曖昧に推測できるだけである。
加えて、局所的な情報もオブジェクト境界の保存に重要である。
本稿では,この問題を解決するために,局所的特徴と非局所的特徴を融合して文脈的問題を克服する効果的な手法を提案する。
リモートセンシングコミュニティで広く採用されているU-Netアーキテクチャを基盤として,さらに2つのモジュールを利用する。
最初のものは拡張畳み込みとそれに対応するアラス空間ピラミッドプールを使用し、空間分解能を犠牲にしたりメモリ使用量を増やしたりすることなく、受容領域を拡大した。
2つめは、スケールアテンション機構を使用して、学習した重みマップによって、粗いレベルから特徴のアップサンプリングを導く。
実装上、オリジナルのu-netに対する計算オーバーヘッドは、ほんの数層の畳み込み層であった。
実験により,提案手法は最先端の汎用セマンティックセグメンテーション手法よりも優れていた。
さらに, アブレーション実験の結果, この2モデルにより地すべり認識性能が大幅に向上することが判明した。
関連論文リスト
- Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - Towards Generalizable Deepfake Detection by Primary Region
Regularization [52.41801719896089]
本稿では,新しい正規化の観点から一般化能力を高める。
本手法は, 一次領域マップの静的な位置決めと, 一次領域マスクの動的利用の2段階からなる。
5つのバックボーンを持つDFDC,DF-1.0,Celeb-DFの3種類のディープフェイクデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2023-07-24T05:43:34Z) - ROIFormer: Semantic-Aware Region of Interest Transformer for Efficient
Self-Supervised Monocular Depth Estimation [6.923035780685481]
幾何認識表現強調のための効率的な局所適応アダプティブアテンション手法を提案する。
意味情報からの幾何学的手がかりを利用して局所適応的境界ボックスを学習し、教師なし特徴集合を導出する。
提案手法は, 自己教師型単分子深度推定タスクにおける新しい最先端技術を確立する。
論文 参考訳(メタデータ) (2022-12-12T06:38:35Z) - Learning Second Order Local Anomaly for General Face Forgery Detection [7.6896977871741985]
本稿では,CNNを用いた顔偽造検知器の一般化能力向上のための新しい手法を提案する。
具体的には,局所的な異常をマイニングするための2次局所異常(SOLA)学習モジュールを提案する。
また、実地と偽地の局所的特徴の識別を改善するための局所拡張モジュール(LEM)を提案する。
論文 参考訳(メタデータ) (2022-09-30T14:27:11Z) - Deep Multi-Scale U-Net Architecture and Noise-Robust Training Strategies
for Histopathological Image Segmentation [6.236433671063744]
本稿では,U-Netエンコーダの各畳み込みモジュールにマルチスケールの特徴マップを明示的に付加し,ヒストロジー画像のセグメンテーションを改善することを提案する。
乳がんリンパ節のプライベートデータセットを用いた実験では, 提案した2つの拡張に基づいて, U-Netベースラインを大幅に改善した。
論文 参考訳(メタデータ) (2022-05-03T21:00:44Z) - Detection of Deepfake Videos Using Long Distance Attention [73.6659488380372]
既存のほとんどの検出方法は、問題をバニラ二項分類問題として扱う。
本稿では,偽顔と実顔の相違が非常に微妙であるため,特にきめ細かな分類問題として扱われる。
大域的な視点で空間的・時間的偽の痕跡を捉えるための2つの要素を持つ時空間モデルを提案する。
論文 参考訳(メタデータ) (2021-06-24T08:33:32Z) - Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation [62.29076080124199]
本稿では,クロスドメインオブジェクト検出のための特徴適応手法を提案する。
粗粒度では、アテンション機構を採用して前景領域を抽出し、その辺縁分布に応じて整列する。
粒度の細かい段階では、同じカテゴリのグローバルプロトタイプと異なるドメインとの距離を最小化することにより、前景の条件分布アライメントを行う。
論文 参考訳(メタデータ) (2020-03-23T13:40:06Z) - ASLFeat: Learning Local Features of Accurate Shape and Localization [42.70030492742363]
ASLFeatを3つの軽量かつ効果的に修正し、上記の問題を緩和する。
まず、変形可能な畳み込みネットワークを用いて局所変換を密に推定、適用する。
第2に,空間分解能と低レベル細部を復元する特徴階層を利用して,正確なキーポイント位置推定を行う。
論文 参考訳(メタデータ) (2020-03-23T04:03:03Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。