論文の概要: MRIFE: A Mask-Recovering and Interactive-Feature-Enhancing Semantic Segmentation Network For Relic Landslide Detection
- arxiv url: http://arxiv.org/abs/2411.17167v1
- Date: Tue, 26 Nov 2024 07:15:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-27 13:35:09.952698
- Title: MRIFE: A Mask-Recovering and Interactive-Feature-Enhancing Semantic Segmentation Network For Relic Landslide Detection
- Title(参考訳): MRIFE: 残留地すべり検出のためのマスク検索と対話機能付きセマンティックセマンティックセマンティックセマンティック・セグメンテーション・ネットワーク
- Authors: Juefei He, Yuexing Peng, Wei Li, Junchuan Yu, Daqing Ge, Wei Xiang,
- Abstract要約: 長い期間にわたって形成された遺物地すべりは、再活性化の可能性を秘めており、危険な地質現象となっている。
遺物地すべりの高解像度リモートセンシング画像は、物体の視界のぼかし問題など、多くの課題に直面している。
より効率的な特徴抽出と分離のためのセマンティックセグメンテーションモデルとして,マスクの回収と対話型フェールエンハンシング(MRIFE)を提案する。
提案したMRIFEは実地すべりデータセットを用いて評価され,実験結果から,地すべり検出の性能が大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 7.6822321138894765
- License:
- Abstract: Relic landslide, formed over a long period, possess the potential for reactivation, making them a hazardous geological phenomenon. While reliable relic landslide detection benefits the effective monitoring and prevention of landslide disaster, semantic segmentation using high-resolution remote sensing images for relic landslides faces many challenges, including the object visual blur problem, due to the changes of appearance caused by prolonged natural evolution and human activities, and the small-sized dataset problem, due to difficulty in recognizing and labelling the samples. To address these challenges, a semantic segmentation model, termed mask-recovering and interactive-feature-enhancing (MRIFE), is proposed for more efficient feature extraction and separation. Specifically, a contrastive learning and mask reconstruction method with locally significant feature enhancement is proposed to improve the ability to distinguish between the target and background and represent landslide semantic features. Meanwhile, a dual-branch interactive feature enhancement architecture is used to enrich the extracted features and address the issue of visual ambiguity. Self-distillation learning is introduced to leverage the feature diversity both within and between samples for contrastive learning, improving sample utilization, accelerating model convergence, and effectively addressing the problem of the small-sized dataset. The proposed MRIFE is evaluated on a real relic landslide dataset, and experimental results show that it greatly improves the performance of relic landslide detection. For the semantic segmentation task, compared to the baseline, the precision increases from 0.4226 to 0.5347, the mean intersection over union (IoU) increases from 0.6405 to 0.6680, the landslide IoU increases from 0.3381 to 0.3934, and the F1-score increases from 0.5054 to 0.5646.
- Abstract(参考訳): 長い期間にわたって形成された遺物地すべりは、再活性化の可能性を秘めており、危険な地質現象となっている。
地すべり検出の信頼性は,地すべり災害の効果的な監視・防止に有効であるが,長期にわたる自然進化と人的活動による外観の変化や,サンプルの認識・ラベル付けが困難である小データセット問題など,地すべりの高解像度リモートセンシング画像を用いたセマンティックセグメンテーションは,多くの課題に直面している。
これらの課題に対処するために、より効率的な特徴抽出と分離のために、マスク検索とインタラクティブ・フィーチャー・エンハンシング(MRIFE)と呼ばれるセマンティックセグメンテーションモデルを提案する。
具体的には,対象と背景を識別し,地すべりの意味的特徴を表現する能力を向上させるために,局所的に重要な特徴強化を施した対照的な学習・マスク再構築手法を提案する。
一方、デュアルブランチの対話型機能拡張アーキテクチャは、抽出した機能を強化し、視覚的あいまいさの問題に対処するために使用される。
自己蒸留学習を導入して、サンプル内およびサンプル間の特徴多様性を活用して、対照的な学習を行い、サンプル利用を改善し、モデルの収束を加速し、小型データセットの問題を効果的に解決する。
提案したMRIFEを実地すべりデータセットを用いて評価した結果,地すべり検出の性能は大幅に向上した。
セグメンテーションタスクでは、ベースラインに比べて精度が0.4226から0.5347に、結合上の平均交点(IoU)が0.6405から0.6680に、地すべりIoUが0.3381から0.3934に、F1スコアが0.5054から0.5646に増加する。
関連論文リスト
- YOLO-ELA: Efficient Local Attention Modeling for High-Performance Real-Time Insulator Defect Detection [0.0]
無人航空機からの絶縁体欠陥検出のための既存の検出方法は、複雑な背景や小さな物体と競合する。
本稿では,この課題に対処するため,新しい注目基盤アーキテクチャであるYOLO-ELAを提案する。
高分解能UAV画像による実験結果から,本手法は96.9% mAP0.5,リアルタイム検出速度74.63フレーム/秒を実現した。
論文 参考訳(メタデータ) (2024-10-15T16:00:01Z) - PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは,ポイントマスク自動エンコーダのグローバルな特徴表現を強化する,自己教師型学習フレームワークである。
PseudoNeg-MAE は ModelNet40 と ScanObjectNN のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - Improving Apple Object Detection with Occlusion-Enhanced Distillation [1.0049237739132246]
自然環境で成長するリンゴは、しばしば葉や枝から激しい視覚障害に直面する。
OED(Occlusion-Enhanced Distillation)と呼ばれる手法を導入し、隠蔽データセット上の意味的に整合した特徴の学習を規則化する。
提案手法は, 広範囲な比較実験により, 最先端技術よりも優れていた。
論文 参考訳(メタデータ) (2024-09-03T03:11:48Z) - Reinforcement Learning for SAR View Angle Inversion with Differentiable
SAR Renderer [7.112962861847319]
本研究の目的は,合成開口レーダ(SAR)画像における目標モデルによるレーダー視角の反転である。
エージェントと環境との相互作用を容易にするために、微分可能SARレンダリング(DSR)という電磁シミュレータが組み込まれている。
論文 参考訳(メタデータ) (2024-01-02T11:47:58Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Hyper-pixel-wise Contrastive Learning Augmented Segmentation Network for
Old Landslide Detection through Fusing High-Resolution Remote Sensing Images
and Digital Elevation Model Data [8.90916893521958]
提案したHPCL-Netは,Loess Plateau古地すべりデータセットを用いて評価した。
提案したHPCL-Netは,mIoUが0.620から0.651に増加し,Landslide IoUが0.334から0.394に改善され,F1scoreが0.501から0.565に向上した既存のモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2023-08-02T16:11:51Z) - An Iterative Classification and Semantic Segmentation Network for Old
Landslide Detection Using High-Resolution Remote Sensing Images [6.584865979714256]
イテレーティブな分類とセマンティックセグメンテーションネットワーク(ICSSN)が開発され、オブジェクトレベルとピクセルレベルの分類性能を大幅に向上させることができる。
オブジェクトレベルとピクセルレベルの両方の分類性能が改善されるように、反復的なトレーニング戦略をセマンティック空間に融合させる。
実験の結果, ICSSNは旧地すべり検出の分類精度とセグメンテーション精度を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-02-24T02:51:09Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain [88.7339322596758]
本論文では,空間画像と位相スペクトルを組み合わせ,顔の偽造のアップサンプリング成果をキャプチャするSPSL(Spatial-Phase Shallow Learning)法を提案する。
SPSLは、クロスデータセット評価における最先端性能とマルチクラス分類を実現し、単一データセット評価において同等の結果を得ることができる。
論文 参考訳(メタデータ) (2021-03-02T16:45:08Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z) - Generative Partial Visual-Tactile Fused Object Clustering [81.17645983141773]
オブジェクトクラスタリングのためのGenerative Partial Visual-Tactile Fused(GPVTF)フレームワークを提案する。
条件付きクロスモーダルクラスタリング生成逆ネットワークを開発し、一方のモダリティ条件を他方のモダリティ上で合成する。
最後に、擬似ラベルに基づく2つのKL分割損失を用いて、対応するモダリティ固有エンコーダを更新する。
論文 参考訳(メタデータ) (2020-12-28T02:37:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。