論文の概要: Research on Improved U-net Based Remote Sensing Image Segmentation Algorithm
- arxiv url: http://arxiv.org/abs/2408.12672v1
- Date: Thu, 22 Aug 2024 18:25:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-26 16:48:16.029621
- Title: Research on Improved U-net Based Remote Sensing Image Segmentation Algorithm
- Title(参考訳): 改良されたU-netを用いたリモートセンシング画像分割アルゴリズムに関する研究
- Authors: Qiming Yang, Zixin Wang, Shinan Liu, Zizheng Li,
- Abstract要約: 我々は,U-NetにSimAMとCBAMのアテンション機構を導入することを提案する。
SimAMとCBAMモジュールを単独で追加すると、MIoUでは17.41%と12.23%が改善された。
2台を融合させた後、モデル性能は19.11%まで上昇した。
- 参考スコア(独自算出の注目度): 4.791191621092106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, although U-Net network has made significant progress in the field of image segmentation, it still faces performance bottlenecks in remote sensing image segmentation. In this paper, we innovatively propose to introduce SimAM and CBAM attention mechanism in U-Net, and the experimental results show that after adding SimAM and CBAM modules alone, the model improves 17.41% and 12.23% in MIoU, and the Mpa and Accuracy are also significantly improved. And after fusing the two,the model performance jumps up to 19.11% in MIoU, and the Mpa and Accuracy are also improved by 16.38% and 14.8% respectively, showing excellent segmentation accuracy and visual effect with strong generalization ability and robustness. This study opens up a new path for remote sensing image segmentation technology and has important reference value for algorithm selection and improvement.
- Abstract(参考訳): 近年、U-Netネットワークは画像セグメンテーションの分野で大きな進歩を遂げているが、リモートセンシング画像セグメンテーションでは依然としてパフォーマンスのボトルネックに直面している。
本稿では,U-NetにSimAMとCBAMのアテンション機構を導入することを革新的に提案し,SimAMとCBAMモジュールを単独で追加すると,MIoUのモデルが17.41%,12.23%向上し,Mpaと精度も大幅に向上したことを示す。
そして、この2つを融合させた後、モデル性能はMIoUで19.11%まで向上し、Mpaと精度もそれぞれ16.38%、14.8%向上し、高度な一般化能力と堅牢性を備えたセグメンテーション精度と視覚効果が向上した。
本研究では,リモートセンシング画像セグメンテーション技術の新たな道を開き,アルゴリズムの選択と改良のための重要な基準値を持つ。
関連論文リスト
- Sebica: Lightweight Spatial and Efficient Bidirectional Channel Attention Super Resolution Network [0.0]
SISR(Single Image Super-Resolution)は,低解像度画像の画質向上のための重要な技術である。
本稿では,空間的および効率的な双方向チャネルアテンション機構を組み込んだ軽量ネットワークSebicaを提案する。
セビカは高い復元品質を維持しながら計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2024-10-27T18:27:07Z) - Improved Unet brain tumor image segmentation based on GSConv module and ECA attention mechanism [0.0]
U-Netアーキテクチャに基づく深層学習アルゴリズムである脳腫瘍に対する医用画像分割法の改良モデルについて述べる。
従来のU-Netに基づいて,医療画像分割作業におけるモデルの性能向上を目的としたGSConvモジュールとECAアテンション機構を導入する。
論文 参考訳(メタデータ) (2024-09-20T16:35:19Z) - MOODv2: Masked Image Modeling for Out-of-Distribution Detection [57.17163962383442]
本研究は,様々なOODスコア関数を用いて,個別の事前学習課題について検討する。
当社のフレームワークMOODv2は,14.30%のAUROCをImageNetで95.68%に向上し,CIFAR-10で99.98%を達成した。
論文 参考訳(メタデータ) (2024-01-05T02:57:58Z) - Robustmix: Improving Robustness by Regularizing the Frequency Bias of Deep Nets [0.28961396489521907]
本稿では、低周波空間特性に基づいてネットワークを正規化して分類する、Robostmixと呼ばれるMixupの新たな拡張を提案する。
この種の正規化は Imagenet-C や Stylized Imagenet などのベンチマークで改善されている。
論文 参考訳(メタデータ) (2023-04-06T03:24:00Z) - Mixed Autoencoder for Self-supervised Visual Representation Learning [95.98114940999653]
Masked Autoencoder (MAE) は、画像パッチと再構成をランダムにマスキングすることで、様々な視覚タスクにおいて優れた性能を示す。
本稿では,MAEのミキシング強化について検討する。
論文 参考訳(メタデータ) (2023-03-30T05:19:43Z) - Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution [85.09413241502209]
本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-16T11:05:10Z) - Efficient Self-supervised Vision Transformers for Representation
Learning [86.57557009109411]
疎密な自己意識を持つマルチステージアーキテクチャは、モデリングの複雑さを著しく低減できることを示す。
そこで本研究では,モデルがよりきめ細かな領域依存を捕捉できるような,領域マッチングの事前学習タスクを提案する。
この2つの手法を組み合わせることで,ImageNet線形プローブ評価において,EsViTは81.3%のトップ1を達成した。
論文 参考訳(メタデータ) (2021-06-17T19:57:33Z) - When Vision Transformers Outperform ResNets without Pretraining or
Strong Data Augmentations [111.44860506703307]
Vision Transformer (ViTs) と既存のVisionNetsは、ハンドワイヤ機能やインダクティブスループットを汎用神経アーキテクチャに置き換えようとしている。
本稿では、損失幾何学のレンズからViTとRes-Mixersを解析し、トレーニングおよび推論時のモデルのデータ効率を改善することを目的とする。
最初の数層では、スペーサー活動ニューロンの頑健性が改善していることが示されている。
その結果、ViTsは、大規模な事前トレーニングや強力なデータ拡張なしに、ImageNet上でスクラッチからトレーニングした時に、同様のサイズと滑らかさのネットより優れています。
論文 参考訳(メタデータ) (2021-06-03T02:08:03Z) - Calibrated prediction in and out-of-domain for state-of-the-art saliency
modeling [17.739797071488212]
我々は、ImageNetのバックボーンを検査する大規模なトランスファー学習を行っている。
DeepGaze IIのVGG19バックボーンをResNet50機能に置き換えることで、サリエンシ予測のパフォーマンスを78%から85%に改善する。
複数のバックボーンを原則的に組み合わせることで、未知のデータセットに対する良好な信頼性キャリブレーションを実現することができることを示す。
論文 参考訳(メタデータ) (2021-05-26T09:59:56Z) - U-Net Based Architecture for an Improved Multiresolution Segmentation in
Medical Images [0.0]
我々は,マルチレゾリューション・フレームワークを用いた画像分割のための完全畳み込みニューラルネットワークを提案している。
提案したアーキテクチャ(mrU-Net)では、入力画像とそのダウンサンプルバージョンをネットワーク入力として使用した。
ネットワークを4つの異なる医療データセットでトレーニングし、テストしました。
論文 参考訳(メタデータ) (2020-07-16T10:19:01Z) - KiU-Net: Towards Accurate Segmentation of Biomedical Images using
Over-complete Representations [59.65174244047216]
本稿では,高次元にデータを投影するオーバーコンプリートアーキテクチャ(Ki-Net)を提案する。
このネットワークは、U-Netで拡張されると、小さな解剖学的ランドマークを分割する場合に大幅に改善される。
早期新生児の2次元超音波による脳解剖学的セグメント化の課題について検討した。
論文 参考訳(メタデータ) (2020-06-08T18:59:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。