Fugu-MT 論文翻訳(概要): A Mask Attention Interaction and Scale Enhancement Network for SAR Ship Instance Segmentation

論文の概要: A Mask Attention Interaction and Scale Enhancement Network for SAR Ship Instance Segmentation

arxiv url: http://arxiv.org/abs/2207.03912v1
Date: Fri, 8 Jul 2022 14:04:04 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-11 16:56:24.866231
Title: A Mask Attention Interaction and Scale Enhancement Network for SAR Ship Instance Segmentation
Title（参考訳）: SAR船体セグメンテーションのためのマスク注意相互作用とスケール拡張ネットワーク
Authors: Tianwen Zhang, and Xiaoling Zhang
Abstract要約: 本稿では,SAR船のインスタンスセグメンテーションのためのマスクアテンションインタラクションとスケールエンハンスメントネットワーク(MAI-SE-Net)を提案する。 MAIは、アトラス空間ピラミドプーリング(ASPP)を用いてマルチレゾリューション機能を再応答し、非局所ブロック(NLB)で長距離空間依存性をモデル化し、結合シャッフルアテンションブロック(CSAB)で相互作用の利点を向上させる。
参考スコア（独自算出の注目度）: 4.232332676611087
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Most of existing synthetic aperture radar (SAR) ship in-stance segmentation models do not achieve mask interac-tion or offer limited interaction performance. Besides, their multi-scale ship instance segmentation performance is moderate especially for small ships. To solve these problems, we propose a mask attention interaction and scale enhancement network (MAI-SE-Net) for SAR ship instance segmentation. MAI uses an atrous spatial pyra-mid pooling (ASPP) to gain multi-resolution feature re-sponses, a non-local block (NLB) to model long-range spa-tial dependencies, and a concatenation shuffle attention block (CSAB) to improve interaction benefits. SE uses a content-aware reassembly of features block (CARAFEB) to generate an extra pyramid bottom-level to boost small ship performance, a feature balance operation (FBO) to improve scale feature description, and a global context block (GCB) to refine features. Experimental results on two public SSDD and HRSID datasets reveal that MAI-SE-Net outperforms the other nine competitive models, better than the suboptimal model by 4.7% detec-tion AP and 3.4% segmentation AP on SSDD and by 3.0% detection AP and 2.4% segmentation AP on HRSID.
Abstract（参考訳）: 既存の合成開口レーダ (sar) の船内セグメンテーションモデルのほとんどはマスクの相互接続を達成せず、限定的な相互作用性能を提供する。さらに、特に小型船では、マルチスケールのインスタンスセグメンテーション性能が適度である。これらの問題を解決するために,SAR船のインスタンスセグメンテーションのためのマスクアテンションインタラクションとスケールエンハンスメントネットワーク(MAI-SE-Net)を提案する。 MAIは、アトラス空間ピラミドプーリング(ASPP)を用いてマルチレゾリューション機能を再応答し、非局所ブロック(NLB)で長距離空間依存性をモデル化し、結合シャッフルアテンションブロック(CSAB)で相互作用の利点を向上させる。 seでは、機能ブロック(carafeb)のコンテントアウェア再組み立てを使用して、小さな船のパフォーマンスを高めるためにピラミッドのボトムレベル、スケール機能記述を改善する機能バランス操作(fbo)、機能を洗練するためのグローバルコンテキストブロック(gcb)を生成する。 MAI-SE-Netは、SSDD上の4.7%のdetec-tion APと3.4%のセグメンテーションAPと、HRSID上の3.0%の検出APと2.4%のセグメンテーションAPで、他の9つの競争モデルよりも優れていた。

関連論文リスト

Cross-Layer Feature Self-Attention Module for Multi-Scale Object Detection [14.148258708632211]
Cross-Layer Feature Self-Attention Module (CFSAM) CFSAMは、マルチスケールの機能マップ内のローカルとグローバルの両方の依存関係をホリスティックにモデル化する。 SSD300フレームワークに統合されると、CFSAMは検出性能を大幅に向上する。
論文参考訳（メタデータ） (2025-10-16T14:25:21Z)
O2Former:Direction-Aware and Multi-Scale Query Enhancement for SAR Ship Instance Segmentation [0.3611754783778107]
合成開口レーダ(SAR)画像における船舶の船体セグメンテーションは、海上監視、環境分析、国家安全保障などの用途において重要である。 SAR船体画像は、スケール変動、物体密度、ファジィターゲット境界などの課題を示す。我々は,SAR画像の構造的特徴を十分に活用して,Mask2Formerを拡張したカスタマイズされたインスタンスセグメンテーションフレームワークであるO2Formerを提案する。
論文参考訳（メタデータ） (2025-06-13T16:06:51Z)
Dynamic Cross-Modal Feature Interaction Network for Hyperspectral and LiDAR Data Classification [66.59320112015556]
ハイパースペクトル画像(HSI)とLiDARデータ共同分類は難しい課題である。 DCMNet(Dynamic Cross-Modal Feature Interaction Network)を提案する。 BSAB(Bilinear Spatial Attention Block)、BCAB(Bilinear Channel Attention Block)、ICB(Integration Convolutional Block)の3つの機能相互作用ブロックを導入している。
論文参考訳（メタデータ） (2025-03-10T05:50:13Z)
Enhanced Semantic Segmentation for Large-Scale and Imbalanced Point Clouds [6.253217784798542]
小型の物体は、発生頻度が低いため、アンダーサンプリングや誤分類される傾向がある。本稿では,大規模かつサンプル不均衡なクラウドシーンを対象としたマルチラテラルカスケーディングネットワーク(MCNet)を提案する。
論文参考訳（メタデータ） (2024-09-21T02:23:01Z)
PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。 PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。 PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文参考訳（メタデータ） (2024-08-26T19:43:01Z)
PosSAM: Panoptic Open-vocabulary Segment Anything [58.72494640363136]
PosSAMはオープン・ボキャブラリ・パノプティ・セグメンテーション・モデルであり、Segment Anything Model(SAM)の強みを、エンドツーエンドのフレームワークで視覚ネイティブのCLIPモデルと統合する。本稿では,マスクの質を適応的に向上し,各画像の推論中にオープン語彙分類の性能を高めるマスク対応選択組立アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-03-14T17:55:03Z)
Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of Multiclass Defect Segmentation [1.487252325779766]
提案アーキテクチャであるDual Attentive U-Net with Feature Infusion (DAU-FI Net)はセマンティックセグメンテーションにおける課題に対処する。 DAU-FI Netは、複数スケールの空間チャネルアテンション機構と特徴注入を統合し、オブジェクトのローカライゼーションの精度を高める。挑戦的な下水道管と、欠陥データセットと、DAU-FI Netの能力を検証したベンチマークデータセットに関する総合的な実験。
論文参考訳（メタデータ） (2023-12-21T17:23:49Z)
Salient Object Detection in Optical Remote Sensing Images Driven by Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。 3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文参考訳（メタデータ） (2023-09-15T07:14:43Z)
UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。 Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文参考訳（メタデータ） (2022-12-08T18:59:57Z)
MALUNet: A Multi-Attention and Light-weight UNet for Skin Lesion Segmentation [13.456935850832565]
そこで本研究では,皮膚病変のセグメンテーションにおいて,パラメータと計算複雑性の最小コストで競合性能を実現する軽量モデルを提案する。我々は、4つのモジュールをU字型アーキテクチャと組み合わせ、MALUNetと呼ばれる軽量な医用画像分割モデルを得る。 UNetと比較して、我々のモデルはmIoUとDSCのメトリクスをそれぞれ2.39%、1.49%改善し、パラメータ数と計算複雑性の44倍と166倍削減した。
論文参考訳（メタデータ） (2022-11-03T13:19:22Z)
Semantic Attention and Scale Complementary Network for Instance Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。 SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。 SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文参考訳（メタデータ） (2021-07-25T08:53:59Z)
EPSANet: An Efficient Pyramid Split Attention Block on Convolutional Neural Network [41.994043409345956]
本研究では, ピラミッド分割注意(PSA)モジュールという, 軽量かつ効果的に注目する手法を提案する。 ResNetのボトルネックブロックにおける3x3畳み込みをPSAモジュールに置き換えることで、EPSA(Efficient Pyramid Split Attention)と呼ばれる新しい表現ブロックを得る。 EPSAブロックは、確立されたバックボーンネットワークにプラグイン・アンド・プレイコンポーネントとして簡単に追加でき、モデル性能の大幅な改善が達成できる。
論文参考訳（メタデータ） (2021-05-30T07:26:41Z)
A^2-FPN: Attention Aggregation based Feature Pyramid Network for Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。 A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文参考訳（メタデータ） (2021-05-07T11:51:08Z)
SA-Net: Shuffle Attention for Deep Convolutional Neural Networks [0.0]
この問題に対処するために,効率的なShuffle Attention (SA) モジュールを提案する。例えば、バックボーンのResNet50に対するSAのパラメータと計算は、それぞれ300対25.56Mと2.76e-3 GFLOPs対4.12 GFLOPである。
論文参考訳（メタデータ） (2021-01-30T15:23:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。