論文の概要: MPCM-Net: Multi-scale network integrates partial attention convolution with Mamba for ground-based cloud image segmentation
- arxiv url: http://arxiv.org/abs/2511.11681v1
- Date: Wed, 12 Nov 2025 06:17:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:22.981953
- Title: MPCM-Net: Multi-scale network integrates partial attention convolution with Mamba for ground-based cloud image segmentation
- Title(参考訳): MPCM-Net:マルチスケールネットワークがMambaと部分的注意の畳み込みを統合した地上クラウドイメージセグメンテーション
- Authors: Penghui Niu, Jiashuai She, Taotao Cai, Yajuan Zhang, Ping Zhang, Junhua Gu, Jianxin Li,
- Abstract要約: 地上のクラウドイメージセグメンテーションは、太陽光発電の電力予測にとって重要な研究領域である。
本稿では,部分的注意の畳み込みをMambaアーキテクチャと統合し,セグメンテーション精度と計算効率を向上させるマルチスケールネットワークMPCM-Netを提案する。
コミュニティへの重要な貢献として、既存の公開データセットの限界を克服するために設計された、明確できめ細かいセグメンテーションベンチマークであるデータセットCSRCも導入、リリースしています。
- 参考スコア(独自算出の注目度): 13.137436418148896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ground-based cloud image segmentation is a critical research domain for photovoltaic power forecasting. Current deep learning approaches primarily focus on encoder-decoder architectural refinements. However, existing methodologies exhibit several limitations:(1)they rely on dilated convolutions for multi-scale context extraction, lacking the partial feature effectiveness and interoperability of inter-channel;(2)attention-based feature enhancement implementations neglect accuracy-throughput balance; and (3)the decoder modifications fail to establish global interdependencies among hierarchical local features, limiting inference efficiency. To address these challenges, we propose MPCM-Net, a Multi-scale network that integrates Partial attention Convolutions with Mamba architectures to enhance segmentation accuracy and computational efficiency. Specifically, the encoder incorporates MPAC, which comprises:(1)a MPC block with ParCM and ParSM that enables global spatial interaction across multi-scale cloud formations, and (2)a MPA block combining ParAM and ParSM to extract discriminative features with reduced computational complexity. On the decoder side, a M2B is employed to mitigate contextual loss through a SSHD that maintains linear complexity while enabling deep feature aggregation across spatial and scale dimensions. As a key contribution to the community, we also introduce and release a dataset CSRC, which is a clear-label, fine-grained segmentation benchmark designed to overcome the critical limitations of existing public datasets. Extensive experiments on CSRC demonstrate the superior performance of MPCM-Net over state-of-the-art methods, achieving an optimal balance between segmentation accuracy and inference speed. The dataset and source code will be available at https://github.com/she1110/CSRC.
- Abstract(参考訳): 地上のクラウドイメージセグメンテーションは、太陽光発電の電力予測にとって重要な研究領域である。
現在のディープラーニングアプローチは主にエンコーダ/デコーダアーキテクチャの改良に焦点を当てている。
しかし,既存の手法では,(1)チャネル間の部分的特徴効率と相互運用性に欠ける拡張畳み込み,(2)アテンションに基づく特徴強調実装は精度とスループットのバランスを無視する,(3)デコーダの修正は階層的局所特徴間の大域的相互依存性の確立に失敗し,推論効率が制限される,といった制限がある。
これらの課題に対処するために,部分的注意をMambaアーキテクチャと統合し,セグメント化精度と計算効率を向上させるマルチスケールネットワークMPCM-Netを提案する。
具体的には,(1)ParCMとParSMを併用したMPPCブロック,(2)ParAMとParSMを組み合わせたMPAブロックを用いて,計算複雑性を低減した識別的特徴の抽出を行う。
デコーダ側では、M2Bを用いて、空間次元とスケール次元の深い特徴集約を可能にしながら、線形複雑性を維持するSSHDによる文脈損失を軽減する。
コミュニティへの重要な貢献として、既存の公開データセットの限界を克服するために設計された、明確できめ細かいセグメンテーションベンチマークであるデータセットCSRCも導入、リリースしています。
CSRCにおける大規模実験は,MPCM-Netの最先端手法よりも優れた性能を示し,セグメンテーション精度と推論速度の最適バランスを実現する。
データセットとソースコードはhttps://github.com/she1110/CSRCで入手できる。
関連論文リスト
- A Lightweight Group Multiscale Bidirectional Interactive Network for Real-Time Steel Surface Defect Detection [15.140649886958945]
Group Multiscale Bidirectional Interactive (GMBI)モジュールは、マルチスケールの特徴抽出と相互作用を強化する。
SD-Saliency-900とNRSD-MNデータセットの実験は、GMBINetがGPUで1048 FPS、CPUで512解像度で16.53 FPSのリアルタイム速度で競合精度を提供することを示した。
論文 参考訳(メタデータ) (2025-08-22T13:58:35Z) - AMMNet: An Asymmetric Multi-Modal Network for Remote Sensing Semantic Segmentation [11.92569805944134]
Asymmetric Multi-Modal Network (AMMNet) は、RGB-DSM入力ペアに適した3つの設計で堅牢なセグメンテーションを実現する新しい非対称アーキテクチャである。
AMMNetは、計算とメモリの要求を低減しつつ、マルチモーダルネットワーク間の最先端のセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2025-07-22T02:07:19Z) - CFMD: Dynamic Cross-layer Feature Fusion for Salient Object Detection [7.262250906929891]
クロス層機能ピラミッドネットワーク(CFPN)は,多層機能融合と境界詳細保存において顕著な進歩を遂げている。
これらの課題に対処するために,CFMDという,2つの重要なイノベーションを取り入れた,新しいクロスレイヤ機能ピラミッドネットワークを提案する。
まず,現在最先端のMambaアーキテクチャを組み込んで動的重み分布機構を構築するコンテキスト認識機能集約モジュール(CFLMA)を設計する。
第2に,分解能回復時に空間的詳細を保存する適応動的アップサンプリングユニット(CFLMD)を導入する。
論文 参考訳(メタデータ) (2025-04-02T03:22:36Z) - Semi-supervised Semantic Segmentation with Multi-Constraint Consistency Learning [81.02648336552421]
本稿では,エンコーダとデコーダの段階的拡張を容易にするためのマルチ制約一貫性学習手法を提案する。
自己適応型特徴マスキングとノイズ注入は、デコーダの堅牢な学習のための特徴を摂動させるために、インスタンス固有の方法で設計されている。
Pascal VOC2012およびCityscapesデータセットの実験結果から,提案したMCCLが新たな最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2025-03-23T03:21:33Z) - Remote Sensing Image Segmentation Using Vision Mamba and Multi-Scale Multi-Frequency Feature Fusion [9.098711843118629]
本稿では、状態空間モデル(SSM)を導入し、視覚マンバ(CVMH-UNet)に基づく新しいハイブリッドセマンティックセマンティックネットワークを提案する。
本手法は、クロス2Dスキャン(CS2D)を用いて、複数の方向からグローバル情報をフルにキャプチャする、クロス走査型視覚状態空間ブロック(CVSSBlock)を設計する。
ローカル情報取得におけるビジョン・マンバ(VMamba)の制約を克服するために畳み込みニューラルネットワークのブランチを組み込むことにより、このアプローチはグローバル機能とローカル機能の両方の包括的な分析を促進する。
論文 参考訳(メタデータ) (2024-10-08T02:17:38Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - CSRNet: Cascaded Selective Resolution Network for Real-time Semantic
Segmentation [18.63596070055678]
本稿では,リアルタイムセグメンテーションの性能向上を図るために,光カスケード選択分解ネットワーク(CSRNet)を提案する。
提案するネットワークは,低解像度から高解像度までの特徴情報を統合した3段階セグメンテーションシステムを構築している。
2つのよく知られたデータセットの実験により、提案したCSRNetはリアルタイムセグメンテーションの性能を効果的に向上することを示した。
論文 参考訳(メタデータ) (2021-06-08T14:22:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。