Fugu-MT 論文翻訳(概要): UNetMamba: Efficient UNet-Like Mamba for Semantic Segmentation of High-Resolution Remote Sensing Images

論文の概要: UNetMamba: Efficient UNet-Like Mamba for Semantic Segmentation of High-Resolution Remote Sensing Images

arxiv url: http://arxiv.org/abs/2408.11545v1
Date: Wed, 21 Aug 2024 11:53:53 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-22 17:17:15.208379
Title: UNetMamba: Efficient UNet-Like Mamba for Semantic Segmentation of High-Resolution Remote Sensing Images
Title（参考訳）: UNetMamba:高解像度リモートセンシング画像のセマンティックセグメンテーションのための効率的なUNetライクなマンバ
Authors: Enze Zhu, Zhan Chen, Dingkai Wang, Hanru Shi, Xiaoxuan Liu, Lei Wang,
Abstract要約: 本稿では,新しいマンバに基づくセマンティックセグメンテーションモデルであるUNetMambaを提案する。これは、高解像度画像内の複雑な情報を効率的にデコードできるMamba Decoder (MSD) と、ローカル・スーパービジョン・モジュール (LSM) を組み込んでいる。 UNet-Mambaは、mIoUがLoveDAで0.87%増加し、ISPRS Vaihingenで0.36%向上した。
参考スコア（独自算出の注目度）: 4.9571046933387395
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The semantic segmentation of high-resolution remote sensing images plays a crucial role in downstream applications such as urban planning and disaster assessment. However, existing Transformer-based methods suffer from the constraint between accuracy and efficiency. To overcome this dilemma, we propose UNetMamba, a novel Mamba-based semantic segmentation model. It incorporates a Mamba Segmentation Decoder (MSD) that can efficiently decode the complex information within high-resolution images, and a Local Supervision Module (LSM), which is train-only but can significantly enhance the perception of local contents. Extensive experiments demonstrate that UNet-Mamba outperforms the state-of-the-art methods with the mIoU increased by 0.87% on LoveDA and 0.36% on ISPRS Vaihingen, while achieving high efficiency through light weight, low memory footprint and low computational cost. The source code will soon be publicly available at https://github.com/EnzeZhu2001/UNetMamba.
Abstract（参考訳）: 高解像度リモートセンシング画像のセマンティックセグメンテーションは、都市計画や災害評価といった下流の応用において重要な役割を担っている。しかし、既存のTransformerベースの手法は精度と効率の制約に悩まされている。このジレンマを克服するために,新しいマンバに基づくセマンティックセグメンテーションモデルであるUNetMambaを提案する。高解像度画像内の複雑な情報を効率的にデコードできるMamba Segmentation Decoder (MSD) と、列車専用だがローカルコンテンツの認識を著しく向上できるLocal Supervision Module (LSM) が組み込まれている。 UNet-Mambaは、mIoUがLoveDAで0.87%、ISPRS Vaihingenで0.36%増加し、軽量化、メモリフットプリントの低さ、計算コストで高い効率を実現している。ソースコードは間もなくhttps://github.com/EnzeZhu 2001/UNetMamba.comで公開される。

関連論文リスト

ConMamba: Contrastive Vision Mamba for Plant Disease Detection [3.60543005189868]
植物病検出(PDD)は精密農業の重要な側面である。既存のディープラーニング手法は、広範に注釈付けされたデータセットに依存していることが多い。 PDD用に特別に設計された新しいフレームワークであるConMambaを提案する。
論文参考訳（メタデータ） (2025-06-03T03:01:38Z)
ECP-Mamba: An Efficient Multi-scale Self-supervised Contrastive Learning Method with State Space Model for PolSAR Image Classification [42.02105017671516]
本稿では,マルチスケールの自己教師型コントラスト学習と状態空間モデル(SSM)のバックボーンを組み合わせた効率的なフレームワークであるECP-Mambaを提案する。 Flevoland 1989データセットでは、ECP-Mambaは99.70%、平均精度99.64%、Kappa係数99.62e-2で最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (2025-06-01T14:52:54Z)
DefMamba: Deformable Visual State Space Model [65.50381013020248]
我々はDefMambaと呼ばれる新しい視覚基盤モデルを提案する。変形性スキャン(DS)戦略を組み合わせることで、画像構造を学習し、オブジェクトの細部の変化を検出する能力を大幅に向上する。多くの実験により、DefMambaは様々な視覚的タスクで最先端のパフォーマンスを達成することが示されている。
論文参考訳（メタデータ） (2025-04-08T08:22:54Z)
Binarized Mamba-Transformer for Lightweight Quad Bayer HybridEVS Demosaicing [21.15110217419682]
本稿では,HybridEVS RAW画像の効率的な復調を実現するために,軽量なマンバ型バイナリニューラルネットワークを提案する。 Bi-Mambaは全ての射影をバイナライズし、コアSelective Scanを完全精度で保持する。我々は,BMTNetの性能と計算効率の両面において,定量的かつ定性的な実験を行い,BMTNetの有効性を実証した。
論文参考訳（メタデータ） (2025-03-20T13:32:27Z)
MobileMamba: Lightweight Multi-Receptive Visual Mamba Network [51.33486891724516]
従来の軽量モデルの研究は、主にCNNとTransformerベースの設計に重点を置いてきた。効率と性能のバランスをとるMobileMambaフレームワークを提案する。 MobileMambaはTop-1で83.6%を達成し、既存の最先端の手法を上回っている。
論文参考訳（メタデータ） (2024-11-24T18:01:05Z)
LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba [54.85262314960038]
局所的意図的マンバブロックは、大域的コンテキストと局所的詳細の両方を線形複雑性でキャプチャする。このモデルは, 256x256の解像度で, ImageNet上の様々なモデルスケールでDiTの性能を上回り, 優れたスケーラビリティを示す。 ImageNet 256x256 と 512x512 の最先端拡散モデルと比較すると,最大 62% GFLOP の削減など,我々の最大のモデルには顕著な利点がある。
論文参考訳（メタデータ） (2024-08-05T16:39:39Z)
Mamba-based Light Field Super-Resolution with Efficient Subspace Scanning [48.99361249764921]
4次元光場(LF)超解像において,トランスフォーマー法は優れた性能を示した。しかし、その二次的な複雑さは、高解像度の4D入力の効率的な処理を妨げる。我々は,効率的な部分空間走査戦略を設計し,マンバをベースとした光場超解法 MLFSR を提案する。
論文参考訳（メタデータ） (2024-06-23T11:28:08Z)
DiM: Diffusion Mamba for Efficient High-Resolution Image Synthesis [56.849285913695184]
Diffusion Mamba (DiM) は高分解能画像合成のためのシーケンスモデルである。 DiMアーキテクチャは高解像度画像の推論時間効率を実現する。実験は、我々のDiMの有効性と効率を実証する。
論文参考訳（メタデータ） (2024-05-23T06:53:18Z)
MambaUIE&SR: Unraveling the Ocean's Secrets with Only 2.8 GFLOPs [1.7648680700685022]
水中画像強調(UIE)技術は,光吸収・散乱による水中画像劣化問題に対処することを目的としている。近年、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの手法が広く研究されている。 MambaUIEは、グローバルおよびローカル情報を効率的に合成することができ、非常に少数のパラメータを高い精度で保持する。
論文参考訳（メタデータ） (2024-04-22T05:12:11Z)
LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image Segmentation [10.563051220050035]
本稿では,軽量なフレームワークとして,Mamba と UNet を統合した Lightweight Mamba UNet (LightM-UNet) を紹介する。特に、LightM-UNetはResidual Vision Mamba Layerを純粋なMamba方式で利用し、深い意味的特徴を抽出し、長距離空間依存をモデル化する。 2つの実世界の2D/3Dデータセットで実施された実験は、LightM-UNetが既存の最先端の文献を上回っていることを示している。
論文参考訳（メタデータ） (2024-03-08T12:07:42Z)
MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection [72.46396769642787]
ネスト構造であるMamba-in-Mamba(MiM-ISTD)を開発した。 MiM-ISTDはSOTA法より8倍高速で、2048×2048$のイメージでテストすると、GPUメモリ使用率を62.2$%削減する。
論文参考訳（メタデータ） (2024-03-04T15:57:29Z)
Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation [21.1787366866505]
Mamba-UNetは,医療画像のセグメンテーションにおいてU-Netとマンバの能力を相乗化する新しいアーキテクチャである。 Mamba-UNetは純粋にVisual Mamba(VMamba)ベースのエンコーダデコーダ構造を採用しており、ネットワークのさまざまなスケールで空間情報を保存するためにスキップ接続を注入している。
論文参考訳（メタデータ） (2024-02-07T18:33:04Z)
Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining [85.08169822181685]
本稿では,医療画像のセグメンテーションに特化して設計された新しいマンバモデルSwin-UMambaを紹介する。 Swin-UMamba は CNN や ViT,最新の Mamba ベースのモデルと比較して,優れたパフォーマンスを示している。
論文参考訳（メタデータ） (2024-02-05T18:58:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。