論文の概要: PathMamba: A Hybrid Mamba-Transformer for Topologically Coherent Road Segmentation in Satellite Imagery
- arxiv url: http://arxiv.org/abs/2511.21298v1
- Date: Wed, 26 Nov 2025 11:42:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.077674
- Title: PathMamba: A Hybrid Mamba-Transformer for Topologically Coherent Road Segmentation in Satellite Imagery
- Title(参考訳): PathMamba:衛星画像におけるトポロジカルコヒーレントな道路分割のためのハイブリッドマンバ変換器
- Authors: Jules Decaestecker, Nicolas Vigne,
- Abstract要約: 本稿では,MambaのシーケンシャルモデリングとTransformerのグローバル推論を統合した,新しいハイブリッドアーキテクチャPathMambaを紹介する。
DeepGlobe Road extract と Massachusetts Roads のデータセットに関する我々の実験は、PathMamba が新しい最先端技術を構築していることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Achieving both high accuracy and topological continuity in road segmentation from satellite imagery is a critical goal for applications ranging from urban planning to disaster response. State-of-the-art methods often rely on Vision Transformers, which excel at capturing global context, yet their quadratic complexity is a significant barrier to efficient deployment, particularly for on-board processing in resource-constrained platforms. In contrast, emerging State Space Models like Mamba offer linear-time efficiency and are inherently suited to modeling long, continuous structures. We posit that these architectures have complementary strengths. To this end, we introduce PathMamba, a novel hybrid architecture that integrates Mamba's sequential modeling with the Transformer's global reasoning. Our design strategically uses Mamba blocks to trace the continuous nature of road networks, preserving topological structure, while integrating Transformer blocks to refine features with global context. This approach yields topologically superior segmentation maps without the prohibitive scaling costs of pure attention-based models. Our experiments on the DeepGlobe Road Extraction and Massachusetts Roads datasets demonstrate that PathMamba sets a new state-of-the-art. Notably, it significantly improves topological continuity, as measured by the APLS metric, setting a new benchmark while remaining computationally competitive.
- Abstract(参考訳): 衛星画像からの道路区分の高精度化とトポロジカル連続性を両立させることは,都市計画から災害対応に至るまでのアプリケーションにとって重要な目標である。
最先端の手法はしばしばビジョントランスフォーマー(Vision Transformer)に依存しており、グローバルなコンテキストを捉えるのに優れていますが、その二次的な複雑さは、特にリソース制約のあるプラットフォームでのオンボード処理において、効率的なデプロイメントにおいて重要な障壁となります。
対照的に、Mambaのような新しいステートスペースモデルは線形時間効率を提供し、本質的に長い連続的な構造をモデル化するのに適している。
これらのアーキテクチャは相補的な強みを持っていると仮定する。
この目的のために我々は,MambaのシーケンシャルなモデリングとTransformerのグローバルな推論を統合する,新しいハイブリッドアーキテクチャPathMambaを紹介する。
我々の設計ではマンバブロックを戦略的に利用して道路網の連続的な性質を辿り、トポロジカルな構造を保ちつつ、トランスフォーマーブロックをグローバルな文脈で特徴を洗練させる。
このアプローチは、純粋注意に基づくモデルのスケーリングの禁止コストを伴わずに、位相的に優れたセグメンテーション写像が得られる。
DeepGlobe Road extract と Massachusetts Roads のデータセットに関する我々の実験は、PathMamba が新しい最先端技術を構築していることを示している。
特に、APLS測定値によって測定されたトポロジカルな連続性を著しく改善し、計算上の競争力を維持しながら新しいベンチマークを設定する。
関連論文リスト
- GTR-Mamba: Geometry-to-Tangent Routing for Hyperbolic POI Recommendation [19.900436178093027]
GTR-Mambaはクロスマニフォールドコンディショニングとルーティングのための新しいフレームワークである。
これは、次のPOIレコメンデーションにおいて、最先端のベースラインモデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-10-27T02:56:08Z) - Exploring Non-Local Spatial-Angular Correlations with a Hybrid Mamba-Transformer Framework for Light Field Super-Resolution [68.54692184478462]
マンバ法は光画像超解像の計算コストと性能を最適化する大きな可能性を示している。
本稿では,より効率的かつ正確な特徴抽出を実現するために,Subspace Simple Mamba Block (SSMB) を設計したSubspace Simple Scanning (Sub-SS) 戦略を提案する。
また,空間角・異質情報の保存における状態空間の制限に対処する二段階モデリング手法を提案する。
論文 参考訳(メタデータ) (2025-09-05T05:50:38Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - SaMam: Style-aware State Space Model for Arbitrary Image Style Transfer [41.09041735653436]
私たちはSaMamと呼ばれるMambaベースのスタイル転送フレームワークを開発した。
具体的には、コンテンツやスタイル情報を効率的に抽出するマンバエンコーダを設計する。
既存のSSMの局所的画素分割やチャネル冗長性,空間的不連続性といった問題に対処するために,局所的拡張とジグザグスキャンを導入する。
論文 参考訳(メタデータ) (2025-03-20T08:18:27Z) - TransMamba: Fast Universal Architecture Adaption from Transformers to Mamba [66.80624029365448]
本稿では,Transformer事前学習知識の再利用を容易にするクロスアーキテクチャな知識伝達パラダイムであるTransMambaを提案する。
本稿では,マンバをベースとしたモデルのトレーニングを高速化する2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-21T01:22:01Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - MambaVT: Spatio-Temporal Contextual Modeling for robust RGB-T Tracking [51.28485682954006]
本研究では,マンバをベースとした純フレームワーク(MambaVT)を提案する。
具体的には、長距離クロスフレーム統合コンポーネントを考案し、ターゲットの外観変化にグローバルに適応する。
実験では、RGB-TトラッキングのためのMambaのビジョンの可能性が示され、MambaVTは4つの主要なベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-08-15T02:29:00Z) - MxT: Mamba x Transformer for Image Inpainting [11.447968918063335]
Image Inpaintingは、セマンティック・コヒーレントなコンテンツで画像の欠落した領域や破損した領域を復元することを目的としている。
本稿では,Mambaと変換器を組み合わせたHybrid Module (HM) を相乗的に構成したMxTを提案する。
我々のHMは、ピクセルレベルとパッチレベルの二重レベルの相互作用学習を容易にし、高品質で文脈的精度で画像を再構成するモデルを大幅に強化する。
論文 参考訳(メタデータ) (2024-07-23T02:21:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。