論文の概要: M3SR: Multi-Scale Multi-Perceptual Mamba for Efficient Spectral Reconstruction
- arxiv url: http://arxiv.org/abs/2601.08293v1
- Date: Tue, 13 Jan 2026 07:33:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.101822
- Title: M3SR: Multi-Scale Multi-Perceptual Mamba for Efficient Spectral Reconstruction
- Title(参考訳): M3SR : 効率的なスペクトル再構成のためのマルチスケールマルチパーセプティカルマンバ
- Authors: Yuze Zhang, Lingjie Li, Qiuzhen Lin, Zhong Ming, Fei Yu, Victor C. M. Leung,
- Abstract要約: 本稿では,M3SRと呼ばれるスペクトル再構成タスクのためのマルチスケール・マルチパーセプティカル・マンバアーキテクチャを提案する。
具体的には,モデルが入力特徴を包括的に理解し解析する能力を高めるために,多視点融合ブロックを設計する。
- 参考スコア(独自算出の注目度): 47.507960245579106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Mamba architecture has been widely applied to various low-level vision tasks due to its exceptional adaptability and strong performance. Although the Mamba architecture has been adopted for spectral reconstruction, it still faces the following two challenges: (1) Single spatial perception limits the ability to fully understand and analyze hyperspectral images; (2) Single-scale feature extraction struggles to capture the complex structures and fine details present in hyperspectral images. To address these issues, we propose a multi-scale, multi-perceptual Mamba architecture for the spectral reconstruction task, called M3SR. Specifically, we design a multi-perceptual fusion block to enhance the ability of the model to comprehensively understand and analyze the input features. By integrating the multi-perceptual fusion block into a U-Net structure, M3SR can effectively extract and fuse global, intermediate, and local features, thereby enabling accurate reconstruction of hyperspectral images at multiple scales. Extensive quantitative and qualitative experiments demonstrate that the proposed M3SR outperforms existing state-of-the-art methods while incurring a lower computational cost.
- Abstract(参考訳): Mambaアーキテクチャは、その例外的な適応性と強力な性能のために、様々な低レベルの視覚タスクに広く適用されてきた。
Mambaアーキテクチャは、スペクトル再構成に採用されているが、(1)単一空間認識は、ハイパースペクトル画像を完全に理解し分析する能力を制限し、(2)単一スケールの特徴抽出は、ハイパースペクトル画像に存在する複雑な構造と細部を捉えるのに苦労する。
これらの課題に対処するため,M3SRと呼ばれるスペクトル再構成タスクのためのマルチスケール・マルチパーセプティカル・マンバアーキテクチャを提案する。
具体的には,モデルが入力特徴を包括的に理解し解析する能力を高めるために,多視点融合ブロックを設計する。
多知覚融合ブロックをU-Net構造に統合することにより、M3SRは、グローバル、中間、局所的な特徴を効果的に抽出し、融合し、複数のスケールでのハイパースペクトル画像の正確な再構成を可能にする。
大規模な定量的および定性的実験により、提案されたM3SRは、計算コストを下げつつ既存の最先端手法よりも優れていることを示した。
関連論文リスト
- MoRE: 3D Visual Geometry Reconstruction Meets Mixture-of-Experts [50.37005070020306]
MoREは、Mixture-of-Experts (MoE)アーキテクチャに基づいた、密集した3Dビジュアル基盤モデルである。
MoREは、幾何推定を安定させ、洗練する信頼に基づく深度補正モジュールを組み込んでいる。
高忠実な表面正規予測のために,高密度なセマンティック特徴とグローバルな3Dバックボーン表現を統合する。
論文 参考訳(メタデータ) (2025-10-31T06:54:27Z) - M2Restore: Mixture-of-Experts-based Mamba-CNN Fusion Framework for All-in-One Image Restoration [24.997494864875883]
M2Restoreは、効率的で堅牢なオールインワン画像復元のための新しいMixture-of-Experts (MoE)ベースのMamba-CNN融合フレームワークである。
タスク条件付きプロンプトをCLIP由来のセマンティックプリミティブと融合させる,CLIP誘導型MoEゲーティング機構を利用する。
我々は,CNNの局所的表現強度とMambaの長距離モデリング効率を融合したデュアルストリームアーキテクチャを設計する。
論文 参考訳(メタデータ) (2025-06-09T14:43:39Z) - An Efficient and Mixed Heterogeneous Model for Image Restoration [71.85124734060665]
現在の主流のアプローチは、CNN、Transformers、Mambasの3つのアーキテクチャパラダイムに基づいている。
混合構造融合に基づく効率的で汎用的なIRモデルであるRestorMixerを提案する。
論文 参考訳(メタデータ) (2025-04-15T08:19:12Z) - MSSFC-Net:Enhancing Building Interpretation with Multi-Scale Spatial-Spectral Feature Collaboration [4.480146005071275]
リモートセンシング画像からの解釈を構築するには、主に2つの基本的なタスクがある。
リモートセンシング画像における共同ビルディング抽出と変更検出のためのマルチスケール空間スペクトル特徴協調型デュアルタスクネットワーク(MSSFC-Net)を提案する。
論文 参考訳(メタデータ) (2025-04-01T13:10:23Z) - M3-AGIQA: Multimodal, Multi-Round, Multi-Aspect AI-Generated Image Quality Assessment [65.3860007085689]
M3-AGIQAは、AI生成画像のより人間らしく総合的な評価を可能にする包括的なフレームワークである。
モデル出力を人間の判断とより密接に整合させることで、M3-AGIQAは堅牢で解釈可能な品質スコアを提供する。
論文 参考訳(メタデータ) (2025-02-21T03:05:45Z) - Detail Matters: Mamba-Inspired Joint Unfolding Network for Snapshot Spectral Compressive Imaging [40.80197280147993]
本研究では,HSI再建の非線形および不適切な特徴を克服するために,マンバインスパイアされたジョイント・アンフォールディング・ネットワーク(MiJUN)を提案する。
本稿では,初期最適化段階への依存を減らすために,高速化された展開ネットワーク方式を提案する。
テンソルモード-$k$展開をMambaネットワークに統合することにより,Mambaによる走査戦略を洗練する。
論文 参考訳(メタデータ) (2025-01-02T13:56:23Z) - MLLA-UNet: Mamba-like Linear Attention in an Efficient U-Shape Model for Medical Image Segmentation [6.578088710294546]
従来のセグメンテーション手法は、高い解剖学的変動、ぼやけた組織の境界、低い臓器コントラスト、ノイズといった課題に対処するのに苦労する。
MLLA-UNet(Mamba-like Linear Attention UNet)を提案する。
MLLA-UNetは、FLARE22、AMOS CT、ACDCに限らず、24の異なるセグメンテーションタスクを持つ6つの挑戦的なデータセットに対して、平均88.32%の最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2024-10-31T08:54:23Z) - IRSRMamba: Infrared Image Super-Resolution via Mamba-based Wavelet Transform Feature Modulation Model [7.842507196763463]
IRSRMambaはマルチスケール適応のためのウェーブレット変換特徴変調を統合する新しいフレームワークである。
IRSRMambaはPSNR、SSIM、知覚品質において最先端の手法より優れている。
この研究は、高忠実度赤外線画像強調のための有望な方向として、Mambaベースのアーキテクチャを確立する。
論文 参考訳(メタデータ) (2024-05-16T07:49:24Z) - Transformer-empowered Multi-scale Contextual Matching and Aggregation
for Multi-contrast MRI Super-resolution [55.52779466954026]
マルチコントラスト・スーパーレゾリューション (SR) 再構成により, SR画像の高画質化が期待できる。
既存の手法では、これらの特徴をマッチングし、融合させる効果的なメカニズムが欠如している。
そこで本稿では,トランスフォーマーを利用したマルチスケールコンテキストマッチングとアグリゲーション技術を開発することで,これらの問題を解決する新しいネットワークを提案する。
論文 参考訳(メタデータ) (2022-03-26T01:42:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。