論文の概要: DeepMine-Mamba: Mitigating Information Dilution in Mamba-Based State Space Models for Document Image Binarization
- arxiv url: http://arxiv.org/abs/2606.08781v1
- Date: Sun, 07 Jun 2026 18:56:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.445153
- Title: DeepMine-Mamba: Mitigating Information Dilution in Mamba-Based State Space Models for Document Image Binarization
- Title(参考訳): DeepMine-Mamba:文書画像二元化のためのマンバ状態空間モデルにおける情報希釈の緩和
- Authors: Sheng-Wei Chan, Yung-Che Wang, Hsin-Jui Pan, Chia-Min Lin, Jen-Shiun Chiang,
- Abstract要約: 文書画像のバイナライゼーションは、薄い、壊れた、低コントラストのストロークを保存しながら、前景のテキストを劣化した背景から分離することを目的としている。
DeepMine-Mamba(ディープミネ・マンバ)は、ムンバをベースとした新しいアンチ・ダイゾリューション・ゲートを備えたバイナライゼーション・フレームワークである。
- 参考スコア(独自算出の注目度): 0.3262230127283452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Document image binarization aims to separate foreground text from degraded backgrounds while preserving thin, broken, and low-contrast strokes. Although deep learning methods have improved binarization performance, most existing approaches rely on convolutional, transformer-based, or generative architectures, while Mamba-based state space models remain largely unexplored for this task. In this work, we investigate Mamba-based feature propagation and observe that direct state-space propagation may dilute weak foreground cues during long-range modeling, especially faint ink traces, fragmented characters, and boundary-sensitive stroke details. To address this problem, we propose DeepMine-Mamba, a Mamba-based binarization framework equipped with a novel Anti-Dilution Gate that estimates propagation-induced feature changes and selectively restores stroke-sensitive local responses while suppressing unnecessary background enhancement. Experiments on DIBCO/H-DIBCO benchmarks under a strict leave-one-year-out protocol show that DeepMine-Mamba achieves competitive overall performance, with strong average FM and Fps across benchmark years. Ablation results further demonstrate that the Anti-Dilution Gate improves stroke preservation and reduces perceptually significant binarization errors.
- Abstract(参考訳): 文書画像のバイナライゼーションは、薄い、壊れた、低コントラストのストロークを保存しながら、前景のテキストを劣化した背景から分離することを目的としている。
深層学習法は双項化性能を改善しているが、既存のほとんどのアプローチは畳み込み、トランスフォーマーベース、もしくは生成的アーキテクチャに依存している。
本研究では,マンバを基盤とした特徴伝搬について検討し,長距離モデリングにおける状態空間の直接伝播は,特に暗暗のインク跡,断片化文字,境界感性ストローク細部などにおいて弱い前景の手がかりを希薄にすることができることを観察する。
この問題を解決するために,マンバを基盤とした二項化フレームワークであるDeepMine-Mambaを提案する。これは,伝搬誘起特徴変化を推定し,不必要な背景強調を抑えつつ,ストローク感応局所応答を選択的に復元する,新しいアンチディフュージョンゲートを備える。
DIBCO/H-DIBCOベンチマークの実験は、厳格な1年制のプロトコルの下で、DeepMine-Mambaはベンチマーク年数でFMとFpsが強いという、総合的なパフォーマンスを達成したことを示している。
アブレーションの結果、抗希釈ゲートは脳卒中保存を改善し、知覚的に有意な二項化誤差を減少させることが明らかとなった。
関連論文リスト
- AtrousMamaba: An Atrous-Window Scanning Visual State Space Model for Remote Sensing Change Detection [29.004019252136565]
本稿では,グローバルな文脈情報の統合と微粒な局所的詳細情報の抽出のバランスをとる新しいモデルであるAtrousMambaを提案する。
AWVSS(Atrous window scan visual state space)モジュールを活用することで、バイナリチェンジ検出(BCD)とセマンティックチェンジ検出(SCD)のためのエンド・ツー・エンドのMambaベースのフレームワークを設計する。
6つのベンチマークデータセットの実験結果は、提案フレームワークが既存のCNNベース、Transformerベース、Mambaベースの手法より優れていることを示している。
論文 参考訳(メタデータ) (2025-07-22T02:36:16Z) - OSDMamba: Enhancing Oil Spill Detection from Remote Sensing Images Using Selective State Space Model [8.370356454348554]
我々は,石油流出検出に特化して設計された最初のマンバ型アーキテクチャであるOSDMambaを提案する。
提案したOSDMambaは最先端のパフォーマンスを実現し、2つの公開データセットに対してOSDの8.9%と11.8%の改善を実現していることを示す。
論文 参考訳(メタデータ) (2025-06-22T12:07:44Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - EventMamba: Enhancing Spatio-Temporal Locality with State Space Models for Event-Based Video Reconstruction [66.84997711357101]
EventMambaは、イベントベースのビデオ再構成タスク用に設計された、特殊なモデルである。
EventMambaは、Transformerベースの方法と比較して、優れた視覚的品質を提供しながら、スピードを著しく向上させる。
論文 参考訳(メタデータ) (2025-03-25T14:46:45Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - MambaVT: Spatio-Temporal Contextual Modeling for robust RGB-T Tracking [51.28485682954006]
本研究では,マンバをベースとした純フレームワーク(MambaVT)を提案する。
具体的には、長距離クロスフレーム統合コンポーネントを考案し、ターゲットの外観変化にグローバルに適応する。
実験では、RGB-TトラッキングのためのMambaのビジョンの可能性が示され、MambaVTは4つの主要なベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-08-15T02:29:00Z) - MambaDepth: Enhancing Long-range Dependency for Self-Supervised Fine-Structured Monocular Depth Estimation [0.0]
MambaDepthは自己監督深度推定に適した多目的ネットワークである。
MambaDepthは、自己教師付き深さ推定におけるU-Netの有効性と、Mambaの高度な能力を組み合わせる。
MambaDepthは、Make3DやCityscapesといった他のデータセットよりも優れた一般化能力を示している。
論文 参考訳(メタデータ) (2024-06-06T22:08:48Z) - MambaUIE&SR: Unraveling the Ocean's Secrets with Only 2.8 GFLOPs [1.7648680700685022]
水中画像強調(UIE)技術は,光吸収・散乱による水中画像劣化問題に対処することを目的としている。
近年、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの手法が広く研究されている。
MambaUIEは、グローバルおよびローカル情報を効率的に合成することができ、非常に少数のパラメータを高い精度で保持する。
論文 参考訳(メタデータ) (2024-04-22T05:12:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。