論文の概要: Topology-aware Mamba for Crack Segmentation in Structures
- arxiv url: http://arxiv.org/abs/2410.19894v1
- Date: Fri, 25 Oct 2024 15:17:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:22:53.784318
- Title: Topology-aware Mamba for Crack Segmentation in Structures
- Title(参考訳): 構造物のひび割れ分離のためのトポロジー対応型マンバ
- Authors: Xin Zuo, Yu Sheng, Jifeng Shen, Yongwei Shan,
- Abstract要約: マンバをベースとしたモデルであるCrackMambaは、インフラストラクチャの構造的健全性を監視するために、効率的で正確なクラックセグメンテーションのために設計されている。
CrackMambaは、VMambaV2をエンコーダと新しいデコーダとして、トレーニング済みのImageNet-1k重みで利用することで、これらの課題に対処している。
実験により、CrackMambaはCrackSeg9kおよびSwerCrackデータセット上での最先端(SOTA)パフォーマンスを実現し、網膜血管セグメンテーションデータセットCHASEunderlineDB1上での競合性能を示す。
- 参考スコア(独自算出の注目度): 5.9184143707401775
- License:
- Abstract: CrackMamba, a Mamba-based model, is designed for efficient and accurate crack segmentation for monitoring the structural health of infrastructure. Traditional Convolutional Neural Network (CNN) models struggle with limited receptive fields, and while Vision Transformers (ViT) improve segmentation accuracy, they are computationally intensive. CrackMamba addresses these challenges by utilizing the VMambaV2 with pre-trained ImageNet-1k weights as the encoder and a newly designed decoder for better performance. To handle the random and complex nature of crack development, a Snake Scan module is proposed to reshape crack feature sequences, enhancing feature extraction. Additionally, the three-branch Snake Conv VSS (SCVSS) block is proposed to target cracks more effectively. Experiments show that CrackMamba achieves state-of-the-art (SOTA) performance on the CrackSeg9k and SewerCrack datasets, and demonstrates competitive performance on the retinal vessel segmentation dataset CHASE\underline{~}DB1, highlighting its generalization capability. The code is publicly available at: {https://github.com/shengyu27/CrackMamba.}
- Abstract(参考訳): マンバをベースとしたモデルであるCrackMambaは、インフラストラクチャの構造的健全性を監視するために、効率的で正確なクラックセグメンテーションのために設計されている。
従来の畳み込みニューラルネットワーク(CNN)モデルは、限られた受容場に苦しむが、視覚変換器(ViT)はセグメンテーションの精度を向上するが、計算集約的である。
CrackMambaは、VMambaV2をエンコーダと新しいデコーダとして、トレーニング済みのImageNet-1k重みで利用することで、これらの課題に対処している。
Snake Scanモジュールは、ひび割れ発生のランダムで複雑な性質に対処するため、ひび割れの特徴列を再構成し、特徴抽出を強化する。
さらに, 3分岐のSnake Conv VSS(SCVSS)ブロックは, ひび割れをより効果的に狙うために提案されている。
実験の結果、CrackMambaはCrackSeg9kおよびSwerCrackデータセット上での最先端(SOTA)パフォーマンスを実現し、網膜血管セグメンテーションデータセットCHASE\underline{~}DB1上での競合性能を示し、その一般化能力を強調している。
コードは、https://github.com/shengyu27/CrackMamba.comで公開されている。
※
関連論文リスト
- Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。
これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。
提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文 参考訳(メタデータ) (2024-09-04T16:47:16Z) - Mamba meets crack segmentation [0.18416014644193066]
亀裂はインフラに安全リスクをもたらし、見落としられない。
CNNはグローバルなモデリング能力に欠けており、ひび割れの特徴全体の表現を妨げる。
本研究では,マンバの特徴を分解する表現能力について検討する。
論文 参考訳(メタデータ) (2024-07-22T15:21:35Z) - CAMS: Convolution and Attention-Free Mamba-based Cardiac Image Segmentation [0.508267104652645]
畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの自己アテンションモデルは、医療画像セグメンテーションの標準となっている。
本稿では,CAMS-Netという,コンボリューションと自己意図のないマンバに基づくセマンティックネットワークを提案する。
我々のモデルは,CMRおよびM&Ms-2カードセグメンテーションデータセットにおける既存の最先端CNN,自己注意,およびMambaベースの手法よりも優れている。
論文 参考訳(メタデータ) (2024-06-09T13:53:05Z) - MambaVC: Learned Visual Compression with Selective State Spaces [74.29217829932895]
本稿では,SSMに基づくシンプルで強力で効率的な圧縮ネットワークであるMambaVCを紹介する。
MambaVC は2次元選択的走査 (2DSS) モジュールを備えた視覚状態空間 (VSS) ブロックを各ダウンサンプリング後の非線形活性化関数として開発する。
圧縮ベンチマークデータセットでは、MambaVCはより低い計算とメモリオーバーヘッドでより優れたレート歪み性能を達成する。
論文 参考訳(メタデータ) (2024-05-24T10:24:30Z) - ReMamber: Referring Image Segmentation with Mamba Twister [51.291487576255435]
ReMamberは、マルチモーダルなMamba TwisterブロックとMambaのパワーを統合する新しいRISアーキテクチャである。
Mamba Twisterは画像とテキストのインタラクションを明示的にモデル化し、独自のチャネルと空間的ツイスト機構を通じてテキストと視覚的特徴を融合する。
論文 参考訳(メタデータ) (2024-03-26T16:27:37Z) - VM-UNET-V2 Rethinking Vision Mamba UNet for Medical Image Segmentation [8.278068663433261]
本稿では,MambaアーキテクチャにインスパイアされたVison Mamba-UNetV2を提案する。
VM-UNetV2は、医用画像セグメンテーションタスクにおいて競合する性能を示す。
我々はISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir CVC-ColonDB、ETIS-LaribPolypDBのパブリックデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2024-03-14T08:12:39Z) - Weak-Mamba-UNet: Visual Mamba Makes CNN and ViT Work Better for
Scribble-based Medical Image Segmentation [13.748446415530937]
本稿では医用画像セグメンテーションのための革新的な弱教師付き学習(WSL)フレームワークであるWeak-Mamba-UNetを紹介する。
WSL戦略には3つの異なるアーキテクチャがあるが、同じ対称エンコーダ・デコーダネットワークが組み込まれている。CNNベースのローカル特徴抽出用UNet、包括的なグローバルコンテキスト理解のためのSwin TransformerベースのSwinUNet、より効率的な長距離依存性モデリングのためのVMambaベースのMamba-UNetである。
Weak-Mamba-UNetの有効性は、類似したWSLの性能を超越した、処理アノテーション付きMRI心筋セグメンテーションデータセット上で検証される。
論文 参考訳(メタデータ) (2024-02-16T18:43:39Z) - MambaByte: Token-free Selective State Space Model [71.90159903595514]
マンババイト(英: MambaByte)は、マンバSSMがバイト配列で自己回帰的に訓練したトークンレス適応である。
MambaByteは、言語モデリングタスクにおいて、最先端のサブワードトランスフォーマーよりも優れています。
論文 参考訳(メタデータ) (2024-01-24T18:53:53Z) - SegViTv2: Exploring Efficient and Continual Semantic Segmentation with
Plain Vision Transformers [76.13755422671822]
本稿では,エンコーダ・デコーダ・フレームワークを用いた意味的セグメンテーションのためのプレーンビジョン変換器(ViT)の能力について検討する。
Intention-to-Mask(atm)モジュールを導入し、平易なViTに有効な軽量デコーダを設計する。
我々のデコーダは、様々なViTバックボーンを使用して人気のあるデコーダUPerNetより優れ、計算コストの5%程度しか消費しない。
論文 参考訳(メタデータ) (2023-06-09T22:29:56Z) - A Convolutional-Transformer Network for Crack Segmentation with Boundary
Awareness [5.98717173705421]
クラックは、製造された建物の安全性と耐久性を評価する上で重要な役割を果たしている。
本稿では,この課題を解決するために,エンコーダデコーダアーキテクチャに基づく新しい畳み込みトランスフォーマネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T01:27:57Z) - Learning Fast and Robust Target Models for Video Object Segmentation [83.3382606349118]
ビデオオブジェクトセグメンテーション(VOS)は、ターゲットオブジェクトを定義する初期マスクがテスト時にのみ与えられるため、非常に難しい問題である。
それまでのほとんどの場合、第1フレーム上のファイン・チューン・セグメンテーション・ネットワークにアプローチし、非現実的なフレームレートとオーバーフィッティングのリスクをもたらす。
本稿では,2つのネットワークコンポーネントからなる新しいVOSアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T21:58:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。