論文の概要: ConMamba: Contrastive Vision Mamba for Plant Disease Detection
- arxiv url: http://arxiv.org/abs/2506.03213v1
- Date: Tue, 03 Jun 2025 03:01:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:13.953013
- Title: ConMamba: Contrastive Vision Mamba for Plant Disease Detection
- Title(参考訳): ConMamba:植物病検出のためのコントラストビジョン・マンバ
- Authors: Abdullah Al Mamun, Miaohua Zhang, David Ahmedt-Aristizabal, Zeeshan Hayder, Mohammad Awrangjeb,
- Abstract要約: 植物病検出(PDD)は精密農業の重要な側面である。
既存のディープラーニング手法は、広範に注釈付けされたデータセットに依存していることが多い。
PDD用に特別に設計された新しいフレームワークであるConMambaを提案する。
- 参考スコア(独自算出の注目度): 3.60543005189868
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Plant Disease Detection (PDD) is a key aspect of precision agriculture. However, existing deep learning methods often rely on extensively annotated datasets, which are time-consuming and costly to generate. Self-supervised Learning (SSL) offers a promising alternative by exploiting the abundance of unlabeled data. However, most existing SSL approaches suffer from high computational costs due to convolutional neural networks or transformer-based architectures. Additionally, they struggle to capture long-range dependencies in visual representation and rely on static loss functions that fail to align local and global features effectively. To address these challenges, we propose ConMamba, a novel SSL framework specially designed for PDD. ConMamba integrates the Vision Mamba Encoder (VME), which employs a bidirectional State Space Model (SSM) to capture long-range dependencies efficiently. Furthermore, we introduce a dual-level contrastive loss with dynamic weight adjustment to optimize local-global feature alignment. Experimental results on three benchmark datasets demonstrate that ConMamba significantly outperforms state-of-the-art methods across multiple evaluation metrics. This provides an efficient and robust solution for PDD.
- Abstract(参考訳): 植物病検出(PDD)は精密農業の重要な側面である。
しかし、既存のディープラーニング手法は、しばしば広範囲に注釈付けされたデータセットに依存し、そのデータセットを生成するのに時間がかかり、コストがかかる。
自己教師付き学習(SSL)は、ラベルなしデータの豊富さを活用することで、有望な代替手段を提供する。
しかし、既存のSSLアプローチのほとんどは、畳み込みニューラルネットワークやトランスフォーマーベースのアーキテクチャによる高い計算コストに悩まされている。
さらに、視覚表現における長距離依存関係のキャプチャに苦労し、ローカル機能とグローバル機能を効果的に整合できない静的損失関数に依存している。
これらの課題に対処するため、PDD用に特別に設計された新しいSSLフレームワークであるConMambaを提案する。
ConMambaはVision Mamba Encoder(VME)を統合し、双方向のステートスペースモデル(SSM)を使用して、長距離依存関係を効率的にキャプチャする。
さらに、局所的特徴アライメントを最適化するために、動的重み調整を伴う二重レベルコントラスト損失を導入する。
3つのベンチマークデータセットの実験結果から、ConMambaは複数の評価指標で最先端の手法を大幅に上回っていることが示された。
これにより、PDDの効率的で堅牢なソリューションが提供されます。
関連論文リスト
- GLADMamba: Unsupervised Graph-Level Anomaly Detection Powered by Selective State Space Model [4.4735289317146405]
GLADMambaは、選択状態空間モデルを UGLAD フィールドに適応させる新しいフレームワークである。
我々の知る限りでは、マンバと明示的なスペクトル情報を UGLAD に導入するのはこれが初めてである。
論文 参考訳(メタデータ) (2025-03-23T02:40:17Z) - Binarized Mamba-Transformer for Lightweight Quad Bayer HybridEVS Demosaicing [21.15110217419682]
本稿では,HybridEVS RAW画像の効率的な復調を実現するために,軽量なマンバ型バイナリニューラルネットワークを提案する。
Bi-Mambaは全ての射影をバイナライズし、コアSelective Scanを完全精度で保持する。
我々は,BMTNetの性能と計算効率の両面において,定量的かつ定性的な実験を行い,BMTNetの有効性を実証した。
論文 参考訳(メタデータ) (2025-03-20T13:32:27Z) - RoMA: Scaling up Mamba-based Foundation Models for Remote Sensing [28.488986896516284]
RoMAは、大規模で多様なラベルのないデータを使用して、RSファンデーションモデルのスケーラブルな自己教師付き事前トレーニングを可能にするフレームワークである。
RoMAは、カスタマイズされた自動回帰学習戦略により、高解像度画像のスケーラビリティを向上させる。
シーン分類、オブジェクト検出、セマンティックセグメンテーションタスクにわたる実験により、RoMAで事前訓練されたMambaモデルは、精度と計算効率の両方において、ViTベースのモデルよりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-03-13T14:09:18Z) - Mamba-SEUNet: Mamba UNet for Monaural Speech Enhancement [54.427965535613886]
Mambaは、新しいステートスペースモデル(SSM)として、自然言語処理やコンピュータビジョンに広く応用されている。
本稿では,MambaとU-Net for SEタスクを統合する革新的なアーキテクチャであるMamba-SEUNetを紹介する。
論文 参考訳(メタデータ) (2024-12-21T13:43:51Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba [54.85262314960038]
局所的意図的マンバブロックは、大域的コンテキストと局所的詳細の両方を線形複雑性でキャプチャする。
このモデルは, 256x256の解像度で, ImageNet上の様々なモデルスケールでDiTの性能を上回り, 優れたスケーラビリティを示す。
ImageNet 256x256 と 512x512 の最先端拡散モデルと比較すると,最大 62% GFLOP の削減など,我々の最大のモデルには顕著な利点がある。
論文 参考訳(メタデータ) (2024-08-05T16:39:39Z) - SPMamba: State-space model is all you need in speech separation [20.168153319805665]
CNNベースの音声分離モデルは、局所的な受容的場制限に直面し、長期間の依存関係を効果的にキャプチャできない。
本稿では,SPMambaという音声分離手法を提案する。
このモデルは、TF-GridNetアーキテクチャに基づいており、従来のBLSTMモジュールを双方向のMambaモジュールに置き換えている。
論文 参考訳(メタデータ) (2024-04-02T16:04:31Z) - An Adaptive Plug-and-Play Network for Few-Shot Learning [12.023266104119289]
少数のサンプルから学んだ後、新しいサンプルを分類するモデルが必要である。
ディープネットワークと複雑なメトリクスはオーバーフィッティングを引き起こす傾向があり、パフォーマンスをさらに改善することは困難である。
プラグアンドプレイ型モデル適応型リサイザ (MAR) とアダプティブ類似度測定器 (ASM) をその他の損失なく提案する。
論文 参考訳(メタデータ) (2023-02-18T13:25:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。