論文の概要: PSMamba: Progressive Self-supervised Vision Mamba for Plant Disease Recognition
- arxiv url: http://arxiv.org/abs/2512.14309v1
- Date: Tue, 16 Dec 2025 11:27:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.698026
- Title: PSMamba: Progressive Self-supervised Vision Mamba for Plant Disease Recognition
- Title(参考訳): PSMamba: 植物疾患認識のためのプログレッシブ・セルフコントロール・ビジョン・マンバ
- Authors: Abdullah Al Mamun, Miaohua Zhang, David Ahmedt-Aristizabal, Zeeshan Hayder, Mohammad Awrangjeb,
- Abstract要約: PSMambaは植物病画像のための自己教師型表現学習フレームワークである。
1つは病変の分布や静脈構造を捉えるために、もう1つは局部的な視点で、テクスチャの不規則性や早期の病変のようなきめ細かい手がかりを捉えることに焦点を当てている。
最先端のSSLメソッドを一貫して上回り、ドメインシフトしたシナリオときめ細かいシナリオの両方において、優れた精度と堅牢性を提供する。
- 参考スコア(独自算出の注目度): 8.833060019057847
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised Learning (SSL) has become a powerful paradigm for representation learning without manual annotations. However, most existing frameworks focus on global alignment and struggle to capture the hierarchical, multi-scale lesion patterns characteristic of plant disease imagery. To address this gap, we propose PSMamba, a progressive self-supervised framework that integrates the efficient sequence modelling of Vision Mamba (VM) with a dual-student hierarchical distillation strategy. Unlike conventional single teacher-student designs, PSMamba employs a shared global teacher and two specialised students: one processes mid-scale views to capture lesion distributions and vein structures, while the other focuses on local views to capture fine-grained cues such as texture irregularities and early-stage lesions. This multi-granular supervision facilitates the joint learning of contextual and detailed representations, with consistency losses ensuring coherent cross-scale alignment. Experiments on three benchmark datasets show that PSMamba consistently outperforms state-of-the-art SSL methods, delivering superior accuracy and robustness in both domain-shifted and fine-grained scenarios.
- Abstract(参考訳): 自己教師型学習(SSL)は手動のアノテーションを使わずに、表現型学習の強力なパラダイムとなっている。
しかし、既存のほとんどのフレームワークは、植物病のイメージに特徴的な階層的、多スケールの病変パターンを捉えるのに、グローバルアライメントと苦労に重点を置いている。
このギャップに対処するために,ビジョン・マンバ(VM)の効率的なシーケンスモデリングと,デュアルスチューデントな階層的蒸留戦略を統合する,プログレッシブ・セルフ教師付きフレームワークであるPSMambaを提案する。
1つは病変の分布や静脈構造を捉えるために、もう1つは局所的な視点で、テクスチャの不規則性や早期の病変などのきめ細かい手がかりを捉えることに焦点を当てている。
この多粒性指導は文脈的・詳細な表現の連立学習を促進させ、一貫性の喪失によりコヒーレントなクロススケールアライメントが保証される。
3つのベンチマークデータセットの実験によると、PSMambaは最先端のSSLメソッドを一貫して上回り、ドメインシフトしたシナリオときめ細かいシナリオの両方において、優れた精度と堅牢性を提供する。
関連論文リスト
- MoSAiC: Multi-Modal Multi-Label Supervision-Aware Contrastive Learning for Remote Sensing [10.207026975603503]
MoSAiCは,モダリティ内およびモダリティ間コントラスト学習を多ラベル教師付きコントラスト学習と共同で最適化する統合フレームワークである。
MoSAiCは、精度、クラスタコヒーレンス、一般化の点で、完全に教師されたベースラインと自己監督されたベースラインの両方を一貫して上回っている。
論文 参考訳(メタデータ) (2025-07-11T15:33:51Z) - DSAGL: Dual-Stream Attention-Guided Learning for Weakly Supervised Whole Slide Image Classification [5.260725801393189]
超高解像度でリッチなセマンティックな内容のため,WSIは癌診断に重要である。
DSAGL(Dual-Stream Attention-Guided Learning, DSAGL)は、教師/学生のアーキテクチャと2重ストリーム設計を組み合わせた、弱教師付き分類フレームワークである。
論文 参考訳(メタデータ) (2025-05-29T11:07:16Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - A Theoretical Analysis of Self-Supervised Learning for Vision Transformers [66.08606211686339]
マスク付きオートエンコーダ(MAE)とコントラスト学習(CL)は異なる種類の表現をキャプチャする。
我々は,MAEとCLの両目的に対して,一層ソフトマックス型視覚変換器(ViT)のトレーニングダイナミクスについて検討した。
論文 参考訳(メタデータ) (2024-03-04T17:24:03Z) - Semi-Mamba-UNet: Pixel-Level Contrastive and Pixel-Level Cross-Supervised Visual Mamba-based UNet for Semi-Supervised Medical Image Segmentation [11.637738540262797]
本研究では,従来のCNNベースのUNetと純粋に視覚的なMambaベースのエンコーダデコーダアーキテクチャを組み込んだセミマンバUNetを,半教師付き学習フレームワークに統合する。
この革新的なSSLアプローチは、両方のネットワークを利用して擬似ラベルを生成し、ピクセルレベルで相互に相互に監督する。
本稿では,2対のプロジェクタを用いた自己教師型画素レベルのコントラスト学習戦略を導入し,特徴学習機能をさらに強化する。
論文 参考訳(メタデータ) (2024-02-11T17:09:21Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - GraVIS: Grouping Augmented Views from Independent Sources for
Dermatology Analysis [52.04899592688968]
皮膚科画像から自己教師付き特徴を学習するために特に最適化されたGraVISを提案する。
GraVISは、病変のセグメンテーションと疾患分類のタスクにおいて、転送学習と自己教師型学習を著しく上回っている。
論文 参考訳(メタデータ) (2023-01-11T11:38:37Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。