論文の概要: XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification
- arxiv url: http://arxiv.org/abs/2603.06750v1
- Date: Fri, 06 Mar 2026 11:23:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.021174
- Title: XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification
- Title(参考訳): XMACNet: チリ病分類のためのマルチモーダルフュージョンを用いた説明可能な軽量注意型CNN
- Authors: Tapon Kumer Ray, Rajkumar Y, Shalini R, Srigayathri K, Jayashree S, Lokeswari P,
- Abstract要約: XMACNetは、チリ病検出のための可視像と植生指標の自己注意とマルチモーダル融合を統合した、新しい軽量畳み込みニューラルネットワーク(CNN)である。
6つのクラス(5種類の疾患と健康)にまたがる12,000枚のチリ葉画像の新たなデータセットを収集した。
XMACNetは、ResNet-50、MobileNetV2、Swin Transformerなどのベースラインモデルよりも高い精度、F1スコア、AUCを実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Plant disease classification via imaging is a critical task in precision agriculture. We propose XMACNet, a novel light-weight Convolutional Neural Network (CNN) that integrates self-attention and multi-modal fusion of visible imagery and vegetation indices for chili disease detection. XMACNet uses an EfficientNetV2S backbone enhanced by a self-attention module and a fusion branch that processes both RGB images and computed vegetation index maps (NDVI, NPCI, MCARI). We curated a new dataset of 12,000 chili leaf images across six classes (five disease types plus healthy), augmented synthetically via StyleGAN to mitigate data scarcity. Trained on this dataset, XMACNet achieves high accuracy, F1-score, and AUC, outperforming baseline models such as ResNet-50, MobileNetV2, and a Swin Transformer variant. Crucially, XMACNet is explainable: we use Grad-CAM++ and SHAP to visualize and quantify the models focus on disease features. The models compact size and fast inference make it suitable for edge deployment in real-world farming scenarios.
- Abstract(参考訳): 画像による植物病の分類は、精密農業において重要な課題である。
キリ病検出のための画像と植生指標の自己注意とマルチモーダル融合を統合した,新しい軽量畳み込みニューラルネットワーク(CNN)であるXMACNetを提案する。
XMACNetは自己保持モジュールによって強化された効率的なNetV2Sバックボーンと、RGBイメージと計算された植生インデックスマップ(NDVI, NPCI, MCARI)の両方を処理する融合ブランチを使用する。
6つのクラス(5つの疾患タイプと健康な5種類)にまたがる12,000枚のキリ葉画像の新たなデータセットをStyleGANを介して合成し,データ不足を軽減した。
このデータセットに基づいてトレーニングされたXMACNetは、ResNet-50、MobileNetV2、Swin Transformer変種などのベースラインモデルよりも優れた精度、F1スコア、AUCを実現している。
私たちはGrad-CAM++とSHAPを使って、モデルが病気の特徴に焦点を当てていることを視覚化し、定量化しています。
モデルのサイズと高速な推論は、現実世界の農業シナリオにおけるエッジデプロイメントに適している。
関連論文リスト
- SugarcaneShuffleNet: A Very Fast, Lightweight Convolutional Neural Network for Diagnosis of 15 Sugarcane Leaf Diseases [0.2568599831029425]
低資源地域のサトウキビ農家は、葉の病気に弱いままである。
多くのディープラーニングモデルは、現実世界の条件下での一般化に失敗する。
本研究は,サトウキビ葉病分類のための培養データセットであるSugarcaneLD-BDについて述べる。
SugarcaneShuffleNetはデバイス上での迅速な診断に最適化された軽量モデルである。
論文 参考訳(メタデータ) (2025-08-23T18:39:25Z) - Classification based deep learning models for lung cancer and disease using medical images [2.0809985825763198]
本稿では、確立されたResNetフレームワークをベースにした、ResNet+と呼ばれる新しいディープ畳み込みニューラルネットワーク(CNN)モデルを紹介する。
実験の結果、ResNet+モデルは、LC25000データセットで98.14/98.14%、IQ-OTH/NCCDデータセットで99.25/99.13%に達している。
論文 参考訳(メタデータ) (2025-07-02T01:36:29Z) - Flyweight FLIM Networks for Salient Object Detection in Biomedical Images [42.763966145188625]
本研究では,FLIMネットワークのバックプロパゲーションを伴わない拡張分離型畳み込みカーネルと多層拡散層を学習する手法を提案する。
また,カーネル冗長性とエンコーダサイズを低減するため,新しいネットワーク単純化手法を提案する。
論文 参考訳(メタデータ) (2025-04-15T11:57:40Z) - Soybean Disease Detection via Interpretable Hybrid CNN-GNN: Integrating MobileNetV2 and GraphSAGE with Cross-Modal Attention [1.927711700724334]
大豆の葉の病原体の検出は農業の生産性にとって重要であるが、視覚的に類似した症状と限定的な解釈可能性のために課題に直面している。
本稿では,局所化特徴抽出のためのMobileNetV2とリレーショナルモデリングのためのGraphSAGEを相乗化する,解釈可能なハイブリッドCNN-Graph Neural Network(GNN)フレームワークを提案する。
クロスモーダル解釈はGrad-CAMおよびEigen-CAMビジュアライゼーションを通じて実現され、熱マップを生成して疾患の流入領域をハイライトする。
論文 参考訳(メタデータ) (2025-03-03T08:12:09Z) - Mew: Multiplexed Immunofluorescence Image Analysis through an Efficient Multiplex Network [84.88767228835928]
マルチプレックスネットワークのレンズを通してmIF画像を効率的に処理する新しいフレームワークであるMewを紹介する。
Mew は、幾何学情報のための Voronoi ネットワークと、セルワイドの均一性を捉えるセル型ネットワークという、2つの異なる層からなる多重ネットワークを革新的に構築する。
このフレームワークは、トレーニング中にグラフ全体を処理できるスケーラブルで効率的なグラフニューラルネットワーク(GNN)を備えている。
論文 参考訳(メタデータ) (2024-07-25T08:22:30Z) - Building Flyweight FLIM-based CNNs with Adaptive Decoding for Object
Detection [40.97322222472642]
本研究では、ユーザ描画マーカーからオブジェクトを検出するために、畳み込みニューラルネットワーク(CNN)層を構築する方法を提案する。
糞便サンプルの顕微鏡画像におけるSchistosomiasis mansoni卵の検出と,衛星画像における船舶の検出に対処する。
我々のCNNは、SOTAオブジェクト検出器より数千倍も小さく、CPU実行に適している。
論文 参考訳(メタデータ) (2023-06-26T16:48:20Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。