論文の概要: Enhancing Precision Agriculture with a Hybrid Deep Learning Framework for Multi-Class Plant Disease Classification and Interpretability
- arxiv url: http://arxiv.org/abs/2606.15282v1
- Date: Sat, 13 Jun 2026 12:41:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:33.249567
- Title: Enhancing Precision Agriculture with a Hybrid Deep Learning Framework for Multi-Class Plant Disease Classification and Interpretability
- Title(参考訳): 多種植物病の分類と解釈可能性のためのハイブリッドディープラーニングフレームワークによる精密農業の強化
- Authors: Hasibul Islam Sufi, Ridam Roy, Shayla Alam Setu, Mahimul Islam Nadim,
- Abstract要約: 本研究では,高解像度の葉画像から植物病の分類を行うための総合的な深層学習アーキテクチャを提案する。
訓練用画像15,200枚と検証用画像3,800枚からなる特別収集画像データベースは、トマト、リンゴ、ブドウなど、複数の作物にまたがる38のクラスにまたがった。
ResNet-50は98.74%、ハイブリッドのResNet + ViTモデルは98.58%の競争精度を実現した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study proposes an overall deep learning architecture for multi-class classification of plant diseases from high-resolution leaf imagery, with a particular interest in investigating the behavior of ResNet-50 and a hybrid ResNet + Vision Transformer (ViT) design. A specially gathered image database with 15,200 training images and 3,800 validation images spanning 38 classes across multiple crops, including tomato, apple, grape etc. were subjected to preprocessing steps such as resizing, normalization, and data augmentation to enhance model robustness. Multiple architectures, including ResNet-50, MobileNetV2, and EfficientNet-B0, were trained and compared with the hybrid ResNet + ViT model. All models were fine-tuned using the AdamW optimizer and cross-entropy loss, with early stopping applied to prevent overfitting and ensure generalization. Furthermore, interpretability techniques such as Grad-CAM and saliency maps were implemented to indicate disease-relevant regions, while segmentation-based analysis was performed to identify the affected parts of a leaf. For every one of the considered architectures, ResNet-50 led to the highest accuracy of 98.74%, whereas the hybrid ResNet + ViT model achieved a competitive accuracy of 98.58%, showing that the hybrid architectures were effective in capturing both local and overall information. The experimental results showcase the promise of transformer-based models to achieve highly accurate, interpretable, and computationally efficient computer-based multi-class multi-disease classification systems, providing helpful assistance for cultivation management practices as well as for precision farming.
- Abstract(参考訳): 本研究では,ResNet-50とハイブリッド型ResNet + Vision Transformer(ViT)の設計の挙動を調べることを目的とした,高解像度リーフ画像からの植物病のマルチクラス分類のための総合的なディープラーニングアーキテクチャを提案する。
トマト,リンゴ,ブドウなど複数の作物にまたがる訓練用画像15,200枚,検証用画像3,800枚を収集した特別収集画像データベースを,モデルロバスト性を高めるために,リサイズ化,正規化,データ拡張などの前処理工程を施した。
ResNet-50、MobileNetV2、EfficientNet-B0を含む複数のアーキテクチャがトレーニングされ、ハイブリッドのResNet + ViTモデルと比較された。
全てのモデルはAdamWオプティマイザとクロスエントロピー損失を使用して微調整され、オーバーフィッティングを防止し、一般化を保証するために早期停止が適用された。
さらに, 葉の損傷部位を特定するために, セグメンテーションに基づく解析を行い, 病原性領域を示すために, Grad-CAM や saliency map などの解釈可能性技術を実装した。
検討されたアーキテクチャのうち、ResNet-50は98.74%、ハイブリッドのResNet + ViTモデルは98.58%の精度を達成し、ハイブリッドアーキテクチャは局所情報と全体情報の両方を捉えるのに効果的であることを示した。
実験結果から, トランスフォーマーモデルにより, 高精度, 解釈可能, 計算効率のよい多種多型分類システムの実現が期待でき, 耕作経営の実践や精密農業に有効であることが示された。
関連論文リスト
- AgriPath: A Systematic Exploration of Architectural Trade-offs for Crop Disease Classification [45.52399819498234]
本研究は、細粒度作物病分類のための3つのモデルパラダイムの体系的比較を示す。
我々は16の作物と41の病気にまたがる111kの画像を含むベンチマークであるAgriPath-LF16を紹介する。
CNNは画像の精度が最も高いが、ドメインシフトによって劣化する。
対照的なVLMは、競合するクロスドメイン性能を持つ堅牢でパラメータ効率の良い代替手段を提供する。
論文 参考訳(メタデータ) (2026-03-08T17:28:01Z) - Multi-objective hybrid knowledge distillation for efficient deep learning in smart agriculture [0.05599792629509228]
本研究では,軽量ながら高性能な畳み込みニューラルネットワークを開発するためのハイブリッド知識蒸留フレームワークを提案する。
提案手法は,ResNet18教師ネットワークの指導のもと,逆残差ブロックと密接な接続性を組み合わせた,カスタマイズされた学生モデルを設計する。
論文 参考訳(メタデータ) (2025-12-23T15:33:55Z) - Mobile-Friendly Deep Learning for Plant Disease Detection: A Lightweight CNN Benchmark Across 101 Classes of 33 Crops [39.58317527488534]
植物病は世界の食料安全保障にとって大きな脅威である。
我々は、33の作物で101の植物病を正確に分類できるモバイルフレンドリーなソリューションを開発した。
論文 参考訳(メタデータ) (2025-08-14T16:43:27Z) - Plant Disease Detection through Multimodal Large Language Models and Convolutional Neural Networks [0.5009853409756729]
本研究では,多モーダル大規模言語モデル(LLM)と畳み込みニューラルネットワーク(CNN)を併用した葉のイメージを用いた植物病の自動分類の有効性について検討した。
ゼロショット,少数ショット,プログレッシブ微調整シナリオのモデル性能を評価する。
論文 参考訳(メタデータ) (2025-04-29T04:31:58Z) - Multi-view Hybrid Graph Convolutional Network for Volume-to-mesh Reconstruction in Cardiovascular MRI [43.47826598981827]
画像間直接抽出のための新しいアーキテクチャであるHybridVNetを紹介する。
グラフ構造として符号化することで,表面および体積メッシュを効率的に処理できることを示す。
我々のモデルは、従来の畳み込みネットワークと変分グラフ生成モデル、深い監督とメッシュ固有の正規化を組み合わせたものです。
論文 参考訳(メタデータ) (2023-11-22T21:51:29Z) - Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification [0.0]
本研究では,乳がんの新たな分類法であるDual-Activated Lightweight Attention ResNet50モデルを提案する。
トレーニング済みのResNet50モデルと軽量なアテンション機構を統合し、ResNet50の第4層にアテンションモジュールを埋め込む。
DALAResNet50法は,40X,100X,200X,400Xの乳がん組織像を用いて,それぞれ98.5%,98.7%,97.9%,94.3%の検診を行った。
論文 参考訳(メタデータ) (2023-08-25T03:08:41Z) - End-to-end deep learning for directly estimating grape yield from
ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。
オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。
本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文 参考訳(メタデータ) (2022-08-04T01:34:46Z) - If your data distribution shifts, use self-learning [24.23584770840611]
エントロピーや擬似ラベルのような自己学習技術は、体系的なドメインシフトの下でのコンピュータビジョンモデルの性能向上にシンプルかつ効果的である。
我々は広範囲にわたる大規模な実験を行い、モデルアーキテクチャに関係なく一貫した改善を示す。
論文 参考訳(メタデータ) (2021-04-27T01:02:15Z) - Classification of Seeds using Domain Randomization on Self-Supervised
Learning Frameworks [0.0]
鍵となるボトルネックは、畳み込みニューラルネットワーク(CNN)をトレーニングする大量のラベル付きデータの必要性である。
この研究は、これを達成するために、コントラスト学習とドメインランダム化の概念を活用している。
実世界の画像の表象的サンプル作物から生成された合成画像の使用は、大量のテスト対象の必要性を軽減する。
論文 参考訳(メタデータ) (2021-03-29T12:50:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。