論文の概要: Rice Leaf Disease Detection: A Comparative Study Between CNN, Transformer and Non-neural Network Architectures
- arxiv url: http://arxiv.org/abs/2501.06740v1
- Date: Sun, 12 Jan 2025 07:29:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:24:35.517768
- Title: Rice Leaf Disease Detection: A Comparative Study Between CNN, Transformer and Non-neural Network Architectures
- Title(参考訳): イネ葉病検出 : CNN, Transformer および非神経ネットワークアーキテクチャの比較検討
- Authors: Samia Mehnaz, Md. Touhidul Islam,
- Abstract要約: バングラデシュの葉病検出のためのコンピュータビジョン技術について検討した。
テストされたモデルの中で、ResNet50は他のCNNやトランスフォーマーベースのモデルよりも最高のパフォーマンスを示した。
- 参考スコア(独自算出の注目度): 1.534667887016089
- License:
- Abstract: In nations such as Bangladesh, agriculture plays a vital role in providing livelihoods for a significant portion of the population. Identifying and classifying plant diseases early is critical to prevent their spread and minimize their impact on crop yield and quality. Various computer vision techniques can be used for such detection and classification. While CNNs have been dominant on such image classification tasks, vision transformers has become equally good in recent time also. In this paper we study the various computer vision techniques for Bangladeshi rice leaf disease detection. We use the Dhan-Shomadhan -- a Bangladeshi rice leaf disease dataset, to experiment with various CNN and ViT models. We also compared the performance of such deep neural network architecture with traditional machine learning architecture like Support Vector Machine(SVM). We leveraged transfer learning for better generalization with lower amount of training data. Among the models tested, ResNet50 exhibited the best performance over other CNN and transformer-based models making it the optimal choice for this task.
- Abstract(参考訳): バングラデシュのような国では、農業が人口の大部分に生活を提供する上で重要な役割を担っている。
植物の病気の早期発見と分類は、その拡散を防ぎ、作物の収量や品質への影響を最小限に抑えるために重要である。
このような検出と分類には様々なコンピュータビジョン技術が利用できる。
CNNはこうした画像分類タスクに支配的だが、近年では視覚変換器も同様に良くなっている。
本稿では,バングラデシュの葉病検出のためのコンピュータビジョン技術について検討する。
バングラデシュの葉病データセットであるDhan-Shomadhanを使って、さまざまなCNNとViTモデルを試しています。
また、このようなディープニューラルネットワークアーキテクチャのパフォーマンスを、Support Vector Machine(SVM)のような従来の機械学習アーキテクチャと比較した。
転送学習を活用して、トレーニングデータの少ないデータでより良い一般化を実現しました。
テストされたモデルの中で、ResNet50は他のCNNやトランスフォーマーベースのモデルよりも最高のパフォーマンスを示し、このタスクの最適な選択となった。
関連論文リスト
- PotatoGANs: Utilizing Generative Adversarial Networks, Instance Segmentation, and Explainable AI for Enhanced Potato Disease Identification and Classification [0.0]
我々の研究は、PotatoGANsと呼ばれる新しいアプローチを採用している。
2種類のGANを用いて合成ポテト病画像を生成する。
インセプションスコアを指標として,PotatoGANが生成した画像の品質と現実性を示す実験を行った。
論文 参考訳(メタデータ) (2024-05-12T17:00:52Z) - Machine Learning-Based Jamun Leaf Disease Detection: A Comprehensive
Review [0.0]
ジャムン葉病は農業の生産性に重大な脅威をもたらす。
機械学習の出現は、これらの病気に効果的に取り組むための新たな道を開いた。
画像処理技術を用いた類似の疾患検出のために,様々な自動化システムが実装されている。
論文 参考訳(メタデータ) (2023-11-27T11:46:30Z) - Machine Learning-Based Tea Leaf Disease Detection: A Comprehensive
Review [3.3916160303055563]
茶葉病は農業生産にとって大きな課題であり、茶産業の収量や品質に大きく影響している。
機械学習の台頭は、これらの病気に対処するための革新的なアプローチの開発を可能にした。
茶葉病の予測には,すでにさまざまな画像処理技術を用いていくつかの自動化システムが開発されている。
論文 参考訳(メタデータ) (2023-11-06T16:30:40Z) - Defect Classification in Additive Manufacturing Using CNN-Based Vision
Processing [76.72662577101988]
本稿では、まず、畳み込みニューラルネットワーク(CNN)を用いて、画像データセットの欠陥をAMから第2に正確に分類し、発達した分類モデルにアクティブラーニング技術を適用する。
これにより、トレーニングデータやトレーニングデータの生成に必要なデータのサイズを削減できる、ヒューマン・イン・ザ・ループ機構の構築が可能になる。
論文 参考訳(メタデータ) (2023-07-14T14:36:58Z) - Explainable vision transformer enabled convolutional neural network for
plant disease identification: PlantXViT [11.623005206620498]
植物病は世界の作物の損失の主な原因であり、世界経済に影響を及ぼす。
本研究では、植物病の同定のために、ビジョントランスフォーマーにより「PlantXViT」と呼ばれる畳み込みニューラルネットワークモデルが提案される。
提案したモデルは、わずか0.8万のトレーニング可能なパラメータを持つ軽量な構造であり、IoTベースのスマート農業サービスに適している。
論文 参考訳(メタデータ) (2022-07-16T12:05:06Z) - Facilitated machine learning for image-based fruit quality assessment in
developing countries [68.8204255655161]
自動画像分類は食品科学における教師あり機械学習の一般的な課題である。
事前学習型視覚変換器(ViT)に基づく代替手法を提案する。
標準的なデバイス上で限られたリソースで簡単に実装できる。
論文 参考訳(メタデータ) (2022-07-10T19:52:20Z) - Vision Transformers For Weeds and Crops Classification Of High
Resolution UAV Images [3.1083892213758104]
ビジョントランスフォーマー(ViT)モデルは、畳み込み操作を適用することなく、競争またはより良い結果を達成することができる。
実験の結果,ラベル付きトレーニングデータでは,最新のCNNモデルと比較して,ViTモデルの方が優れていた。
論文 参考訳(メタデータ) (2021-09-06T19:58:54Z) - Vision Transformers are Robust Learners [65.91359312429147]
ビジョントランスフォーマー(ViT)の一般的な腐敗や摂動、分布シフト、自然逆転例に対する堅牢性について検討します。
ViTsが実際により堅牢な学習者である理由を説明するために、定量的および定性的な指標を提供する分析を提示します。
論文 参考訳(メタデータ) (2021-05-17T02:39:22Z) - BreakingBED -- Breaking Binary and Efficient Deep Neural Networks by
Adversarial Attacks [65.2021953284622]
CNNのホワイトボックス攻撃やブラックボックス攻撃に対する堅牢性について検討する。
結果は、蒸留されたCNN、エージェントベースの最新のprunedモデル、およびバイナライズニューラルネットワークのために示されています。
論文 参考訳(メタデータ) (2021-03-14T20:43:19Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。