論文の概要: AgriMind: An Ensemble Deep Learning Framework for Multi-Class Plant Disease Classification
- arxiv url: http://arxiv.org/abs/2605.16076v1
- Date: Fri, 15 May 2026 15:37:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.341691
- Title: AgriMind: An Ensemble Deep Learning Framework for Multi-Class Plant Disease Classification
- Title(参考訳): AgriMind: マルチクラス植物病分類のための深層学習フレームワーク
- Authors: Salma Hoque Talukdar Koli, Fahima Haque Talukder Jely,
- Abstract要約: AgriMindは、20,638 PlantVillageイメージでトレーニングされたResNet50、EfficientNet-B0、DenseNet121のアンサンブルである。
NVIDIA T4 GPUでは、フルアンサンブルは53FPSで動作する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Plant disease detection is still largely manual in Bangladesh, where extension workers eyeball leaf samples across millions of smallholdings. We built AgriMind to automate this: an ensemble of ResNet50, EfficientNet-B0, and DenseNet121 trained on 20,638 PlantVillage images across 15 pepper, potato, and tomato disease classes. Transfer learning with frozen ImageNet backbones and 10 epochs of head-only training keeps the pipeline lightweight. Individual models hit 96--97% on the held-out test set, but averaging their softmax outputs pushes the ensemble to 99.23% -- a two-thirds cut in error rate. We tried biasing the average toward the best validation model; it backfired. Dropping any single model also hurt. Pepper and potato classify perfectly; tomato, with ten visually similar classes, still reaches 99.01%. On an NVIDIA T4 GPU the full ensemble runs at 53 FPS. Whether that translates to real-time mobile use depends on TensorFlow Lite optimization -- work we have not yet completed.
- Abstract(参考訳): 植物病の検出はまだバングラデシュで手作業で行われている。
ResNet50、EfficientNet-B0、DenseNet121のアンサンブルで、20,638のPlanetVillageイメージを15の唐辛子、ジャガイモ、トマト病のクラスでトレーニングしました。
凍結したImageNetバックボーンと10エポックのヘッドオンリートレーニングによるトランスファー学習は、パイプラインを軽量に保つ。
個々のモデルは、ホールドアウトテストセットで96-97%に達したが、ソフトマックス出力を平均すると、アンサンブルは99.23%に上昇し、エラー率の3分の2がカットされた。
平均値を最高のバリデーションモデルに偏見付けようとしました。
単一のモデルをドロップしても問題ない。
ペッパーとジャガイモは完璧に分類され、トマトは10種類の視覚的に類似しており、それでも99.01%に達する。
NVIDIA T4 GPUでは、フルアンサンブルは53FPSで動作する。
それがリアルタイムモバイルに変換されるかどうかは、TensorFlow Liteの最適化に依存します -- まだ完了していません。
関連論文リスト
- GourNet: A CNN-Based Model for Mango Leaf Disease Detection [1.9573380763700712]
マンゴー葉の感染を識別する「GourNet」という「深層学習」モデルを導入する。
我々は"MangoLeafBD"データセットを使用して、提示されたモデルの有効性をトレーニングし、評価する。
我々のモデルは683,656個の合計パラメータしか使用せず、分類精度は97%である。
論文 参考訳(メタデータ) (2026-04-30T11:53:32Z) - A Compact and Efficient 1.251 Million Parameter Machine Learning CNN Model PD36-C for Plant Disease Detection: A Case Study [0.0]
深層学習は画像に基づく植物病の診断を著しく進歩させてきた。
本稿では,植物病の分類のための小型畳み込みニューラルネットワークPD36Cを提案する。
PD36 Cは堅牢性とエッジのデプロイ性のために設計されている。
論文 参考訳(メタデータ) (2026-04-13T11:33:24Z) - On the Image-Based Detection of Tomato and Corn leaves Diseases : An
in-depth comparative experiments [0.0]
本研究は、植物画像分類のための畳み込みニューラルネットワーク(CNN)に基づく、新しい植物病検出モデルを提案する。
このモデルは2つの異なる植物病を4つのカテゴリに分類し、植物病の同定のための新しいテクニックを提示する。
論文 参考訳(メタデータ) (2023-12-14T05:11:30Z) - TinyCLIP: CLIP Distillation via Affinity Mimicking and Weight
Inheritance [97.01406871579525]
大規模言語画像事前学習モデルのための新しいクロスモーダル蒸留法TinyCLIPを提案する。
また、TinyCLIPは、トレーニング済みのCLIP ViT-B/32のサイズを50%削減し、ゼロショット性能を同等に維持できることを示した。
YFCC-15MでトレーニングしたTinyCLIP ViT-8M/16は、ImageNetで41.1%という印象的なゼロショットトップ1の精度を達成した。
論文 参考訳(メタデータ) (2023-09-21T17:59:53Z) - DilateFormer: Multi-Scale Dilated Transformer for Visual Recognition [62.95223898214866]
我々は,視覚変換器の有効性を探究し,参加する受容領域の計算複雑性とサイズとのトレードオフを追求する。
ピラミッドアーキテクチャを用いて,MSDAブロックを低レベルに積み重ねたマルチスケールDilated Transformer (DilateFormer) と,高レベルにグローバルなマルチヘッド自己保持ブロックを構築する。
実験の結果,DilateFormerは様々な視覚タスクで最先端のパフォーマンスを実現していることがわかった。
論文 参考訳(メタデータ) (2023-02-03T14:59:31Z) - Boosting Semi-Supervised 3D Object Detection with Semi-Sampling [85.68737731673396]
我々は、グラウンド・シークレット・ラベルと擬似ラベルを用いて、ラベル付きフレームとラベルなしフレームのgtサンプルと擬似サンプルを収穫する。
教師が指導する半教師付きフレームワークのトレーニングでは,ラベル付きフレームとラベルなしフレームの両方に対して,gtサンプルと擬似サンプルをランダムに選択する。
我々は、ScanNet、SUN-RGBD、KITTIベンチマークにおける最先端の手法を大きなマージンで継続的に改善する。
論文 参考訳(メタデータ) (2022-11-14T03:22:03Z) - A Comparative Analysis of Machine Learning Approaches for Automated Face
Mask Detection During COVID-19 [0.0]
WHOは、新型コロナウイルス感染を防ぐための最も効果的な対策の一つとして、マスクを着用することを推奨している。
マスク検出のための多くのディープラーニングモデルを探索し、2つのベンチマークデータセットで評価する。
すべてのモデルのパフォーマンスは非常に良好ですが、転送学習モデルは最高のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2021-12-15T06:30:50Z) - DisCo: Remedy Self-supervised Learning on Lightweight Models with
Distilled Contrastive Learning [94.89221799550593]
SSL(Self-supervised representation Learning)はコミュニティから広く注目を集めている。
最近の研究では、モデルサイズが小さくなれば、その性能は低下すると主張している。
単純かつ効果的な蒸留コントラスト学習(DisCo)を提案し、問題を大きなマージンで緩和します。
論文 参考訳(メタデータ) (2021-04-19T08:22:52Z) - Jigsaw Clustering for Unsupervised Visual Representation Learning [68.09280490213399]
本稿では,新しいjigsawクラスタリング・プレテキストタスクを提案する。
本手法は画像内情報と画像間情報の両方を利用する。
トレーニングバッチの半分しか使用されていない場合、コントラスト学習方法にも匹敵します。
論文 参考訳(メタデータ) (2021-04-01T08:09:26Z) - TResNet: High Performance GPU-Dedicated Architecture [6.654949459658242]
近年開発された多くのディープラーニングモデルは、FLOPS数が少なく、ResNet50よりもImageNetの精度が高い。
本稿では、GPUトレーニングと推論効率を維持しながら、ニューラルネットワークの精度を高めることを目的としたアーキテクチャ修正のシリーズを紹介する。
我々は、従来のConvNetよりも精度と効率を向上する、TResNetと呼ばれるGPU専用モデルの新しいファミリーを紹介する。
論文 参考訳(メタデータ) (2020-03-30T17:04:47Z) - Fixing the train-test resolution discrepancy: FixEfficientNet [98.64315617109344]
本稿では,複数のトレーニング手順を用いて,効率的なNet画像分類器の性能解析を行う。
FixEfficientNetと呼ばれる結果のネットワークは、同じ数のパラメータで初期アーキテクチャを著しく上回る。
論文 参考訳(メタデータ) (2020-03-18T14:22:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。