論文の概要: AgriPath: A Systematic Exploration of Architectural Trade-offs for Crop Disease Classification
- arxiv url: http://arxiv.org/abs/2603.13354v1
- Date: Sun, 08 Mar 2026 17:28:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.114491
- Title: AgriPath: A Systematic Exploration of Architectural Trade-offs for Crop Disease Classification
- Title(参考訳): AgriPath: 作物病の分類のためのアーキテクチャトレードオフの体系的な探索
- Authors: Hamza Mooraj, George Pantazopoulos, Alessandro Suglia,
- Abstract要約: 本研究は、細粒度作物病分類のための3つのモデルパラダイムの体系的比較を示す。
我々は16の作物と41の病気にまたがる111kの画像を含むベンチマークであるAgriPath-LF16を紹介する。
CNNは画像の精度が最も高いが、ドメインシフトによって劣化する。
対照的なVLMは、競合するクロスドメイン性能を持つ堅牢でパラメータ効率の良い代替手段を提供する。
- 参考スコア(独自算出の注目度): 45.52399819498234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable crop disease detection requires models that perform consistently across diverse acquisition conditions, yet existing evaluations often focus on single architectural families or lab-generated datasets. This work presents a systematic empirical comparison of three model paradigms for fine-grained crop disease classification: Convolutional Neural Networks (CNNs), contrastive Vision-Language Models (VLMs), and generative VLMs. To enable controlled analysis of domain effects, we introduce AgriPath-LF16, a benchmark containing 111k images spanning 16 crops and 41 diseases with explicit separation between laboratory and field imagery, alongside a balanced 30k subset for standardized training and evaluation. All models are trained and evaluated under unified protocols across full, lab-only, and field-only training regimes using macro-F1 and Parse Success Rate (PSR) to account for generative reliability. The results reveal distinct performance profiles. CNNs achieve the highest accuracy on lab imagery but degrade under domain shift. Contrastive VLMs provide a robust and parameter-efficient alternative with competitive cross-domain performance. Generative VLMs demonstrate the strongest resilience to distributional variation, albeit with additional failure modes stemming from free-text generation. These findings highlight that architectural choice should be guided by deployment context rather than aggregate accuracy alone.
- Abstract(参考訳): 信頼性の高い作物病検出には、多様な取得条件に対して一貫して機能するモデルが必要であるが、既存の評価では、単一のアーキテクチャファミリやラボで生成されたデータセットに重点を置いていることが多い。
本研究は,CNN(Convolutional Neural Networks),VLM(Vision-Language Models),VLM(Generative VLMs)という,細粒度作物病分類のための3つのモデルパラダイムの体系的比較を示す。
このベンチマークは16の作物と41の病気にまたがる111kの画像と、実験室と現場の画像を明確に分離するベンチマークであり、標準化されたトレーニングと評価のためのバランスの取れた30kサブセットである。
すべてのモデルは、マクロF1とParse成功率(PSR)を使用して、完全、ラボオン、フィールドオンリーのトレーニングレシシシで統一されたプロトコルでトレーニングされ、評価される。
その結果、異なるパフォーマンスプロファイルが明らかになった。
CNNは画像の精度が最も高いが、ドメインシフトによって劣化する。
対照的なVLMは、競合するクロスドメイン性能を持つ堅牢でパラメータ効率の良い代替手段を提供する。
生成VLMは、自由テキスト生成に起因する追加の障害モードがあるにもかかわらず、分散変動に対する強いレジリエンスを示す。
これらの知見は、アーキテクチャの選択は、正確性のみを集約するのではなく、デプロイメントコンテキストによってガイドされるべきであることを示している。
関連論文リスト
- XAI and Few-shot-based Hybrid Classification Model for Plant Leaf Disease Prognosis [8.399688944263843]
このフレームワークは、実世界のデータ制約のある農業病モニタリングアプリケーションに有望なソリューションを提供する。
このモデルは高い精度、精度、リコール、F1スコアを連続的に達成し、様々な疾患の段階では92%を超えることがよくある。
論文 参考訳(メタデータ) (2026-03-03T13:29:35Z) - Did Models Sufficient Learn? Attribution-Guided Training via Subset-Selected Counterfactual Augmentation [61.248535801314375]
Subset-Selected Counterfactual Augmentation (SS-CA)
我々は,モデル予測を選択的に変更可能な最小空間領域集合を識別するために,対実的LIMAを開発した。
実験により,SS-CAは分布内テストデータ(ID)の一般化を改善し,分布外ベンチマーク(OOD)において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-11-15T08:39:22Z) - Robust Plant Disease Diagnosis with Few Target-Domain Samples [1.4401311275746886]
優先サンプリングを用いた学習フレームワークTarget-Aware Metric Learningを提案する。
TMPSは、ターゲット(デプロイ)ドメインから限られた数のラベル付きサンプルにアクセスすると仮定して動作する。
TMPSは、同じソースとターゲットのサンプルを併用してトレーニングされたモデルを上回る。
論文 参考訳(メタデータ) (2025-10-14T18:32:57Z) - Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文 参考訳(メタデータ) (2025-10-03T14:00:32Z) - Soybean Disease Detection via Interpretable Hybrid CNN-GNN: Integrating MobileNetV2 and GraphSAGE with Cross-Modal Attention [1.927711700724334]
大豆の葉の病原体の検出は農業の生産性にとって重要であるが、視覚的に類似した症状と限定的な解釈可能性のために課題に直面している。
本稿では,局所化特徴抽出のためのMobileNetV2とリレーショナルモデリングのためのGraphSAGEを相乗化する,解釈可能なハイブリッドCNN-Graph Neural Network(GNN)フレームワークを提案する。
クロスモーダル解釈はGrad-CAMおよびEigen-CAMビジュアライゼーションを通じて実現され、熱マップを生成して疾患の流入領域をハイライトする。
論文 参考訳(メタデータ) (2025-03-03T08:12:09Z) - Benchmarking Zero-Shot Robustness of Multimodal Foundation Models: A Pilot Study [61.65123150513683]
CLIPのようなマルチモーダル基盤モデルは、最先端のゼロショット結果を生成する。
これらのモデルは、ImageNetでトレーニングされた教師付きモデルのパフォーマンスを一致させることで、ロバスト性ギャップを埋めることが報告されている。
CLIPは、ベンチマーク上の教師付きImageNetモデルと比較して、かなりの堅牢性低下をもたらすことを示す。
論文 参考訳(メタデータ) (2024-03-15T17:33:49Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。