論文の概要: MobilePlantViT: A Mobile-friendly Hybrid ViT for Generalized Plant Disease Image Classification
- arxiv url: http://arxiv.org/abs/2503.16628v1
- Date: Thu, 20 Mar 2025 18:34:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:58:48.826584
- Title: MobilePlantViT: A Mobile-friendly Hybrid ViT for Generalized Plant Disease Image Classification
- Title(参考訳): MobilePlantViT: 一般的な植物病画像分類のためのモバイルフレンドリーなハイブリッドVT
- Authors: Moshiur Rahman Tonmoy, Md. Mithun Hossain, Nilanjan Dey, M. F. Mridha,
- Abstract要約: 植物病は世界の食料安全保障を著しく脅かす。
深層学習モデルは植物病の同定において顕著な性能を示した。
これらのモデルをモバイルおよびエッジデバイスにデプロイすることは、高い計算要求とリソース制約のため、依然として困難である。
植物病の一般的な分類のために設計された新しいハイブリッドビジョントランスフォーマー(ViT)アーキテクチャであるMobilePlantViTを提案する。
- 参考スコア(独自算出の注目度): 2.0681376988193843
- License:
- Abstract: Plant diseases significantly threaten global food security by reducing crop yields and undermining agricultural sustainability. AI-driven automated classification has emerged as a promising solution, with deep learning models demonstrating impressive performance in plant disease identification. However, deploying these models on mobile and edge devices remains challenging due to high computational demands and resource constraints, highlighting the need for lightweight, accurate solutions for accessible smart agriculture systems. To address this, we propose MobilePlantViT, a novel hybrid Vision Transformer (ViT) architecture designed for generalized plant disease classification, which optimizes resource efficiency while maintaining high performance. Extensive experiments across diverse plant disease datasets of varying scales show our model's effectiveness and strong generalizability, achieving test accuracies ranging from 80% to over 99%. Notably, with only 0.69 million parameters, our architecture outperforms the smallest versions of MobileViTv1 and MobileViTv2, despite their higher parameter counts. These results underscore the potential of our approach for real-world, AI-powered automated plant disease classification in sustainable and resource-efficient smart agriculture systems. All codes will be available in the GitHub repository: https://github.com/moshiurtonmoy/MobilePlantViT
- Abstract(参考訳): 植物の病気は、作物の収穫量を減らし、農業の持続可能性を損なうことで、世界の食料安全保障を著しく脅かしている。
AIによる自動分類は、植物病の識別において優れたパフォーマンスを示すディープラーニングモデルによって、有望なソリューションとして浮上している。
しかし、これらのモデルをモバイルおよびエッジデバイスにデプロイすることは、高い計算要求とリソース制約のために依然として困難であり、アクセス可能なスマート農業システムのための軽量で正確なソリューションの必要性を強調している。
そこで本研究では,植物病の一般的な分類のためのハイブリッドビジョントランスフォーマー(ViT)アーキテクチャであるMobilePlantViTを提案する。
様々なスケールの植物病データセットに対する大規模な実験は、我々のモデルの有効性と強力な一般化性を示し、80%から99%以上のテスト精度を達成した。
特に、パラメータ数はわずか0.69万で、MobileViTv1とMobileViTv2の最小バージョンよりもパフォーマンスが優れています。
これらの結果は、持続可能な資源効率の高いスマート農業システムにおける、実世界のAIを活用した自動植物病分類に対する我々のアプローチの可能性を裏付けるものである。
すべてのコードはGitHubリポジトリで利用可能になる。
関連論文リスト
- Smooth Handovers via Smoothed Online Learning [48.953313950521746]
まず、欧州の商用モバイルネットワークオペレータ(MNO)から4000万人以上のユーザを対象に、HOに対する重要な特徴とパフォーマンスへの影響を理解し、明らかにするために、広範なデータセットを分析した。
本研究は, HO故障/遅延と無線セルとエンドユーザーデバイスの特徴の相関関係を明らかにする。
本稿では,HO最適化にデバイスとセルの機能を組み込むことで,既存のアプローチを拡張したスムーズで高精度なHOのための現実的なシステムモデルを提案する。
論文 参考訳(メタデータ) (2025-01-14T13:16:33Z) - Edge-AI for Agriculture: Lightweight Vision Models for Disease Detection in Resource-Limited Settings [0.0]
提案システムは,エッジデバイスへの展開に最適化された高度なオブジェクト検出,分類,セグメンテーションモデルを統合する。
本研究は, 精度, 計算効率, 一般化能力に着目し, 各種最先端モデルの性能を評価する。
論文 参考訳(メタデータ) (2024-12-23T06:48:50Z) - Generating Diverse Agricultural Data for Vision-Based Farming Applications [74.79409721178489]
このモデルは, 植物の成長段階, 土壌条件の多様性, 照明条件の異なるランダム化フィールド配置をシミュレートすることができる。
我々のデータセットにはセマンティックラベル付き12,000の画像が含まれており、精密農業におけるコンピュータビジョンタスクの包括的なリソースを提供する。
論文 参考訳(メタデータ) (2024-03-27T08:42:47Z) - Forging Vision Foundation Models for Autonomous Driving: Challenges,
Methodologies, and Opportunities [59.02391344178202]
ビジョンファウンデーションモデル(VFM)は、幅広いAIアプリケーションのための強力なビルディングブロックとして機能する。
総合的なトレーニングデータの不足、マルチセンサー統合の必要性、多様なタスク固有のアーキテクチャは、VFMの開発に重大な障害をもたらす。
本稿では、自動運転に特化したVFMを鍛造する上で重要な課題について述べるとともに、今後の方向性を概説する。
論文 参考訳(メタデータ) (2024-01-16T01:57:24Z) - SugarViT -- Multi-objective Regression of UAV Images with Vision
Transformers and Deep Label Distribution Learning Demonstrated on Disease
Severity Prediction in Sugar Beet [3.2925222641796554]
この研究は、大規模植物固有の特徴アノテーションを自動化するための機械学習フレームワークを導入する。
我々は、SugarViTと呼ばれる重症度評価のための効率的なビジョントランスフォーマーモデルを開発した。
この特殊なユースケースでモデルは評価されるが、様々な画像に基づく分類や回帰タスクにも可能な限り汎用的に適用可能である。
論文 参考訳(メタデータ) (2023-11-06T13:01:17Z) - Crop Disease Classification using Support Vector Machines with Green
Chromatic Coordinate (GCC) and Attention based feature extraction for IoT
based Smart Agricultural Applications [0.0]
植物病は農業栽培中の葉に悪影響を及ぼし、作物の生産量と経済的価値に大きな損失をもたらす。
各種機械学習(ML)と深層学習(DL)アルゴリズムが開発され,植物病の検出のための研究が行われている。
本稿では、注意に基づく特徴抽出、RGBチャネルに基づく色分析、SVM(Support Vector Machines)による性能向上による事前作業に基づく新しい分類手法を提案する。
論文 参考訳(メタデータ) (2023-11-01T10:44:49Z) - Filling the Missing: Exploring Generative AI for Enhanced Federated
Learning over Heterogeneous Mobile Edge Devices [72.61177465035031]
ローカルデータのFIMI(FIlling the MIssing)部分を活用することにより,これらの課題に対処する,AIを活用した創発的なフェデレーション学習を提案する。
実験の結果,FIMIはデバイス側エネルギーの最大50%を節約し,目標とするグローバルテスト精度を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-21T12:07:04Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - Explainable vision transformer enabled convolutional neural network for
plant disease identification: PlantXViT [11.623005206620498]
植物病は世界の作物の損失の主な原因であり、世界経済に影響を及ぼす。
本研究では、植物病の同定のために、ビジョントランスフォーマーにより「PlantXViT」と呼ばれる畳み込みニューラルネットワークモデルが提案される。
提案したモデルは、わずか0.8万のトレーニング可能なパラメータを持つ軽量な構造であり、IoTベースのスマート農業サービスに適している。
論文 参考訳(メタデータ) (2022-07-16T12:05:06Z) - Vision Transformers For Weeds and Crops Classification Of High
Resolution UAV Images [3.1083892213758104]
ビジョントランスフォーマー(ViT)モデルは、畳み込み操作を適用することなく、競争またはより良い結果を達成することができる。
実験の結果,ラベル付きトレーニングデータでは,最新のCNNモデルと比較して,ViTモデルの方が優れていた。
論文 参考訳(メタデータ) (2021-09-06T19:58:54Z) - Two-View Fine-grained Classification of Plant Species [66.75915278733197]
本研究では,2視点の葉のイメージ表現に基づく新しい手法と,植物種の粒度認識のための階層的分類戦略を提案する。
シームズ畳み込みニューラルネットワークに基づく深度測定は、多数のトレーニングサンプルへの依存を減らし、新しい植物種に拡張性を持たせるために用いられる。
論文 参考訳(メタデータ) (2020-05-18T21:57:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。