論文の概要: ViTaL: An Advanced Framework for Automated Plant Disease Identification
in Leaf Images Using Vision Transformers and Linear Projection For Feature
Reduction
- arxiv url: http://arxiv.org/abs/2402.17424v1
- Date: Tue, 27 Feb 2024 11:32:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-28 16:33:04.672059
- Title: ViTaL: An Advanced Framework for Automated Plant Disease Identification
in Leaf Images Using Vision Transformers and Linear Projection For Feature
Reduction
- Title(参考訳): ViTaL:視覚変換器と線形投影を用いた葉画像中の植物病自動識別のための高度なフレームワーク
- Authors: Abhishek Sebastian, Annis Fathima A, Pragna R, Madhan Kumar S,
Yaswanth Kannan G, Vinay Murali
- Abstract要約: 本稿では,植物葉画像中の疾患の自動識別のための堅牢な枠組みを提案する。
このフレームワークには、いくつかの重要なステージが組み込まれており、疾患の認識精度が向上している。
本報告では, 病原葉を全方位でスキャンするハードウェア設計を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Our paper introduces a robust framework for the automated identification of
diseases in plant leaf images. The framework incorporates several key stages to
enhance disease recognition accuracy. In the pre-processing phase, a thumbnail
resizing technique is employed to resize images, minimizing the loss of
critical image details while ensuring computational efficiency. Normalization
procedures are applied to standardize image data before feature extraction.
Feature extraction is facilitated through a novel framework built upon Vision
Transformers, a state-of-the-art approach in image analysis. Additionally,
alternative versions of the framework with an added layer of linear projection
and blockwise linear projections are explored. This comparative analysis allows
for the evaluation of the impact of linear projection on feature extraction and
overall model performance. To assess the effectiveness of the proposed
framework, various Convolutional Neural Network (CNN) architectures are
utilized, enabling a com- prehensive evaluation of linear projection's
influence on key evaluation metrics. The findings demonstrate the efficacy of
the proposed framework, with the top- performing model achieving a Hamming loss
of 0.054. Furthermore, we propose a novel hardware design specifically tailored
for scanning diseased leaves in an omnidirectional fashion. The hardware
implementation utilizes a Raspberry Pi Compute Module to address low-memory
configurations, ensuring practicality and affordability. This innovative
hardware solution enhances the overall feasibility and accessibility of the
proposed automated disease identification system. This research contributes to
the field of agriculture by offering valuable insights and tools for the early
detection and management of plant diseases, potentially leading to improved
crop yields and enhanced food security.
- Abstract(参考訳): 本稿では,植物葉画像中の疾患の自動識別のための堅牢な枠組みを提案する。
このフレームワークは、病気認識の精度を高めるためにいくつかの重要な段階を組み込んでいる。
プリプロセッシング段階では、画像のリサイズにサムネイルリサイズ技術が用いられ、重要な画像詳細の損失を最小限に抑えつつ、計算効率を確保できる。
特徴抽出の前に画像データの標準化に正規化手順を適用する。
画像解析における最先端のアプローチであるvision transformers上に構築された新しいフレームワークによって、機能抽出が容易になる。
さらに、線形射影とブロックワイズ線形射影の追加層を持つフレームワークの代替バージョンも検討されている。
この比較分析により、線形射影が特徴抽出および全体モデル性能に与える影響を評価することができる。
提案手法の有効性を評価するために,様々な畳み込みニューラルネットワーク(CNN)アーキテクチャを用いて,線形射影が鍵評価指標に与える影響を総合的に評価する。
その結果, 提案手法の有効性が示され, トップパフォーマンスモデルのハミング損失は0.054。
さらに,病葉を全方位的にスキャンするための新しいハードウェア設計を提案する。
ハードウェア実装では、Raspberry Pi Compute Moduleを使用して低メモリ構成に対応し、実用性と手頃さを確保する。
この革新的なハードウェアソリューションは、提案する自動疾患識別システムの全体的な実現可能性とアクセシビリティを高める。
この研究は、植物病の早期発見と管理のための貴重な洞察とツールを提供することで、農業の分野で貢献し、収穫量の向上と食料安全保障の向上に繋がる可能性がある。
関連論文リスト
- Small data deep learning methodology for in-field disease detection [6.2747249113031325]
本稿では,ポテト作物の遅発症状を軽度に検出できる最初の機械学習モデルを提案する。
提案手法は, 焦点損失関数を持つ深部畳み込みニューラルネットワークをベースとした, パッチ方式による高分解能画像の高精細化を実現する。
本モデルでは, 早期症状の同定に高い精度と有効性を示した。
論文 参考訳(メタデータ) (2024-09-25T17:31:17Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Diffusion Model Driven Test-Time Image Adaptation for Robust Skin Lesion Classification [24.08402880603475]
テストデータ上でのモデルの精度を高めるためのテスト時間画像適応手法を提案する。
拡散モデルを用いて、対象の試験画像をソース領域に投影して修正する。
私たちの手法は、さまざまな汚職、アーキテクチャ、データレシエーションにおいて、堅牢性をより堅牢にします。
論文 参考訳(メタデータ) (2024-05-18T13:28:51Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System [7.1083241462091165]
我々は,光学的文字認識(OCR)を基本とする外部モダリティ誘導データマイニングフレームワークを導入し,画像から統計的特徴を抽出する。
提案手法の重要な側面は、単一のモーダル認識モデルを用いて抽出された外部モーダル特徴のアライメントであり、畳み込みニューラルネットワークによって符号化された画像特徴である。
本手法は欠陥検出モデルのリコール率を大幅に向上させ,挑戦シナリオにおいても高い堅牢性を維持する。
論文 参考訳(メタデータ) (2024-03-18T07:41:39Z) - Improving FHB Screening in Wheat Breeding Using an Efficient Transformer
Model [0.0]
フサリウム・ヘッド・ブライト(Fusarium head blight)は、小さな穀物に毎年重大な経済的損失をもたらす壊滅的な病気である。
FHBの早期検出のために,教師付き機械学習アルゴリズムを用いて画像処理技術を開発した。
変圧器モデルにU-Netネットワークの局所表現機能を統合するために,新しいContext Bridgeを提案する。
論文 参考訳(メタデータ) (2023-08-07T15:44:58Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Less is More: Lighter and Faster Deep Neural Architecture for Tomato
Leaf Disease Classification [0.36700088931938835]
本研究は,トマト葉の病原体を検出するための,手軽な伝達学習に基づくアプローチを提案する。
効果的な前処理手法を用いて、照度補正による葉画像の高精細化を行い、分類を改良する。
提案アーキテクチャは99.30%の精度でモデルサイズ9.60MBと4.87M浮動小数点演算を実現している。
論文 参考訳(メタデータ) (2021-09-06T12:14:02Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。