論文の概要: ViTaL: An Advanced Framework for Automated Plant Disease Identification
in Leaf Images Using Vision Transformers and Linear Projection For Feature
Reduction
- arxiv url: http://arxiv.org/abs/2402.17424v2
- Date: Wed, 28 Feb 2024 02:16:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 11:48:36.021248
- Title: ViTaL: An Advanced Framework for Automated Plant Disease Identification
in Leaf Images Using Vision Transformers and Linear Projection For Feature
Reduction
- Title(参考訳): ViTaL:視覚変換器と線形投影を用いた葉画像中の植物病自動識別のための高度なフレームワーク
- Authors: Abhishek Sebastian, Annis Fathima A, Pragna R, Madhan Kumar S,
Yaswanth Kannan G, Vinay Murali
- Abstract要約: 本稿では,植物葉画像中の疾患の自動識別のための堅牢な枠組みを提案する。
このフレームワークには、いくつかの重要なステージが組み込まれており、疾患の認識精度が向上している。
本報告では, 病原葉を全方位でスキャンするハードウェア設計を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Our paper introduces a robust framework for the automated identification of
diseases in plant leaf images. The framework incorporates several key stages to
enhance disease recognition accuracy. In the pre-processing phase, a thumbnail
resizing technique is employed to resize images, minimizing the loss of
critical image details while ensuring computational efficiency. Normalization
procedures are applied to standardize image data before feature extraction.
Feature extraction is facilitated through a novel framework built upon Vision
Transformers, a state-of-the-art approach in image analysis. Additionally,
alternative versions of the framework with an added layer of linear projection
and blockwise linear projections are explored. This comparative analysis allows
for the evaluation of the impact of linear projection on feature extraction and
overall model performance. To assess the effectiveness of the proposed
framework, various Convolutional Neural Network (CNN) architectures are
utilized, enabling a comprehensive evaluation of linear projection's influence
on key evaluation metrics. The findings demonstrate the efficacy of the
proposed framework, with the top-performing model achieving a Hamming loss of
0.054. Furthermore, we propose a novel hardware design specifically tailored
for scanning diseased leaves in an omnidirectional fashion. The hardware
implementation utilizes a Raspberry Pi Compute Module to address low-memory
configurations, ensuring practicality and affordability. This innovative
hardware solution enhances the overall feasibility and accessibility of the
proposed automated disease identification system. This research contributes to
the field of agriculture by offering valuable insights and tools for the early
detection and management of plant diseases, potentially leading to improved
crop yields and enhanced food security.
- Abstract(参考訳): 本稿では,植物葉画像中の疾患の自動識別のための堅牢な枠組みを提案する。
このフレームワークは、病気認識の精度を高めるためにいくつかの重要な段階を組み込んでいる。
プリプロセッシング段階では、画像のリサイズにサムネイルリサイズ技術が用いられ、重要な画像詳細の損失を最小限に抑えつつ、計算効率を確保できる。
特徴抽出の前に画像データの標準化に正規化手順を適用する。
画像解析における最先端のアプローチであるvision transformers上に構築された新しいフレームワークによって、機能抽出が容易になる。
さらに、線形射影とブロックワイズ線形射影の追加層を持つフレームワークの代替バージョンも検討されている。
この比較分析により、線形射影が特徴抽出および全体モデル性能に与える影響を評価することができる。
提案手法の有効性を評価するために,様々な畳み込みニューラルネットワーク(CNN)アーキテクチャを用いて,線形射影が鍵評価指標に与える影響を包括的に評価する。
その結果, 提案手法の有効性が示され, トップパフォーマンスモデルではハミングの損失が0.054。
さらに,病葉を全方位的にスキャンするための新しいハードウェア設計を提案する。
ハードウェア実装では、Raspberry Pi Compute Moduleを使用して低メモリ構成に対応し、実用性と手頃さを確保する。
この革新的なハードウェアソリューションは、提案する自動疾患識別システムの全体的な実現可能性とアクセシビリティを高める。
この研究は、植物病の早期発見と管理のための貴重な洞察とツールを提供することで、農業の分野で貢献し、収穫量の向上と食料安全保障の向上に繋がる可能性がある。
関連論文リスト
- Object Detection for Medical Image Analysis: Insights from the RT-DETR Model [40.593685087097995]
本稿では,RT-DETRモデルに基づく複雑な画像データ解析のための新しい検出フレームワークの適用について述べる。
RT-DETRモデルはTransformerベースのアーキテクチャ上に構築され,高次元かつ複雑な視覚データ処理に優れ,堅牢性と精度が向上した。
論文 参考訳(メタデータ) (2025-01-27T20:02:53Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Diffusion Model Driven Test-Time Image Adaptation for Robust Skin Lesion Classification [24.08402880603475]
テストデータ上でのモデルの精度を高めるためのテスト時間画像適応手法を提案する。
拡散モデルを用いて、対象の試験画像をソース領域に投影して修正する。
私たちの手法は、さまざまな汚職、アーキテクチャ、データレシエーションにおいて、堅牢性をより堅牢にします。
論文 参考訳(メタデータ) (2024-05-18T13:28:51Z) - OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System [7.1083241462091165]
我々は,光学的文字認識(OCR)を基本とする外部モダリティ誘導データマイニングフレームワークを導入し,画像から統計的特徴を抽出する。
提案手法の重要な側面は、単一のモーダル認識モデルを用いて抽出された外部モーダル特徴のアライメントであり、畳み込みニューラルネットワークによって符号化された画像特徴である。
本手法は欠陥検出モデルのリコール率を大幅に向上させ,挑戦シナリオにおいても高い堅牢性を維持する。
論文 参考訳(メタデータ) (2024-03-18T07:41:39Z) - Improving FHB Screening in Wheat Breeding Using an Efficient Transformer
Model [0.0]
フサリウム・ヘッド・ブライト(Fusarium head blight)は、小さな穀物に毎年重大な経済的損失をもたらす壊滅的な病気である。
FHBの早期検出のために,教師付き機械学習アルゴリズムを用いて画像処理技術を開発した。
変圧器モデルにU-Netネットワークの局所表現機能を統合するために,新しいContext Bridgeを提案する。
論文 参考訳(メタデータ) (2023-08-07T15:44:58Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Less is More: Lighter and Faster Deep Neural Architecture for Tomato
Leaf Disease Classification [0.36700088931938835]
本研究は,トマト葉の病原体を検出するための,手軽な伝達学習に基づくアプローチを提案する。
効果的な前処理手法を用いて、照度補正による葉画像の高精細化を行い、分類を改良する。
提案アーキテクチャは99.30%の精度でモデルサイズ9.60MBと4.87M浮動小数点演算を実現している。
論文 参考訳(メタデータ) (2021-09-06T12:14:02Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。