論文の概要: An Explainable Vision Transformer with Transfer Learning Combined with Support Vector Machine Based Efficient Drought Stress Identification
- arxiv url: http://arxiv.org/abs/2407.21666v1
- Date: Wed, 31 Jul 2024 15:08:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-01 17:41:37.606339
- Title: An Explainable Vision Transformer with Transfer Learning Combined with Support Vector Machine Based Efficient Drought Stress Identification
- Title(参考訳): 支援ベクトルマシンによる効率的な干ばつ応力同定と伝達学習を組み合わせた説明可能な視覚変換器
- Authors: Aswini Kumar Patra, Ankit Varshney, Lingaraj Sahoo,
- Abstract要約: 視覚変換器(ViT)は、長距離依存を捉え、複雑な空間関係を捉えるための有望な代替手段を提供する。
航空画像を用いたジャガイモの干ばつストレス検出にViTの力を利用する,説明可能なディープラーニングパイプラインを提案する。
以上の結果から, 提案手法は干ばつストレス同定の精度を高めるだけでなく, 干ばつストレスにかかわる多彩な植物の特徴にも光を当てることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early detection of drought stress is critical for taking timely measures for reducing crop loss before the drought impact becomes irreversible. The subtle phenotypical and physiological changes in response to drought stress are captured by non-invasive imaging techniques and these imaging data serve as valuable resource for machine learning methods to identify drought stress. While convolutional neural networks (CNNs) are in wide use, vision transformers (ViTs) present a promising alternative in capturing long-range dependencies and intricate spatial relationships, thereby enhancing the detection of subtle indicators of drought stress. We propose an explainable deep learning pipeline that leverages the power of ViTs for drought stress detection in potato crops using aerial imagery. We applied two distinct approaches: a synergistic combination of ViT and support vector machine (SVM), where ViT extracts intricate spatial features from aerial images, and SVM classifies the crops as stressed or healthy and an end-to-end approach using a dedicated classification layer within ViT to directly detect drought stress. Our key findings explain the ViT model's decision-making process by visualizing attention maps. These maps highlight the specific spatial features within the aerial images that the ViT model focuses as the drought stress signature. Our findings demonstrate that the proposed methods not only achieve high accuracy in drought stress identification but also shedding light on the diverse subtle plant features associated with drought stress. This offers a robust and interpretable solution for drought stress monitoring for farmers to undertake informed decisions for improved crop management.
- Abstract(参考訳): 干ばつストレスの早期検出は、干ばつの影響が不可逆になる前に、作物の損失を減らすためのタイムリーな対策をとるために重要である。
干ばつストレスに対する微妙な表現型および生理的変化は、非侵襲的なイメージング技術によって捉えられ、これらの画像データは、干ばつストレスを特定する機械学習手法の貴重な資源となる。
畳み込みニューラルネットワーク(CNN)が広く使われている一方で、視覚トランスフォーマー(ViT)は、長距離依存を捉え、空間的関係を複雑にすることで、干ばつストレスの微妙な指標の検出を向上する、有望な代替手段を提供する。
航空画像を用いたジャガイモの干ばつストレス検出にViTの力を利用する,説明可能なディープラーニングパイプラインを提案する。
我々は,VTとサポートベクターマシン(SVM)の相乗的組み合わせにより,VTが空中画像から複雑な空間的特徴を抽出し,SVMが作物をストレスまたは健康であると分類し,VT内の専用分類層を用いて干ばつストレスを直接検出した。
我々の重要な知見は、注目マップを可視化することで、ViTモデルの意思決定プロセスを説明する。
これらの地図は、ViTモデルが干ばつストレスシグネチャとして注目する空中画像内の特定の空間的特徴を強調している。
以上の結果から, 提案手法は干ばつストレス同定の精度を高めるだけでなく, 干ばつストレスにかかわる多彩な植物の特徴にも光を当てることが示唆された。
これは、農家が作物管理を改善するための情報的な決定を下すために、干ばつストレスモニタリングのための堅牢で解釈可能なソリューションを提供する。
関連論文リスト
- Continuous Wavelet Transformation and VGG16 Deep Neural Network for Stress Classification in PPG Signals [0.22499166814992436]
本研究は,光胸腺X線信号によるストレス分類における画期的なアプローチを提案する。
連続ウェーブレット変換(CWT)を実証されたVGG16に組み込むことで,ストレス評価精度と信頼性を向上させる。
論文 参考訳(メタデータ) (2024-10-17T19:29:52Z) - S-E Pipeline: A Vision Transformer (ViT) based Resilient Classification Pipeline for Medical Imaging Against Adversarial Attacks [4.295229451607423]
Vision Transformer (ViT) は、医用画像における正確な疾患診断の自動化において広く普及している。
ViTは、致命的な疾患の故意の誤分類につながることによって、診断プロセスを妨げる可能性のある敵の攻撃に弱いままである。
本稿では,複数の前処理ステップを実行する新しい画像分類パイプライン,すなわちS-E Pipelineを提案する。
論文 参考訳(メタデータ) (2024-07-23T17:20:40Z) - Explainable Light-Weight Deep Learning Pipeline for Improved Drought Stress Identification [0.0]
作物の干ばつストレスの早期同定は、効果的な緩和対策と収量損失の低減に不可欠である。
本研究は,UAVが自然環境下で捕獲したジャガイモの干ばつストレスを分類するための,新しいディープラーニングフレームワークを提案する。
私たちの研究の重要な革新は、説明可能性のテクニックであるグラディエントクラスの活性化マッピング(Grad-CAM)の統合です。
論文 参考訳(メタデータ) (2024-04-15T18:26:03Z) - Dual Adversarial Resilience for Collaborating Robust Underwater Image
Enhancement and Perception [54.672052775549]
本研究では,水中画像の強調と検出を行うために,CARNetと呼ばれる協調的対向レジリエンスネットワークを導入する。
本稿では,ネットワークが様々な種類の攻撃を識別・除去できるように,視覚駆動型と知覚駆動型の両方による同時攻撃訓練戦略を提案する。
実験により,提案手法は画像の高画質化を図り,最先端の手法よりも平均6.71%高い検出精度が得られた。
論文 参考訳(メタデータ) (2023-09-03T06:52:05Z) - Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。
得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。
特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文 参考訳(メタデータ) (2023-03-24T14:14:25Z) - Semantic Image Segmentation with Deep Learning for Vine Leaf Phenotyping [59.0626764544669]
本研究では,ブドウの葉のイメージを意味的にセグメント化するためにDeep Learning法を用いて,葉の表現型自動検出システムを開発した。
私たちの研究は、成長や開発のような動的な特性を捉え定量化できる植物ライフサイクルのモニタリングに寄与します。
論文 参考訳(メタデータ) (2022-10-24T14:37:09Z) - LTT-GAN: Looking Through Turbulence by Inverting GANs [86.25869403782957]
本稿では,よく訓練されたGANによってカプセル化された視覚的事前情報を利用した最初の乱流緩和手法を提案する。
視覚的先行性に基づき、周期的な文脈距離で復元された画像の同一性を維持することを学ぶことを提案する。
本手法は, 回復した結果の視覚的品質と顔認証精度の両方において, 先行技術よりも優れていた。
論文 参考訳(メタデータ) (2021-12-04T16:42:13Z) - Potato Crop Stress Identification in Aerial Images using Deep
Learning-based Object Detection [60.83360138070649]
本稿では, 深層ニューラルネットワークを用いたジャガイモの空中画像解析手法を提案する。
主な目的は、植物レベルでの健康作物とストレス作物の自動空間認識を実証することである。
実験により、フィールド画像中の健康植物とストレス植物を識別し、平均Dice係数0.74を達成できることを示した。
論文 参考訳(メタデータ) (2021-06-14T21:57:40Z) - Identifying Water Stress in Chickpea Plant by Analyzing Progressive
Changes in Shoot Images using Deep Learning [0.41998444721319217]
我々は,視覚的時間パターンを学習し,水ストレスカテゴリーを高い信頼性で予測するLSTM-CNNアーキテクチャを開発した。
提案したモデルは,JG-62ではtextbf98.52%,Pusa-372ではtextbf97.78%の天井レベル分類性能,およびチクピー植物データであった。
論文 参考訳(メタデータ) (2021-04-16T06:23:19Z) - Learning to Restore a Single Face Image Degraded by Atmospheric
Turbulence using CNNs [93.72048616001064]
このような条件下で撮影された画像は、幾何学的変形と空間のぼかしの組合せに悩まされる。
乱流劣化顔画像の復元問題に対する深層学習に基づく解法を提案する。
論文 参考訳(メタデータ) (2020-07-16T15:25:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。