Fugu-MT 論文翻訳(概要): Attention mechanisms and transfer learning for robust peach leaf damage classification under domain shift

論文の概要: Attention mechanisms and transfer learning for robust peach leaf damage classification under domain shift

arxiv url: http://arxiv.org/abs/2606.02045v1
Date: Mon, 01 Jun 2026 10:36:01 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-02 21:34:31.799804
Title: Attention mechanisms and transfer learning for robust peach leaf damage classification under domain shift
Title（参考訳）: ドメインシフト下におけるロバスト桃葉損傷分類の注意機構と伝達学習
Authors: Adrián Cánovas-Rodriguez, Miguel A. González-Illán, Maria Fernanda García-Cruz, Pedro Nortes Tortosa, José Salvador Rubio-Asensio, Miguel A. Zamora Izquierdo, Juan Antonio Martínez Navarro, Antonio F. Skarmeta,
Abstract要約: 気候変動は、しばしば視覚的に類似した葉の症状を引き起こす害虫や病気を含む、無生物的なストレスと生物的な圧力を増大させる。モモ葉の損傷検出のための画像に基づく分類手法を提案する。
参考スコア（独自算出の注目度）: 2.820120779484705
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Artificial intelligence provides a practical framework for crop damage assessment from imagery data, supporting early decision-making in agricultural management. In peach orchards, climate change increases abiotic stress and biotic pressures, including pests and diseases, which often produce visually similar foliar symptoms. This overlap makes manual diagnosis difficult, especially across multiple fields with varying environmental conditions, highlighting the need for automated models with strong generalization ability. We propose an image-based classification approach for peach leaf damage detection. A benchmark dataset was created through manual annotation of publicly available images, consisting of 1,366 peach leaves across six damage categories. Several deep learning architectures were evaluated. EfficientNet models achieved the best results, with EfficientNetB0 reaching 92.9 percent accuracy, EfficientNetB3 achieving 91.5 percent, and EfficientNetB5 showing the strongest performance on minority classes. DenseNet121 reached 92.6 percent accuracy. The integration of the Convolutional Block Attention Module (CBAM) improved performance in several backbones, particularly EfficientNetB5 and InceptionV3, while showing limited or negative impact in others. The CBAM-enhanced EfficientNetB5 achieved the best overall accuracy of 93.3 percent. To evaluate robustness under realistic conditions, a local dataset of 180 images across four classes was collected, and transfer learning strategies were applied to address domain shift. Three fine-tuning strategies were tested. EfficientNetB3 combined with CBAM achieved the best performance in the local domain, reaching a 93 percent macro F1-score after transfer. Overall, attention-based models showed improved robustness for minority classes and better generalization across different field conditions.
Abstract（参考訳）: 人工知能は、画像データから作物の損傷を評価するための実践的な枠組みを提供し、農業経営における早期意思決定を支援する。モモの果樹園では、気候変動は、しばしば視覚的に類似した葉の症状を引き起こす害虫や病気を含む、無生物的なストレスや生物的な圧力を増大させる。この重複により、特に環境条件の異なる複数の分野において手動診断が困難になり、強力な一般化能力を持つ自動化モデルの必要性が強調される。モモ葉の損傷検出のための画像に基づく分類手法を提案する。ベンチマークデータセットは、6つの損傷カテゴリにわたる1,366個の桃の葉からなる、公開画像のマニュアルアノテーションによって作成されました。いくつかのディープラーニングアーキテクチャが評価された。 EfficientNetB0は92.9%、EfficientNetB3は91.5%、EfficientNetB5はマイノリティクラスで最高のパフォーマンスを示した。 DenseNet121は92.6%の精度に達した。 CBAM(Convolutional Block Attention Module)の統合により、いくつかのバックボーン、特にEfficientNetB5とInceptionV3のパフォーマンスが改善された。 CBAMで強化されたEfficientNetB5は、全体の93.3%の精度を達成した。現実的な条件下でのロバスト性を評価するため、4つのクラスにわたる180の画像の局所的データセットを収集し、ドメインシフトに対処するために転送学習戦略を適用した。 3つの微調整戦略が試験された。 CBAMと組み合わせた効率の良いNetB3は、転送後に93%のマクロF1スコアに達した。全体として、注意に基づくモデルは、マイノリティクラスに対する堅牢性を改善し、異なるフィールド条件におけるより良い一般化を示した。

関連論文リスト

Vision Foundation Models in Agriculture: Toward Domain-Specific Adaptation for Weed Herbicide Trials Assessment [1.8430060563461854]
除草剤試験は、植物種の正確な同定と除草剤による損傷の評価を必要とする。本研究では,除草剤の試薬評価に汎用的視覚基盤モデルを適用した。大規模でキュレートされた農業データセットに対して、自己教師付き学習アプローチを用いてトレーニングされたモデルは、除草剤試薬画像に最適化されたリッチで移動可能な表現を学習する。
論文参考訳（メタデータ） (2025-11-06T11:30:32Z)
Fine-Tuned CNN-Based Approach for Multi-Class Mango Leaf Disease Detection [1.057098647974782]
本研究は,マンゴー葉病のマルチクラス同定のための,事前学習した5つの畳み込みニューラルネットワーク,DenseNet201,InceptionV3,ResNet152V2,SeResNet152,Xceptionの性能について検討した。 DenseNet201は最高の結果を出し、99.33%の精度を達成し、個々のクラスに対して一貫して強力なメトリクスを出力した。
論文参考訳（メタデータ） (2025-10-06T19:47:26Z)
CBAM Integrated Attention Driven Model For Betel Leaf Diseases Classification With Explainable AI [0.48342038441006796]
本稿では,わずか213万パラメータ(8.13MB)の軽量CBAM-CNNモデルを提案する。葉病クラス間の微小変動を識別するモデルの能力は、統合的注意機構によって改善される。提案されたモデルは97%の精度、94%のリコール、95%のF1スコア、95.58%の精度を達成した。
論文参考訳（メタデータ） (2025-09-30T16:30:09Z)
Transfer Learning-Based CNN Models for Plant Species Identification Using Leaf Venation Patterns [0.0]
本研究では,3つのディープラーニングアーキテクチャ(ResNet50,MobileNetV2,EfficientNetB0)の有効性を評価する。
論文参考訳（メタデータ） (2025-09-03T21:23:09Z)
Hierarchical Self-Supervised Adversarial Training for Robust Vision Models in Histopathology [64.46054930696052]
敵対的攻撃は、医療のような重要な分野におけるビジョンモデルに重大な課題をもたらす。既存の自己監督型逆行訓練手法は、病理像の階層構造を見落としている。本稿では,これらの特性を活かした階層型自己監督適応訓練(HSAT)を提案する。
論文参考訳（メタデータ） (2025-03-13T17:59:47Z)
Design and Implementation of FourCropNet: A CNN-Based System for Efficient Multi-Crop Disease Detection and Management [3.4161054453684705]
本研究では,複数の作物の病原体を検出するための新しいディープラーニングモデルであるFourCropNetを提案する。 FourCropNetは、Grapeの99.7%、Cornの99.5%、組み合わせたデータセットの95.3%の最高精度を達成した。
論文参考訳（メタデータ） (2025-03-11T12:00:56Z)
One-Shot Learning for Periocular Recognition: Exploring the Effect of Domain Adaptation and Data Bias on Deep Representations [59.17685450892182]
広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。 SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
論文参考訳（メタデータ） (2023-07-11T09:10:16Z)
Stacking Ensemble Learning in Deep Domain Adaptation for Ophthalmic Image Classification [61.656149405657246]
ドメイン適応は、十分なラベルデータを取得することが困難な画像分類タスクに有効である。本稿では,3つのドメイン適応手法を拡張することで,アンサンブル学習を積み重ねるための新しい手法SELDAを提案する。 Age-Related Eye Disease Study (AREDS)ベンチマーク眼科データセットを用いた実験結果から,提案モデルの有効性が示された。
論文参考訳（メタデータ） (2022-09-27T14:19:00Z)
Improving Visual Grounding by Encouraging Consistent Gradient-based Explanations [58.442103936918805]
注意マスク整合性は,従来の方法よりも優れた視覚的グラウンドリング結果が得られることを示す。 AMCは効率的で実装が容易であり、どんな視覚言語モデルでも採用できるため一般的である。
論文参考訳（メタデータ） (2022-06-30T17:55:12Z)
To be Critical: Self-Calibrated Weakly Supervised Learning for Salient Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文参考訳（メタデータ） (2021-09-04T02:45:22Z)
Revisiting Batch Normalization for Improving Corruption Robustness [85.20742045853738]
モデルロバスト性を改善するために, モデルロバスト性を改善するために, バッチ正規化統計の修正を提案する。モデルを再トレーニングすることなく、BN統計をいくつかの表現サンプル上で単純に推定し、適応させることで、大きなマージンによる腐敗の堅牢性を向上させることが判明した。
論文参考訳（メタデータ） (2020-10-07T19:56:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。