論文の概要: TCLeaf-Net: a transformer-convolution framework with global-local attention for robust in-field lesion-level plant leaf disease detection
- arxiv url: http://arxiv.org/abs/2512.12357v1
- Date: Sat, 13 Dec 2025 15:03:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.227981
- Title: TCLeaf-Net: a transformer-convolution framework with global-local attention for robust in-field lesion-level plant leaf disease detection
- Title(参考訳): TCLeaf-Net : フィールド内病変レベル植物葉病検出のためのグローバル・ローカル・アテンションを用いたトランスフォーマー・コンボリューション・フレームワーク
- Authors: Zishen Song, Yongjian Zhu, Dong Wang, Hongzhan Liu, Lingyu Jiang, Yongxing Duan, Zehua Zhang, Sihan Li, Jiarui Li,
- Abstract要約: Daylily-Leafは1,746枚のRGB画像と7,839個の病変からなる2つの病変レベルのデータセットである。
実地利用に最適化された変圧器・畳み込みハイブリッド検出器TCLeaf-Netを提案する。
- 参考スコア(独自算出の注目度): 13.963787476506292
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Timely and accurate detection of foliar diseases is vital for safeguarding crop growth and reducing yield losses. Yet, in real-field conditions, cluttered backgrounds, domain shifts, and limited lesion-level datasets hinder robust modeling. To address these challenges, we release Daylily-Leaf, a paired lesion-level dataset comprising 1,746 RGB images and 7,839 lesions captured under both ideal and in-field conditions, and propose TCLeaf-Net, a transformer-convolution hybrid detector optimized for real-field use. TCLeaf-Net is designed to tackle three major challenges. To mitigate interference from complex backgrounds, the transformer-convolution module (TCM) couples global context with locality-preserving convolution to suppress non-leaf regions. To reduce information loss during downsampling, the raw-scale feature recalling and sampling (RSFRS) block combines bilinear resampling and convolution to preserve fine spatial detail. To handle variations in lesion scale and feature shifts, the deformable alignment block with FPN (DFPN) employs offset-based alignment and multi-receptive-field perception to strengthen multi-scale fusion. Experimental results show that on the in-field split of the Daylily-Leaf dataset, TCLeaf-Net improves mAP@50 by 5.4 percentage points over the baseline model, reaching 78.2\%, while reducing computation by 7.5 GFLOPs and GPU memory usage by 8.7\%. Moreover, the model outperforms recent YOLO and RT-DETR series in both precision and recall, and demonstrates strong performance on the PlantDoc, Tomato-Leaf, and Rice-Leaf datasets, validating its robustness and generalizability to other plant disease detection scenarios.
- Abstract(参考訳): 葉病のタイムリーかつ正確な検出は、作物の生育の保護と収量損失の低減に不可欠である。
しかし、実地環境では、乱雑な背景、ドメインシフト、限られた病変レベルのデータセットがロバストなモデリングを妨げる。
これらの課題に対処するため,1,746枚のRGB画像と7,839個の病変からなる2組の病変レベルデータセットであるDaylily-Leafをリリースし,実地用に最適化された変圧器・畳み込みハイブリッド検出器であるTCLeaf-Netを提案する。
TCLeaf-Netは3つの大きな課題に取り組むように設計されている。
複雑な背景からの干渉を軽減するため、トランスフォーマー・コンボリューション・モジュール(TCM)は、グローバルコンテキストと局所性を保存するコンボリューションを結合し、非リーフ領域を抑制する。
ダウンサンプリング時の情報損失を低減するため、RSFRSブロックは双線形再サンプリングと畳み込みを組み合わせ、微細な空間的詳細を保存する。
FPN(DFPN)による変形可能なアライメントブロックは、病変のスケールや特徴の変化に対処するため、オフセットベースのアライメントと多受容場知覚を用いてマルチスケール核融合を強化する。
実験結果によると、Daylily-Leafデータセットのフィールド内分割では、TCLeaf-NetはmAP@50をベースラインモデルよりも5.4ポイント改善し、78.2\%に達した。
さらに、このモデルは最近のYOLOシリーズとRT-DETRシリーズを精度とリコールの両方で上回り、プラントドク、トマトリーフ、ライスリーフデータセットに強い性能を示し、その堅牢性と他の植物病検出シナリオへの一般化性を検証している。
関連論文リスト
- DAONet-YOLOv8: An Occlusion-Aware Dual-Attention Network for Tea Leaf Pest and Disease Detection [2.661320179262946]
本報告では,茶葉害虫や病原体を正確に検出するための3つの改良点を有するYOLOv8変異体を提案する。
既存のNet-YOLOv8は92.97%の精度、92.80%のリコール、97.10%のmAP@50、76.90%のmAP@50:95を達成し、YOLOv8nベースラインをそれぞれ2.34、4.68、1.40、および1.80ポイント上回っている。
論文 参考訳(メタデータ) (2025-11-28T14:28:30Z) - A Multi-Strategy Framework for Enhancing Shatian Pomelo Detection in Real-World Orchards [5.779478641472218]
本研究は,シャチのポメロ検出の精度に影響を与える4つの重要な課題を明らかにする。
これらの課題を軽減するため,本稿ではマルチストラテジー・フレームワークを提案する。
提案するネットワークは,他の最先端検出手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2025-10-11T01:30:48Z) - YOLO11-CR: a Lightweight Convolution-and-Attention Framework for Accurate Fatigue Driving Detection [0.0]
本稿では,リアルタイム疲労モニタリングに適した軽量で効率的な物体検出モデルYOLO11-CRを提案する。
YOLO11-CR は Convolution-and-Attention Fusion Module (CAFM) と Rectangular Module (RCM) の2つの重要なモジュールを導入した。
DSMデータセットの実験では、YOLO11-CRは87.17%の精度、83.86%のリコール、88.09%のmAP@50、55.93%のmAP@50-95を達成した。
論文 参考訳(メタデータ) (2025-08-16T07:19:04Z) - Interpretable AI for Time-Series: Multi-Model Heatmap Fusion with Global Attention and NLP-Generated Explanations [1.331812695405053]
本稿では,ResNetが生成するヒートマップと,グローバルに重み付けされた入力サリエンシを備えた再構成された2次元変換器を統合することで,モデル解釈可能性を向上させる新しいフレームワークを提案する。
本手法は、勾配重み付きアクティベーションマップ(ResNet)とトランスフォーマーのアテンションロールアウトを統合可視化にマージし、空間的・時間的アライメントを実現する。
臨床(ECG不整脈検出)および産業データセットに関する実証的評価は,有意な改善を示した。
論文 参考訳(メタデータ) (2025-06-30T20:04:35Z) - ReconMOST: Multi-Layer Sea Temperature Reconstruction with Observations-Guided Diffusion [48.540756751934836]
ReconMOSTは多層水温再構築のためのデータ駆動誘導拡散モデルフレームワークである。
提案手法はMLベースのSST再構成をグローバルな多層設定に拡張し,92.5%以上の欠落データを処理する。
論文 参考訳(メタデータ) (2025-06-12T06:27:22Z) - Loss-Guided Model Sharing and Local Learning Correction in Decentralized Federated Learning for Crop Disease Classification [3.344876133162209]
本稿では、検証損失(Loss_val)を用いて、ピア間のモデル共有を誘導し、重み付けパラメータによって制御される適応的損失関数を介して局所学習を補正する、分散型フェデレートラーニング(DFL)フレームワークを提案する。
その結果、DFLアプローチは精度と収束速度を向上するだけでなく、異種データ環境における一般化と堅牢性の向上も保証している。
論文 参考訳(メタデータ) (2025-05-29T04:12:53Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - TinyAD: Memory-efficient anomaly detection for time series data in
Industrial IoT [43.207210990362825]
我々は,リアルタイムな異常検出のためのCNNのオンボード推論を効率的に行うための,Tiny Anomaly Detection (TinyAD) という新しいフレームワークを提案する。
CNNのピークメモリ消費を低減するため、我々は2つの相補的戦略、 in-place と patch-by-patch のメモリ再スケジューリングについて検討する。
我々のフレームワークは、オーバーヘッドを無視してピークメモリ消費を2~5倍削減できる。
論文 参考訳(メタデータ) (2023-03-07T02:56:15Z) - The Lazy Neuron Phenomenon: On Emergence of Activation Sparsity in
Transformers [59.87030906486969]
本稿では,Transformer アーキテクチャを用いた機械学習モデルにおいて,アクティベーションマップが疎いという興味深い現象について考察する。
本稿では, 自然言語処理と視覚処理の両方において, スパーシリティが顕著な現象であることを示す。
本稿では,変換器のFLOP数を大幅に削減し,効率を向上する手法について論じる。
論文 参考訳(メタデータ) (2022-10-12T15:25:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。