論文の概要: Efficient Leaf Disease Classification and Segmentation using Midpoint Normalization Technique and Attention Mechanism
- arxiv url: http://arxiv.org/abs/2505.21316v1
- Date: Tue, 27 May 2025 15:14:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.744326
- Title: Efficient Leaf Disease Classification and Segmentation using Midpoint Normalization Technique and Attention Mechanism
- Title(参考訳): 中点正規化法と注意機構を用いた効率的な葉病分類・分別
- Authors: Enam Ahmed Taufik, Antara Firoz Parsa, Seraj Al Mahmud Mostafa,
- Abstract要約: 画像前処理のための2段階変換手法であるミドルポイント正規化(MPN)を導入する。
分類パイプラインは、例外的なクラスバランスを維持しながら、93%の精度を達成する。
セグメンテーションタスクでは,MPNを付加した入力を用いて,U-Netアーキテクチャ内の同一の注意ブロックをシームレスに統合する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enhancing plant disease detection from leaf imagery remains a persistent challenge due to scarce labeled data and complex contextual factors. We introduce a transformative two-stage methodology, Mid Point Normalization (MPN) for intelligent image preprocessing, coupled with sophisticated attention mechanisms that dynamically recalibrate feature representations. Our classification pipeline, merging MPN with Squeeze-and-Excitation (SE) blocks, achieves remarkable 93% accuracy while maintaining exceptional class-wise balance. The perfect F1 score attained for our target class exemplifies attention's power in adaptive feature refinement. For segmentation tasks, we seamlessly integrate identical attention blocks within U-Net architecture using MPN-enhanced inputs, delivering compelling performance gains with 72.44% Dice score and 58.54% IoU, substantially outperforming baseline implementations. Beyond superior accuracy metrics, our approach yields computationally efficient, lightweight architectures perfectly suited for real-world computer vision applications.
- Abstract(参考訳): 葉のイメージから植物病の検出を促進することは、ラベル付きデータや複雑な文脈要因が不足しているため、依然として永続的な課題である。
特徴表現を動的に再分類する高度な注意機構と相まって、インテリジェントな画像前処理のための2段階変換手法であるミッドポイント正規化(MPN)を導入する。
Squeeze-and-Excitation(SE)ブロックとMPNを併用した分類パイプラインは,例外的なクラスバランスを維持しつつ,93%の精度を実現している。
対象クラスで達成した完全F1スコアは、適応的特徴改善における注意力を示している。
セグメンテーションタスクでは、MPN強化された入力を使用してU-Netアーキテクチャ内の同一のアテンションブロックをシームレスに統合し、72.44%のDiceスコアと58.54%のIoUで魅力的なパフォーマンス向上を実現し、ベースライン実装を大幅に上回っている。
優れた精度のメトリクス以外にも、我々のアプローチは実世界のコンピュータビジョンアプリケーションに完全に適合する計算効率が高く、軽量なアーキテクチャをもたらす。
関連論文リスト
- MAAM: A Lightweight Multi-Agent Aggregation Module for Efficient Image Classification Based on the MindSpore Framework [4.307728769243765]
我々はMindSporeフレームワークと統合された軽量アテンションアーキテクチャを提案する。
Multi-Agent Aggregation Module (MAAM) は3つの並列エージェントブランチを独立にパラメータ化してヘテロジニアスな特徴を抽出する。
MindSporeの動的計算グラフと演算子融合を用いて、MAAMはCIFAR-10データセット上で87.0%の精度を達成する。
論文 参考訳(メタデータ) (2025-04-18T09:19:07Z) - Revisiting Cephalometric Landmark Detection from the view of Human Pose
Estimation with Lightweight Super-Resolution Head [11.40242574405714]
提案手法は,MMPose として知られるヒューマノイドポーズ推定(HPE)に基づくベンチマークである。
パフォーマンスをさらに向上するために、フレームワーク内にアップスケーリング設計を導入します。
MICCAI CLDetection2023では,3つの指標で1位,残る1つで3位となった。
論文 参考訳(メタデータ) (2023-09-29T11:15:39Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。