論文の概要: Hierarchical Object Detection and Recognition Framework for Practical Plant Disease Diagnosis
- arxiv url: http://arxiv.org/abs/2407.17906v1
- Date: Thu, 25 Jul 2024 09:51:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-26 14:28:24.771921
- Title: Hierarchical Object Detection and Recognition Framework for Practical Plant Disease Diagnosis
- Title(参考訳): 植物病診断のための階層的物体検出・認識フレームワーク
- Authors: Kohei Iwano, Shogo Shibuya, Satoshi Kagiwada, Hitoshi Iyatomi,
- Abstract要約: 植物病診断のための階層的物体検出・認識フレームワーク(HODRF)を提案する。
第1段階では、HODRFは対象検出法(OD)を使用して、疾患を特定せずに関心領域(ROI)を識別する。
第2段階では、CLはROIを取り巻く疾患を診断する。
- 参考スコア(独自算出の注目度): 2.56240510948525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, object detection methods (OD; e.g., YOLO-based models) have been widely utilized in plant disease diagnosis. These methods demonstrate robustness to distance variations and excel at detecting small lesions compared to classification methods (CL; e.g., CNN models). However, there are issues such as low diagnostic performance for hard-to-detect diseases and high labeling costs. Additionally, since healthy cases cannot be explicitly trained, there is a risk of false positives. We propose the Hierarchical object detection and recognition framework (HODRF), a sophisticated and highly integrated two-stage system that combines the strengths of both OD and CL for plant disease diagnosis. In the first stage, HODRF uses OD to identify regions of interest (ROIs) without specifying the disease. In the second stage, CL diagnoses diseases surrounding the ROIs. HODRF offers several advantages: (1) Since OD detects only one type of ROI, HODRF can detect diseases with limited training images by leveraging its ability to identify other lesions. (2) While OD over-detects healthy cases, HODRF significantly reduces these errors by using CL in the second stage. (3) CL's accuracy improves in HODRF as it identifies diagnostic targets given as ROIs, making it less vulnerable to size changes. (4) HODRF benefits from CL's lower annotation costs, allowing it to learn from a larger number of images. We implemented HODRF using YOLOv7 for OD and EfficientNetV2 for CL and evaluated its performance on a large-scale dataset (4 crops, 20 diseased and healthy classes, 281K images). HODRF outperformed YOLOv7 alone by 5.8 to 21.5 points on healthy data and 0.6 to 7.5 points on macro F1 scores, and it improved macro F1 by 1.1 to 7.2 points over EfficientNetV2.
- Abstract(参考訳): 近年,植物病の診断にオブジェクト検出法(OD; eg, YOLOモデル)が広く用いられている。
これらの手法は, 分類法 (CL; eg , CNN モデル) と比較して, 距離変化に対する堅牢性を示し, 微小病変の検出に優れていた。
しかし, 診断能力の低下や, 診断コストの低下などの問題がある。
さらに、健康なケースは明示的に訓練できないため、偽陽性のリスクがある。
植物病診断におけるODとCLの強度を組み合わせた高度に統合された2段階システムである階層的物体検出認識フレームワーク(HODRF)を提案する。
第1段階では、HODRFは病原体を特定することなく、ODを使用して関心領域(ROI)を識別する。
第2段階では、CLはROIを取り巻く疾患を診断する。
1) ODRFは1種類のROIしか検出しないため、HODRFは他の病変を識別する能力を活用して、訓練画像の限られた疾患を検出できる。
2) ODは健康な症例を過度に検出するが,HODRFは第2段階でCLを用いてこれらの誤りを著しく低減する。
(3) CLの精度は、ROIとして与えられる診断目標を特定することにより、HODRFの精度が向上し、サイズの変化に対する脆弱さが低下する。
(4)HODRFはCLのアノテーションコストの低さから恩恵を受け、より多くの画像から学習することができる。
我々は, YOLOv7 for ODとEfficientNetV2 for CLを用いてHODRFを実装し, 大規模データセット(4つの作物, 20の病気と健康なクラス, 281K画像)の性能評価を行った。
HODRFは健康データを5.8から21.5ポイント、マクロF1スコアを0.6から7.5ポイント、マクロF1を1.1から7.2ポイント改善した。
関連論文リスト
- Towards Within-Class Variation in Alzheimer's Disease Detection from Spontaneous Speech [60.08015780474457]
アルツハイマー病(AD)の検出は、機械学習の分類モデルを使用する有望な研究領域として浮上している。
我々は、AD検出において、クラス内変異が重要な課題であると考え、ADを持つ個人は認知障害のスペクトルを示す。
本稿では,ソフトターゲット蒸留 (SoTD) とインスタンスレベルの再分散 (InRe) の2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T02:06:05Z) - Enhancing Angular Resolution via Directionality Encoding and Geometric Constraints in Brain Diffusion Tensor Imaging [70.66500060987312]
拡散強調画像(DWI)は、水分子の拡散率に感応した磁気共鳴イメージング(MRI)の一種である。
本研究はDirGeo-DTIを提案する。DirGeo-DTIは、勾配方向の最小理論数(6)で得られたDWIの集合からでも、信頼できるDTIメトリクスを推定する深層学習に基づく手法である。
論文 参考訳(メタデータ) (2024-09-11T11:12:26Z) - Enhancing Wrist Fracture Detection with YOLO [3.2049746597433746]
この研究では、最先端の単一ステージのディープニューラルネットワークに基づく検出モデルYOLOv5、YOLOv6、YOLOv7、YOLOv8を用いて、手首の異常を検出する。
これらのYOLOモデルは, フラクチャー検出において, 一般的に使われている2段検出アルゴリズムであるFaster R-CNNよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-07-17T14:21:53Z) - Effective-LDAM: An Effective Loss Function To Mitigate Data Imbalance for Robust Chest X-Ray Disease Classification [0.02609206307458148]
E-LDAM(Effective-Label Distribution Aware Margin)と呼ばれるアルゴリズム中心のアプローチを提案する。
E-LDAMは,各クラスで有効なサンプル数を用いて,広く採用されているラベル分布認識マージン(LDAM)損失関数のマージンを変更する。
実験の結果,E-LDAM法の有効性が示され,マイノリティクラスでは97.81%という顕著なリコールスコアが得られた。
論文 参考訳(メタデータ) (2024-07-06T04:24:07Z) - Large Language Models with Retrieval-Augmented Generation for Zero-Shot
Disease Phenotyping [1.8630636381951384]
大規模言語モデル(LLM)はテキスト理解の約束を提供するが、実際の臨床文書を効率的に扱うことはできない。
検索拡張生成とMapReduceにより強化されたゼロショットLLM法を提案する。
肺動脈圧の上昇を特徴とする稀な疾患である肺高血圧症(PH)に対して本法を適用した。
論文 参考訳(メタデータ) (2023-12-11T15:45:27Z) - DualAttNet: Synergistic Fusion of Image-level and Fine-Grained Disease
Attention for Multi-Label Lesion Detection in Chest X-rays [1.3367903535457364]
胸部X線写真におけるDualAttNet(DualAttNet)というマルチラベル病変検出のための二重注意制御モジュールを提案する。
画像レベルの注意ブロックと微細な疾患注意アルゴリズムに基づいて、グローバルおよびローカルな病変分類情報を効率的に融合する。
論文 参考訳(メタデータ) (2023-06-23T23:19:27Z) - RoS-KD: A Robust Stochastic Knowledge Distillation Approach for Noisy
Medical Imaging [67.02500668641831]
ノイズの多いデータセットでトレーニングされたディープラーニングモデルは、ノイズタイプに敏感であり、目に見えないサンプルの一般化が少なくなる。
本稿では,複数の情報源からトピックを学習する概念を模倣したロバスト知識蒸留(RoS-KD)フレームワークを提案する。
RoS-KDは、訓練データの重複する部分集合について訓練された複数の教師から知識を蒸留することにより、滑らかで、よく表現された、堅牢な学生多様体を学習する。
論文 参考訳(メタデータ) (2022-10-15T22:32:20Z) - Cascading Neural Network Methodology for Artificial
Intelligence-Assisted Radiographic Detection and Classification of Lead-Less
Implanted Electronic Devices within the Chest [0.7874708385247353]
本研究は、LLIED存在/位置の100%検出と、LLIEDタイピングにおける高分類によるCXR解釈支援人工知能(AI)方法論の開発に焦点を当てた。
カスケーディングニューラルネットワーク(Faster R-CNNによる検出とInception V3による分類)の開発には、"ground-truth" CXRアノテーション(LLIEDあたりROIラベル付け)と推論ディスプレイ(生成バウンディングボックス(GBBs))がある。
論文 参考訳(メタデータ) (2021-08-25T19:29:48Z) - Controlling False Positive/Negative Rates for Deep-Learning-Based
Prostate Cancer Detection on Multiparametric MR images [58.85481248101611]
そこで本研究では,病変からスライスまでのマッピング機能に基づく,病変レベルのコスト感受性損失と付加的なスライスレベルの損失を組み込んだ新しいPCa検出ネットワークを提案する。
1) 病変レベルFNRを0.19から0.10に, 病変レベルFPRを1.03から0.66に減らした。
論文 参考訳(メタデータ) (2021-06-04T09:51:27Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Performance of Dual-Augmented Lagrangian Method and Common Spatial
Patterns applied in classification of Motor-Imagery BCI [68.8204255655161]
運動画像に基づく脳-コンピュータインタフェース(MI-BCI)は、神経リハビリテーションのための画期的な技術になる可能性がある。
使用する脳波信号のノイズの性質のため、信頼性の高いBCIシステムは特徴の最適化と抽出のために特別な手順を必要とする。
論文 参考訳(メタデータ) (2020-10-13T20:50:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。