論文の概要: Towards Robust Plant Disease Diagnosis with Hard-sample Re-mining
Strategy
- arxiv url: http://arxiv.org/abs/2309.01903v2
- Date: Mon, 30 Oct 2023 13:59:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 22:51:12.559625
- Title: Towards Robust Plant Disease Diagnosis with Hard-sample Re-mining
Strategy
- Title(参考訳): ハードサンプルリマイニング戦略によるロバスト植物病診断に向けて
- Authors: Quan Huu Cap, Atsushi Fukuda, Satoshi Kagiwada, Hiroyuki Uga, Nobusuke
Iwasaki, Hitoshi Iyatomi
- Abstract要約: ハードサンプルリマイニング(HSReM)という,シンプルだが効果的なトレーニング戦略を提案する。
HSReMは、健康なデータの診断性能を高め、同時に疾患データの性能を向上させるように設計されている。
実験の結果,HSReMトレーニング戦略は大規模未確認データに対する診断性能を大幅に向上させることが示された。
- 参考スコア(独自算出の注目度): 6.844857856353672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With rich annotation information, object detection-based automated plant
disease diagnosis systems (e.g., YOLO-based systems) often provide advantages
over classification-based systems (e.g., EfficientNet-based), such as the
ability to detect disease locations and superior classification performance.
One drawback of these detection systems is dealing with unannotated healthy
data with no real symptoms present. In practice, healthy plant data appear to
be very similar to many disease data. Thus, those models often produce
mis-detected boxes on healthy images. In addition, labeling new data for
detection models is typically time-consuming. Hard-sample mining (HSM) is a
common technique for re-training a model by using the mis-detected boxes as new
training samples. However, blindly selecting an arbitrary amount of hard-sample
for re-training will result in the degradation of diagnostic performance for
other diseases due to the high similarity between disease and healthy data. In
this paper, we propose a simple but effective training strategy called
hard-sample re-mining (HSReM), which is designed to enhance the diagnostic
performance of healthy data and simultaneously improve the performance of
disease data by strategically selecting hard-sample training images at an
appropriate level. Experiments based on two practical in-field eight-class
cucumber and ten-class tomato datasets (42.7K and 35.6K images) show that our
HSReM training strategy leads to a substantial improvement in the overall
diagnostic performance on large-scale unseen data. Specifically, the object
detection model trained using the HSReM strategy not only achieved superior
results as compared to the classification-based state-of-the-art
EfficientNetV2-Large model and the original object detection model, but also
outperformed the model using the HSM strategy in multiple evaluation metrics.
- Abstract(参考訳): リッチなアノテーション情報により、オブジェクト検出に基づく自動植物病診断システム(例えば、yoloベースのシステム)は、病気の位置の検出や優れた分類性能などの分類ベースのシステム(例えば、effernetベースの)よりも優れていることが多い。
これらの検出システムの欠点の1つは、実際の症状が存在しない無注釈の健康データを扱うことである。
実際には、健康な植物データは多くの病気データと非常によく似ている。
したがって、これらのモデルはしばしば、健康な画像の誤検出ボックスを生成する。
加えて、新しいデータを検出モデルにラベル付けるのは通常時間がかかる。
HSM (Hard-sample mining) は、誤り検出ボックスを新しいトレーニングサンプルとして使用することで、モデルを再訓練する一般的な手法である。
しかしながら、任意の量のハードサンプルを盲目的に選択すると、疾患と健康データとの類似性が高いため、他の疾患の診断性能が低下する。
本稿では,健康なデータの診断性能を高めるとともに,適切なレベルでハードサンプルトレーニング画像を戦略的に選択することで疾患データの性能を向上させることを目的とした,ハードサンプルリマイニング(HSReM)と呼ばれる簡易かつ効果的なトレーニング戦略を提案する。
実践的な2つの8クラスキュウリと10クラスのトマトデータセット(42.7Kと35.6Kの画像)に基づく実験により、我々のHSReMトレーニング戦略は、大規模未確認データに対する全体的な診断性能を大幅に改善することを示した。
具体的には、HSReM戦略を用いて訓練されたオブジェクト検出モデルは、分類に基づく最先端NetV2-Largeモデルとオリジナルのオブジェクト検出モデルよりも優れた結果を得ただけでなく、複数の評価指標においてHSM戦略を用いたモデルよりも優れていた。
関連論文リスト
- Weakly supervised deep learning model with size constraint for prostate cancer detection in multiparametric MRI and generalization to unseen domains [0.90668179713299]
本モデルでは, 完全教師付きベースラインモデルにより, オンパー性能が向上することを示す。
また、未確認データドメインでテストした場合、完全に教師付きモデルと弱い教師付きモデルの両方のパフォーマンス低下も観察する。
論文 参考訳(メタデータ) (2024-11-04T12:24:33Z) - DDPM-MoCo: Advancing Industrial Surface Defect Generation and Detection with Generative and Contrastive Learning [3.789219860006095]
これらの問題に対処するためにDDPM-MoCoという新しい欠陥発生手法を提案する。
まず,Denoising Diffusion Probabilistic Model (DDPM) を用いて,高品質な欠陥データサンプルを生成する。
第2に、教師なし学習モメンタムコントラストモデル(MoCo)と拡張バッチコントラスト損失関数を用いて、ラベルなしデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2024-05-09T17:17:53Z) - Which Augmentation Should I Use? An Empirical Investigation of Augmentations for Self-Supervised Phonocardiogram Representation Learning [5.438725298163702]
Contrastive Self-Supervised Learning (SSL)はラベル付きデータの不足に対する潜在的な解決策を提供する。
1次元心電図(PCG)分類におけるコントラスト学習の最適化を提案する。
トレーニング分布によっては、完全教師付きモデルの有効性が最大32%低下し、SSLモデルは最大10%低下し、場合によっては改善される。
論文 参考訳(メタデータ) (2023-12-01T11:06:00Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Feature robustness and sex differences in medical imaging: a case study
in MRI-based Alzheimer's disease detection [1.7616042687330637]
我々はADNI MRIデータセットの2つの分類方式を比較した。
訓練データセットの性構成に対する男女試験対象者のモデル性能の強い依存は見つからない。
論文 参考訳(メタデータ) (2022-04-04T17:37:54Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。