論文の概要: Towards Robust Plant Disease Diagnosis with Hard-sample Re-mining
Strategy
- arxiv url: http://arxiv.org/abs/2309.01903v2
- Date: Mon, 30 Oct 2023 13:59:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 22:51:12.559625
- Title: Towards Robust Plant Disease Diagnosis with Hard-sample Re-mining
Strategy
- Title(参考訳): ハードサンプルリマイニング戦略によるロバスト植物病診断に向けて
- Authors: Quan Huu Cap, Atsushi Fukuda, Satoshi Kagiwada, Hiroyuki Uga, Nobusuke
Iwasaki, Hitoshi Iyatomi
- Abstract要約: ハードサンプルリマイニング(HSReM)という,シンプルだが効果的なトレーニング戦略を提案する。
HSReMは、健康なデータの診断性能を高め、同時に疾患データの性能を向上させるように設計されている。
実験の結果,HSReMトレーニング戦略は大規模未確認データに対する診断性能を大幅に向上させることが示された。
- 参考スコア(独自算出の注目度): 6.844857856353672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With rich annotation information, object detection-based automated plant
disease diagnosis systems (e.g., YOLO-based systems) often provide advantages
over classification-based systems (e.g., EfficientNet-based), such as the
ability to detect disease locations and superior classification performance.
One drawback of these detection systems is dealing with unannotated healthy
data with no real symptoms present. In practice, healthy plant data appear to
be very similar to many disease data. Thus, those models often produce
mis-detected boxes on healthy images. In addition, labeling new data for
detection models is typically time-consuming. Hard-sample mining (HSM) is a
common technique for re-training a model by using the mis-detected boxes as new
training samples. However, blindly selecting an arbitrary amount of hard-sample
for re-training will result in the degradation of diagnostic performance for
other diseases due to the high similarity between disease and healthy data. In
this paper, we propose a simple but effective training strategy called
hard-sample re-mining (HSReM), which is designed to enhance the diagnostic
performance of healthy data and simultaneously improve the performance of
disease data by strategically selecting hard-sample training images at an
appropriate level. Experiments based on two practical in-field eight-class
cucumber and ten-class tomato datasets (42.7K and 35.6K images) show that our
HSReM training strategy leads to a substantial improvement in the overall
diagnostic performance on large-scale unseen data. Specifically, the object
detection model trained using the HSReM strategy not only achieved superior
results as compared to the classification-based state-of-the-art
EfficientNetV2-Large model and the original object detection model, but also
outperformed the model using the HSM strategy in multiple evaluation metrics.
- Abstract(参考訳): リッチなアノテーション情報により、オブジェクト検出に基づく自動植物病診断システム(例えば、yoloベースのシステム)は、病気の位置の検出や優れた分類性能などの分類ベースのシステム(例えば、effernetベースの)よりも優れていることが多い。
これらの検出システムの欠点の1つは、実際の症状が存在しない無注釈の健康データを扱うことである。
実際には、健康な植物データは多くの病気データと非常によく似ている。
したがって、これらのモデルはしばしば、健康な画像の誤検出ボックスを生成する。
加えて、新しいデータを検出モデルにラベル付けるのは通常時間がかかる。
HSM (Hard-sample mining) は、誤り検出ボックスを新しいトレーニングサンプルとして使用することで、モデルを再訓練する一般的な手法である。
しかしながら、任意の量のハードサンプルを盲目的に選択すると、疾患と健康データとの類似性が高いため、他の疾患の診断性能が低下する。
本稿では,健康なデータの診断性能を高めるとともに,適切なレベルでハードサンプルトレーニング画像を戦略的に選択することで疾患データの性能を向上させることを目的とした,ハードサンプルリマイニング(HSReM)と呼ばれる簡易かつ効果的なトレーニング戦略を提案する。
実践的な2つの8クラスキュウリと10クラスのトマトデータセット(42.7Kと35.6Kの画像)に基づく実験により、我々のHSReMトレーニング戦略は、大規模未確認データに対する全体的な診断性能を大幅に改善することを示した。
具体的には、HSReM戦略を用いて訓練されたオブジェクト検出モデルは、分類に基づく最先端NetV2-Largeモデルとオリジナルのオブジェクト検出モデルよりも優れた結果を得ただけでなく、複数の評価指標においてHSM戦略を用いたモデルよりも優れていた。
関連論文リスト
- Iterative Online Image Synthesis via Diffusion Model for Imbalanced
Classification [29.730360798234294]
医用画像分類におけるクラス不均衡問題に対処するための反復オンライン画像合成フレームワークを提案する。
このフレームワークにはオンライン画像合成(OIS)と精度適応サンプリング(AAS)という2つの重要なモジュールが組み込まれている。
不均衡な分類に対処するための提案手法の有効性を評価するため,HAM10000およびAPTOSデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2024-03-13T10:51:18Z) - On the Out-Of-Distribution Robustness of Self-Supervised Representation
Learning for Phonocardiogram Signals [6.112582193985082]
信号の一般化表現を学習して心電図(PCG)サンプルの異常を検出するためのコントラスト自己監視学習(SSL)を提案する。
実験により, トレーニング分布によっては, 完全に教師されたモデルの有効性が32%まで低下することを示した。
論文 参考訳(メタデータ) (2023-12-01T11:06:00Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Feature robustness and sex differences in medical imaging: a case study
in MRI-based Alzheimer's disease detection [1.7616042687330637]
我々はADNI MRIデータセットの2つの分類方式を比較した。
訓練データセットの性構成に対する男女試験対象者のモデル性能の強い依存は見つからない。
論文 参考訳(メタデータ) (2022-04-04T17:37:54Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Single Model Deep Learning on Imbalanced Small Datasets for Skin Lesion
Classification [5.642359877598896]
本稿では,小・不均衡なデータセットに基づく皮膚病変の単一モデル分類のための新しいデータ拡張戦略を提案する。
このデータセット上で、様々なDCNNがトレーニングされ、適度な複雑さを持つモデルがより大きなモデルより優れていることを示す。
修正RandAugmentとMulti-weighted Focal Lossを1つのDCNNモデルで組み合わせることで、ISIC 2018チャレンジテストデータセット上の複数のアンサンブルモデルに匹敵する分類精度を達成した。
論文 参考訳(メタデータ) (2021-02-02T03:48:55Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。