論文の概要: DDD: Discriminative Difficulty Distance for plant disease diagnosis
- arxiv url: http://arxiv.org/abs/2501.00734v1
- Date: Wed, 01 Jan 2025 05:34:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:15:46.173830
- Title: DDD: Discriminative Difficulty Distance for plant disease diagnosis
- Title(参考訳): DDD:植物病診断における識別困難距離
- Authors: Yuji Arima, Satoshi Kagiwada, Hitoshi Iyatomi,
- Abstract要約: 植物病の診断は難しい分類課題である。
差別的困難距離(DDD)は、トレーニングとテストデータセットの間のドメインギャップを定量化するために設計された、新しいメトリクスである。
- 参考スコア(独自算出の注目度): 2.7992435001846827
- License:
- Abstract: Recent studies on plant disease diagnosis using machine learning (ML) have highlighted concerns about the overestimated diagnostic performance due to inappropriate data partitioning, where training and test datasets are derived from the same source (domain). Plant disease diagnosis presents a challenging classification task, characterized by its fine-grained nature, vague symptoms, and the extensive variability of image features within each domain. In this study, we propose the concept of Discriminative Difficulty Distance (DDD), a novel metric designed to quantify the domain gap between training and test datasets while assessing the classification difficulty of test data. DDD provides a valuable tool for identifying insufficient diversity in training data, thus supporting the development of more diverse and robust datasets. We investigated multiple image encoders trained on different datasets and examined whether the distances between datasets, measured using low-dimensional representations generated by the encoders, are suitable as a DDD metric. The study utilized 244,063 plant disease images spanning four crops and 34 disease classes collected from 27 domains. As a result, we demonstrated that even if the test images are from different crops or diseases than those used to train the encoder, incorporating them allows the construction of a distance measure for a dataset that strongly correlates with the difficulty of diagnosis indicated by the disease classifier developed independently. Compared to the base encoder, pre-trained only on ImageNet21K, the correlation higher by 0.106 to 0.485, reaching a maximum of 0.909.
- Abstract(参考訳): 機械学習(ML)を用いた植物病診断の最近の研究は、トレーニングデータセットとテストデータセットが同一のソース(ドメイン)から抽出される不適切なデータ分割による過大評価診断性能に関する懸念を浮き彫りにした。
植物病の診断は、その細粒度の性質、曖昧な症状、および各領域における画像の特徴の広範囲な変動を特徴とする、困難な分類課題を呈する。
本研究では,テストデータの分類の難しさを評価しつつ,トレーニングとテストデータセット間の領域ギャップを定量化する新しい尺度である差別的困難距離(DDD)の概念を提案する。
DDDは、トレーニングデータの不十分な多様性を特定するための貴重なツールを提供し、より多様性があり堅牢なデータセットの開発をサポートする。
異なるデータセットで訓練された複数の画像エンコーダについて検討し、エンコーダによって生成された低次元表現を用いて測定されたデータセット間の距離がDDDメトリックとして適切かどうかを検討した。
この研究は、27のドメインから収集された4つの作物と34の病種にまたがる244,063の植物病画像を利用した。
その結果, 検査画像がエンコーダの訓練に用いるものとは異なる作物や病気のものである場合においても, 独立に開発された疾患分類器で示される診断の難しさと強く相関するデータセットの距離測定を構築できることを示した。
ImageNet21Kでのみトレーニングされたベースエンコーダと比較して、相関は0.106から0.485に高くなり、最大0.909に達した。
関連論文リスト
- Few-shot Metric Domain Adaptation: Practical Learning Strategies for an Automated Plant Disease Diagnosis [2.7992435001846827]
FMDA(Few-shot Metric Domain Adaptation)は、実用的なシステムにおける診断精度を高めるための柔軟で効果的なアプローチである。
FMDAは、ソース(トレーニング)データの特徴空間とターゲットデータとの"距離"を最小限に抑える診断モデルに制約を導入することで、ドメインの相違を低減します。
大規模な実験では、FMDAはF1スコアを11.1点から29.3点に改善した。
論文 参考訳(メタデータ) (2024-12-25T10:01:30Z) - Domain-invariant Clinical Representation Learning by Bridging Data Distribution Shift across EMR Datasets [28.59271580918754]
効果的な予後モデルは、医師が正確な診断を行い、パーソナライズされた治療計画を設計するのを助けることができる。
限られたデータ収集、不十分な臨床経験、プライバシと倫理上の懸念は、データの可用性を制限します。
本稿では,ソースとターゲットデータセット間の遷移モデルを構築するドメイン不変表現学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T18:32:21Z) - PrepNet: A Convolutional Auto-Encoder to Homogenize CT Scans for
Cross-Dataset Medical Image Analysis [0.22485007639406518]
新型コロナウイルスの診断はPCR検査で効率的に行えるようになったが、このユースケースは、データの多様性を克服する方法論の必要性を実証するものだ。
本稿では,CTスキャンに最小限の変更を同時に導入しながら,イメージング技術によって引き起こされる差を解消することを目的とした,新しい生成手法を提案する。
論文 参考訳(メタデータ) (2022-08-19T15:49:47Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - Learning from Subjective Ratings Using Auto-Decoded Deep Latent
Embeddings [23.777855250882244]
ラベルにおける主観性管理は医用画像解析における根本的な問題である。
自動復号型ディープ潜在埋め込み(addle)を導入する
ADDLEは自動デコーダフレームワークを使用して各レーダの傾向を明示的にモデル化する。
論文 参考訳(メタデータ) (2021-04-12T15:40:42Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。