Fugu-MT 論文翻訳(概要): Embrace Limited and Imperfect Training Datasets: Opportunities and Challenges in Plant Disease Recognition Using Deep Learning

論文の概要: Embrace Limited and Imperfect Training Datasets: Opportunities and Challenges in Plant Disease Recognition Using Deep Learning

arxiv url: http://arxiv.org/abs/2305.11533v2
Date: Fri, 28 Jul 2023 14:29:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-31 15:43:32.970768
Title: Embrace Limited and Imperfect Training Datasets: Opportunities and Challenges in Plant Disease Recognition Using Deep Learning
Title（参考訳）: Embrace Limited and Imperfect Training Datasets:Deep Learningを用いた植物病認識の可能性と課題
Authors: Mingle Xu and Hyongsuk Kim and Jucheng Yang and Alvaro Fuentes and Yao Meng and Sook Yoon and Taehyun Kim and Dong Sun Park
Abstract要約: 貧弱なデータセットを受け入れることは可能であり、これらのデータセットの使用に伴う課題を明確に定義することを目的としています。我々は植物病の認識に重点を置いているが、貧しいデータセットの受け入れと分析の原則は農業を含む幅広い分野に適用可能であることを強調している。
参考スコア（独自算出の注目度）: 5.526950086166696
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Recent advancements in deep learning have brought significant improvements to plant disease recognition. However, achieving satisfactory performance often requires high-quality training datasets, which are challenging and expensive to collect. Consequently, the practical application of current deep learning-based methods in real-world scenarios is hindered by the scarcity of high-quality datasets. In this paper, we argue that embracing poor datasets is viable and aim to explicitly define the challenges associated with using these datasets. To delve into this topic, we analyze the characteristics of high-quality datasets, namely large-scale images and desired annotation, and contrast them with the \emph{limited} and \emph{imperfect} nature of poor datasets. Challenges arise when the training datasets deviate from these characteristics. To provide a comprehensive understanding, we propose a novel and informative taxonomy that categorizes these challenges. Furthermore, we offer a brief overview of existing studies and approaches that address these challenges. We believe that our paper sheds light on the importance of embracing poor datasets, enhances the understanding of the associated challenges, and contributes to the ambitious objective of deploying deep learning in real-world applications. To facilitate the progress, we finally describe several outstanding questions and point out potential future directions. Although our primary focus is on plant disease recognition, we emphasize that the principles of embracing and analyzing poor datasets are applicable to a wider range of domains, including agriculture.
Abstract（参考訳）: 近年の深層学習の進歩は、植物疾患の認識に大きな改善をもたらした。しかし、十分なパフォーマンスを達成するには、しばしば高品質なトレーニングデータセットが必要です。その結果、現実世界のシナリオにおける現在のディープラーニングベースの手法の実践的応用は、高品質なデータセットの不足によって妨げられる。本稿では,これらのデータセットの使用に関する課題を明確に定義することを目的とする。本稿では,高品質なデータセット,すなわち大規模画像と所望のアノテーションの特徴を分析し,貧弱なデータセットの<emph{limited}>や<emph{imperfect>と対比する。トレーニングデータセットがこれらの特徴から逸脱すると、課題が発生する。包括的理解のために,これらの課題を分類する新規かつ情報的分類法を提案する。さらに,これらの課題に対処する既存の研究とアプローチの概要について述べる。われわれの論文は、貧弱なデータセットを受け入れることの重要性に光を当て、関連する課題の理解を高め、現実世界のアプリケーションにディープラーニングをデプロイするという野心的な目標に寄与すると考えている。進展を促進するために,いくつかの優れた質問を最終的に記述し,今後の方向性を指摘する。我々は植物病の認識に重点を置いているが、貧弱なデータセットを受け入れて分析する原則は農業を含む幅広い分野に適用可能であることを強調する。

関連論文リスト

LAND: A Longitudinal Analysis of Neuromorphic Datasets [47.84658158364453]
このレビューでは、既存のニューロモルフィックデータセットをキャプチャし、423以上のデータセットをカバーしている。これらのデータセットの分析は、そのサイズ、標準化の欠如、実際のデータにアクセスする上での困難さを示している。より重要な懸念は、シミュレーションまたはビデオ・ツー・イベントの手法によって生成される合成データセットの台頭である。
論文参考訳（メタデータ） (2026-02-17T19:46:33Z)
A Survey on Data Synthesis and Augmentation for Large Language Models [35.59526251210408]
本稿では,大規模言語モデルのライフサイクルを通じてデータ生成手法をレビューし,要約する。これらの手法が直面する現在の制約について考察し,今後の開発・研究の道筋について考察する。
論文参考訳（メタデータ） (2024-10-16T16:12:39Z)
Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文参考訳（メタデータ） (2024-05-13T14:44:22Z)
Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文参考訳（メタデータ） (2024-04-11T06:34:17Z)
Large Language Models(LLMs) on Tabular Data: Prediction, Generation, and Understanding -- A Survey [17.19337964440007]
現在、この研究領域における主要なテクニック、メトリクス、データセット、モデル、最適化アプローチを要約し比較する包括的なレビューが欠如しています。この調査は、これらの領域における最近の進歩を集約し、使用するデータセット、メトリクス、方法論の詳細な調査と分類を提供することによって、このギャップに対処することを目的としている。既存の文献の強さ、限界、未探索領域、ギャップを識別し、この重要かつ急速に発展する分野における将来の研究の方向性についていくつかの洞察を提供する。
論文参考訳（メタデータ） (2024-02-27T23:59:01Z)
Plant Disease Recognition Datasets in the Age of Deep Learning: Challenges and Opportunities [1.9578088547147654]
本研究は、潜在的な植物病データセットを記述するための、情報的分類法を明示的に提案する。課題指向のデータセットの作成や、実世界のアプリケーションにディープラーニングを配置する究極の目的など、今後の方向性を満足できるパフォーマンスで提供します。
論文参考訳（メタデータ） (2023-12-13T05:24:36Z)
Image Synthesis under Limited Data: A Survey and Taxonomy [4.0989155767548375]
与えられたデータ分布を再現して新しいサンプルを作成することを目的とした深層生成モデルは、近年、前例のない進歩を遂げている。限られたデータに基づいてトレーニングを行う場合、生成モデルは過度な適合と記憶によるパフォーマンス劣化に悩まされる傾向にある。本調査は,限られたデータに基づく画像合成の開発に関する包括的レビューと新しい分類法を提供する。
論文参考訳（メタデータ） (2023-07-31T17:45:16Z)
LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文参考訳（メタデータ） (2023-06-14T05:48:36Z)
A Survey of Label-Efficient Deep Learning for 3D Point Clouds [109.07889215814589]
本稿では,点雲のラベル効率学習に関する包括的調査を行う。本稿では,ラベルの種類によって提供されるデータ前提条件に基づいて,ラベル効率のよい学習手法を整理する分類法を提案する。それぞれのアプローチについて、問題設定の概要と、関連する進展と課題を示す広範な文献レビューを提供する。
論文参考訳（メタデータ） (2023-05-31T12:54:51Z)
A Survey on Dataset Distillation: Approaches, Applications and Future Directions [4.906549881313351]
高い情報密度でデータセットを合成することにより、データセット蒸留は潜在的な応用範囲を提供する。本稿では,データセット蒸留の分類法を提案し,既存のアプローチを特徴付けるとともに,データモダリティとその関連アプリケーションについて体系的にレビューする。
論文参考訳（メタデータ） (2023-05-03T08:41:37Z)
Self-Supervised Representation Learning: Introduction, Advances and Challenges [125.38214493654534]
自己教師付き表現学習手法は、大きな注釈付きデータセットを必要とせずに強力な機能学習を提供することを目的としている。本稿では、この活気ある領域について、鍵となる概念、アプローチの4つの主要なファミリーと関連する技術の状態、そして、データの多様性に自己監督手法を適用する方法について紹介する。
論文参考訳（メタデータ） (2021-10-18T13:51:22Z)
Few-shot Partial Multi-view Learning [103.33865779721458]
本稿では,複数ショット部分的多視点学習という新しい課題を提案する。それは、低データ体制におけるビューミス問題によるネガティブな影響を克服することに焦点を当てている。提案手法を評価するため,広範囲な実験を行った。
論文参考訳（メタデータ） (2021-05-05T13:34:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。