論文の概要: Mitigating Bad Ground Truth in Supervised Machine Learning based Crop Classification: A Multi-Level Framework with Sentinel-2 Images
- arxiv url: http://arxiv.org/abs/2503.11807v1
- Date: Fri, 14 Mar 2025 18:50:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 16:00:40.164832
- Title: Mitigating Bad Ground Truth in Supervised Machine Learning based Crop Classification: A Multi-Level Framework with Sentinel-2 Images
- Title(参考訳): 教師付き機械学習による作物分類における悪地真実の緩和:Sentinel-2画像を用いたマルチレベルフレームワーク
- Authors: Sanayya A, Amoolya Shetty, Abhijeet Sharma, Venkatesh Ravichandran, Masthan Wali Gosuvarapalli, Sarthak Jain, Priyamvada Nanjundiah, Ujjal Kr Dutta, Divya Sharma,
- Abstract要約: 農業経営においては,正確なグラウンドトラス(GT)データは,正確な機械学習(ML)に基づく作物分類に不可欠である。
我々は,これらの問題に対処するために,多段階のSentinel-2データを利用した多段階GTクリーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.394227082880763
- License:
- Abstract: In agricultural management, precise Ground Truth (GT) data is crucial for accurate Machine Learning (ML) based crop classification. Yet, issues like crop mislabeling and incorrect land identification are common. We propose a multi-level GT cleaning framework while utilizing multi-temporal Sentinel-2 data to address these issues. Specifically, this framework utilizes generating embeddings for farmland, clustering similar crop profiles, and identification of outliers indicating GT errors. We validated clusters with False Colour Composite (FCC) checks and used distance-based metrics to scale and automate this verification process. The importance of cleaning the GT data became apparent when the models were trained on the clean and unclean data. For instance, when we trained a Random Forest model with the clean GT data, we achieved upto 70\% absolute percentage points higher for the F1 score metric. This approach advances crop classification methodologies, with potential for applications towards improving loan underwriting and agricultural decision-making.
- Abstract(参考訳): 農業経営においては,正確なグラウンドトラス(GT)データは,正確な機械学習(ML)に基づく作物分類に不可欠である。
しかし、作物のミスラベルや不正確な土地識別といった問題は一般的である。
我々は,これらの問題に対処するために,多段階のSentinel-2データを利用した多段階GTクリーニングフレームワークを提案する。
具体的には、農地への埋め込みの生成、類似の作物プロファイルのクラスタリング、GTエラーを示す外れ値の識別を利用する。
我々は、False Colour Composite(FCC)チェックによるクラスタの検証を行い、この検証プロセスのスケールと自動化に距離ベースのメトリクスを使用した。
GTデータのクリーニングの重要性は、モデルがクリーニングデータとファランデータに基づいてトレーニングされたときに明らかになった。
例えば、クリーンなGTデータでランダムフォレストモデルをトレーニングしたとき、F1スコアのスコアに対して最大70倍の絶対パーセンテージを達成しました。
このアプローチは、ローンの引受と農業の意思決定を改善するための潜在的な応用として、作物の分類手法を進化させる。
関連論文リスト
- A robust three-way classifier with shadowed granular-balls based on justifiable granularity [53.39844791923145]
我々は、不確実なデータのために、影付きGBの頑健な3方向分類器を構築した。
本モデルでは,不確実なデータ管理を実証し,分類リスクを効果的に軽減する。
論文 参考訳(メタデータ) (2024-07-03T08:54:45Z) - Productive Crop Field Detection: A New Dataset and Deep Learning
Benchmark Results [1.2233362977312945]
精密農業において、生産的作物畑の検出は、農家が作業性能を評価するための必須の慣行である。
従来の研究では、先進的な機械学習アルゴリズムを用いて、作物畑を検出する様々な方法が研究されている。
本稿では,マシン操作とSentinel-2画像を組み合わせた高品質なデータセットを提案する。
論文 参考訳(メタデータ) (2023-05-19T20:30:59Z) - Teacher Guided Training: An Efficient Framework for Knowledge Transfer [86.6784627427194]
高品質なコンパクトモデルを訓練するための教師誘導訓練(TGT)フレームワークを提案する。
TGTは、教師が基礎となるデータドメインの優れた表現を取得したという事実を利用する。
TGTは複数の画像分類ベンチマークやテキスト分類や検索タスクの精度を向上させることができる。
論文 参考訳(メタデータ) (2022-08-14T10:33:58Z) - Generate, Annotate, and Learn: Generative Models Advance Self-Training
and Knowledge Distillation [58.64720318755764]
Semi-Supervised Learning (SSL)は多くのアプリケーションドメインで成功している。
知識蒸留(KD)により、深層ネットワークとアンサンブルの圧縮が可能となり、新しいタスク固有の未ラベルの例について知識を蒸留する際に最良の結果が得られる。
我々は、非条件生成モデルを用いて、ドメイン内の未ラベルデータを合成する「生成、注釈、学習(GAL)」と呼ばれる一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T05:01:24Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Training image classifiers using Semi-Weak Label Data [26.04162590798731]
多重インスタンス学習(MIL)では、弱ラベルがバッグレベルで提供され、存在/存在情報のみが知られる。
本稿では,この問題を軽減するため,新たな半弱ラベル学習パラダイムを提案する。
半弱ラベルから学習する問題に対処する2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-19T03:06:07Z) - An Efficient Method for the Classification of Croplands in Scarce-Label
Regions [0.0]
衛星時系列画像による農地分類の主な課題は、地表面データ不足と、未開発地域における高品質のハイパースペクトル画像の到達不能である。
ラベルなしの中解像度衛星画像は豊富だが、その恩恵を受けるにはオープンな問題だ。
自監督タスクを用いた作物分類におけるその可能性の活用方法を示す。
論文 参考訳(メタデータ) (2021-03-17T12:10:11Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。