Fugu-MT 論文翻訳(概要): Mitigating Bad Ground Truth in Supervised Machine Learning based Crop Classification: A Multi-Level Framework with Sentinel-2 Images

論文の概要: Mitigating Bad Ground Truth in Supervised Machine Learning based Crop Classification: A Multi-Level Framework with Sentinel-2 Images

arxiv url: http://arxiv.org/abs/2503.11807v1
Date: Fri, 14 Mar 2025 18:50:30 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-18 14:56:57.552116
Title: Mitigating Bad Ground Truth in Supervised Machine Learning based Crop Classification: A Multi-Level Framework with Sentinel-2 Images
Title（参考訳）: 教師付き機械学習による作物分類における悪地真実の緩和:Sentinel-2画像を用いたマルチレベルフレームワーク
Authors: Sanayya A, Amoolya Shetty, Abhijeet Sharma, Venkatesh Ravichandran, Masthan Wali Gosuvarapalli, Sarthak Jain, Priyamvada Nanjundiah, Ujjal Kr Dutta, Divya Sharma,
Abstract要約: 農業経営においては,正確なグラウンドトラス(GT)データは,正確な機械学習(ML)に基づく作物分類に不可欠である。我々は,これらの問題に対処するために,多段階のSentinel-2データを利用した多段階GTクリーニングフレームワークを提案する。
参考スコア（独自算出の注目度）: 14.394227082880763
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In agricultural management, precise Ground Truth (GT) data is crucial for accurate Machine Learning (ML) based crop classification. Yet, issues like crop mislabeling and incorrect land identification are common. We propose a multi-level GT cleaning framework while utilizing multi-temporal Sentinel-2 data to address these issues. Specifically, this framework utilizes generating embeddings for farmland, clustering similar crop profiles, and identification of outliers indicating GT errors. We validated clusters with False Colour Composite (FCC) checks and used distance-based metrics to scale and automate this verification process. The importance of cleaning the GT data became apparent when the models were trained on the clean and unclean data. For instance, when we trained a Random Forest model with the clean GT data, we achieved upto 70\% absolute percentage points higher for the F1 score metric. This approach advances crop classification methodologies, with potential for applications towards improving loan underwriting and agricultural decision-making.
Abstract（参考訳）: 農業経営においては,正確なグラウンドトラス(GT)データは,正確な機械学習(ML)に基づく作物分類に不可欠である。しかし、作物のミスラベルや不正確な土地識別といった問題は一般的である。我々は,これらの問題に対処するために,多段階のSentinel-2データを利用した多段階GTクリーニングフレームワークを提案する。具体的には、農地への埋め込みの生成、類似の作物プロファイルのクラスタリング、GTエラーを示す外れ値の識別を利用する。我々は、False Colour Composite(FCC)チェックによるクラスタの検証を行い、この検証プロセスのスケールと自動化に距離ベースのメトリクスを使用した。 GTデータのクリーニングの重要性は、モデルがクリーニングデータとファランデータに基づいてトレーニングされたときに明らかになった。例えば、クリーンなGTデータでランダムフォレストモデルをトレーニングしたとき、F1スコアのスコアに対して最大70倍の絶対パーセンテージを達成しました。このアプローチは、ローンの引受と農業の意思決定を改善するための潜在的な応用として、作物の分類手法を進化させる。

関連論文リスト

Fine-grained Hierarchical Crop Type Classification from Integrated Hyperspectral EnMAP Data and Multispectral Sentinel-2 Time Series: A Large-scale Dataset and Dual-stream Transformer Method [12.016380319337525]
細粒度作物型分類は大規模作物マッピングの基礎となる。これらの2つのモダリティを組み合わせた研究は、ハイパースペクトルデータ取得と作物型アノテーションコストの課題により、依然として少ない。本研究では,30m分解能EnMAPハイパースペクトルデータとSentinel-2時系列を統合することで,階層型ハイパースペクトルデータ(H2Crop)を構築する。
論文参考訳（メタデータ） (2025-06-06T15:18:50Z)
Unsupervised Waste Classification By Dual-Encoder Contrastive Learning and Multi-Clustering Voting (DECMCV) [9.828020457690688]
本研究では,マルチクラスタリング投票(DECMCV)を用いた新しい教師なし手法であるデュアルエンコーダコントラスト学習を提案する。実際の4,169枚の廃画像のデータセットでは、数千の正確なラベル付けを行うには50個のラベル付きサンプルが必要であり、教師付きモデルと比較して分類精度は29.85%向上した。
論文参考訳（メタデータ） (2025-03-04T03:31:01Z)
A robust three-way classifier with shadowed granular-balls based on justifiable granularity [53.39844791923145]
我々は、不確実なデータのために、影付きGBの頑健な3方向分類器を構築した。本モデルでは,不確実なデータ管理を実証し,分類リスクを効果的に軽減する。
論文参考訳（メタデータ） (2024-07-03T08:54:45Z)
Productive Crop Field Detection: A New Dataset and Deep Learning Benchmark Results [1.2233362977312945]
精密農業において、生産的作物畑の検出は、農家が作業性能を評価するための必須の慣行である。従来の研究では、先進的な機械学習アルゴリズムを用いて、作物畑を検出する様々な方法が研究されている。本稿では,マシン操作とSentinel-2画像を組み合わせた高品質なデータセットを提案する。
論文参考訳（メタデータ） (2023-05-19T20:30:59Z)
Teacher Guided Training: An Efficient Framework for Knowledge Transfer [86.6784627427194]
高品質なコンパクトモデルを訓練するための教師誘導訓練(TGT)フレームワークを提案する。 TGTは、教師が基礎となるデータドメインの優れた表現を取得したという事実を利用する。 TGTは複数の画像分類ベンチマークやテキスト分類や検索タスクの精度を向上させることができる。
論文参考訳（メタデータ） (2022-08-14T10:33:58Z)
Generate, Annotate, and Learn: Generative Models Advance Self-Training and Knowledge Distillation [58.64720318755764]
Semi-Supervised Learning (SSL)は多くのアプリケーションドメインで成功している。知識蒸留(KD)により、深層ネットワークとアンサンブルの圧縮が可能となり、新しいタスク固有の未ラベルの例について知識を蒸留する際に最良の結果が得られる。我々は、非条件生成モデルを用いて、ドメイン内の未ラベルデータを合成する「生成、注釈、学習(GAL)」と呼ばれる一般的なフレームワークを提案する。
論文参考訳（メタデータ） (2021-06-11T05:01:24Z)
Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文参考訳（メタデータ） (2021-06-11T01:36:08Z)
An Efficient Method for the Classification of Croplands in Scarce-Label Regions [0.0]
衛星時系列画像による農地分類の主な課題は、地表面データ不足と、未開発地域における高品質のハイパースペクトル画像の到達不能である。ラベルなしの中解像度衛星画像は豊富だが、その恩恵を受けるにはオープンな問題だ。自監督タスクを用いた作物分類におけるその可能性の活用方法を示す。
論文参考訳（メタデータ） (2021-03-17T12:10:11Z)
Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。 3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文参考訳（メタデータ） (2020-07-21T14:31:27Z)
Classify and Generate Reciprocally: Simultaneous Positive-Unlabelled Learning and Conditional Generation with Extra Data [77.31213472792088]
クラスラベルデータの不足は、多くの機械学習問題において、ユビキタスなボトルネックとなっている。本稿では, 正負ラベル付き(PU)分類と, 余分なラベル付きデータによる条件生成を活用することで, この問題に対処する。本稿では,PU分類と条件生成を併用した新たなトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (2020-06-14T08:27:40Z)
Fine-Grained Visual Classification with Efficient End-to-end Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文参考訳（メタデータ） (2020-05-11T14:07:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。