論文の概要: An assessment of data-centric methods for label noise identification in remote sensing data sets
- arxiv url: http://arxiv.org/abs/2603.16835v1
- Date: Tue, 17 Mar 2026 17:40:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.457528
- Title: An assessment of data-centric methods for label noise identification in remote sensing data sets
- Title(参考訳): リモートセンシングデータセットにおけるラベルノイズ識別のためのデータ中心手法の評価
- Authors: Felix Kröber, Genc Hoxha, Ribana Roscher,
- Abstract要約: リモートセンシングの分野では,ラベルノイズの自動処理は近年ほとんど注目されていない。
ラベルノイズに対処するデータ中心手法の性能を体系的に分析することができない。
データ中心のラベルノイズ法をリモートセンシングデータに転送する研究が必要な領域がまだ存在するかを示す。
- 参考スコア(独自算出の注目度): 3.5379796120427627
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Label noise in the sense of incorrect labels is present in many real-world data sets and is known to severely limit the generalizability of deep learning models. In the field of remote sensing, however, automated treatment of label noise in data sets has received little attention to date. In particular, there is a lack of systematic analysis of the performance of data-centric methods that not only cope with label noise but also explicitly identify and isolate noisy labels. In this paper, we examine three such methods and evaluate their behavior under different label noise assumptions. To do this, we inject different types of label noise with noise levels ranging from 10 to 70% into two benchmark data sets, followed by an analysis of how well the selected methods filter the label noise and how this affects task performances. With our analyses, we clearly prove the value of data-centric methods for both parts - label noise identification and task performance improvements. Our analyses provide insights into which method is the best choice depending on the setting and objective. Finally, we show in which areas there is still a need for research in the transfer of data-centric label noise methods to remote sensing data. As such, our work is a step forward in bridging the methodological establishment of data-centric label noise methods and their usage in practical settings in the remote sensing domain.
- Abstract(参考訳): 誤りラベルの意味でのラベルノイズは多くの実世界のデータセットに存在し、ディープラーニングモデルの一般化性を著しく制限することが知られている。
しかし、リモートセンシングの分野では、データセットにおけるラベルノイズの自動処理は、現在はほとんど注目されていない。
特に、ラベルノイズに対処するだけでなく、ノイズのあるラベルを明示的に識別し、分離するデータ中心手法の性能に関する体系的な分析が欠如している。
本稿では,3つの手法について検討し,その挙動をラベルの異なる仮定で評価する。
そこで我々は,2つのベンチマークデータセットに10~70%のノイズレベルを持つラベルノイズを注入し,選択した手法がラベルノイズをフィルタし,それがタスクパフォーマンスに与える影響を解析した。
分析により、ラベルノイズの識別とタスク性能の改善という、両方の部分におけるデータ中心の手法の価値を明確に証明する。
我々の分析は、設定や目的に応じてどの方法が最適かという洞察を提供する。
最後に,データ中心のラベルノイズ法をリモートセンシングデータに転送する研究が必要な領域について述べる。
そこで本研究は,データ中心型ラベルノイズ手法の方法論的確立と,リモートセンシング領域における実践的設定における使用方法のブリッジ化に向けた取り組みである。
関連論文リスト
- Benchmarking noisy label detection methods [0.3154269505086154]
ラベルノイズは実世界のデータセットで一般的な問題であり、モデルのトレーニングと検証の両方に影響を及ぼす。
3つの基本成分に分解して検出手法の総合的なベンチマークを行う。
平均確率アグリゲーションとロジットマージンを組み合わせることで,サンプル内情報収集が最良の結果が得られることを確認した。
論文 参考訳(メタデータ) (2025-10-17T20:55:26Z) - On the Role of Label Noise in the Feature Learning Process [90.49232384723268]
各サンプルはラベルに依存しない信号とラベルに依存しない雑音から構成される。
分析では,2つの重要な段階を同定する。第1段階では,ノイズを無視しながら,すべてのクリーンサンプルに完全に適合するモデルである。
ステージIIでは、ノイズ方向の勾配が信号の勾配を超え、ノイズのあるサンプルに過度に収まる。
論文 参考訳(メタデータ) (2025-05-25T00:13:28Z) - Training Gradient Boosted Decision Trees on Tabular Data Containing Label Noise for Classification Tasks [1.261491746208123]
本研究は,ラベルノイズが勾配ブースト決定木(GBDT)に及ぼす影響について検討する。
GBDTを用いた深層学習から2つのノイズ検出手法を適用し,Gradientsと呼ばれる新しい検出手法を導入する。
ノイズ検出手法は,全てのノイズレベルにわたるアダルトデータセットにおいて,99%以上のノイズ検出精度で,最先端のノイズ検出を実現する。
論文 参考訳(メタデータ) (2024-09-13T09:09:24Z) - Generating the Ground Truth: Synthetic Data for Soft Label and Label Noise Research [0.0]
実世界のデータからノイズのないデータセットを作成するためのフレームワークであるSynLABELを紹介する。
ラベルノイズを精度よく定量化する能力と,既存の手法による改善を実証する。
論文 参考訳(メタデータ) (2023-09-08T13:31:06Z) - Neighborhood Collective Estimation for Noisy Label Identification and
Correction [92.20697827784426]
ノイズラベルを用いた学習(LNL)は,ノイズラベルに対するモデルオーバーフィットの効果を軽減し,モデル性能と一般化を改善するための戦略を設計することを目的としている。
近年の進歩は、個々のサンプルのラベル分布を予測し、ノイズ検証とノイズラベル補正を行い、容易に確認バイアスを生じさせる。
提案手法では, 候補サンプルの予測信頼性を, 特徴空間近傍と対比することにより再推定する。
論文 参考訳(メタデータ) (2022-08-05T14:47:22Z) - Robust Meta-learning with Sampling Noise and Label Noise via
Eigen-Reptile [78.1212767880785]
Meta-learnerは、利用可能なサンプルがわずかしかないため、過度に適合する傾向がある。
ノイズの多いラベルでデータを扱う場合、メタラーナーはラベルノイズに対して非常に敏感になる可能性がある。
本稿では,タスク固有のパラメータの主要な方向でメタパラメータを更新するEigen-Reptile(ER)を提案する。
論文 参考訳(メタデータ) (2022-06-04T08:48:02Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Learning to Aggregate and Refine Noisy Labels for Visual Sentiment
Analysis [69.48582264712854]
本研究では,頑健な視覚的感情分析を行うための頑健な学習手法を提案する。
本手法は,トレーニング中にノイズラベルを集約・フィルタリングするために外部メモリに依存している。
公開データセットを用いたラベルノイズを用いた視覚的感情分析のベンチマークを構築した。
論文 参考訳(メタデータ) (2021-09-15T18:18:28Z) - A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。
人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文 参考訳(メタデータ) (2020-12-22T06:36:58Z) - EvidentialMix: Learning with Combined Open-set and Closed-set Noisy
Labels [30.268962418683955]
開集合ラベルと閉集合ラベルを組み合わせた雑音ラベル問題の新しい変種について検討する。
その結果,従来の最先端手法よりも優れた分類結果と特徴表現が得られた。
論文 参考訳(メタデータ) (2020-11-11T11:15:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。