論文の概要: Sample Selection via Contrastive Fragmentation for Noisy Label Regression
- arxiv url: http://arxiv.org/abs/2502.17771v1
- Date: Tue, 25 Feb 2025 02:04:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-26 15:23:37.740945
- Title: Sample Selection via Contrastive Fragmentation for Noisy Label Regression
- Title(参考訳): ノイズラベル回帰に対するコントラストフラグメンテーションによるサンプル選択
- Authors: Chris Dongjoo Kim, Sangwoo Moon, Jihwan Moon, Dongyeon Woo, Gunhee Kim,
- Abstract要約: 本稿では,ConFragという新しい手法を提案する。この手法では,回帰データを不整合かつ対照的なフラグメンテーションペアに変換することによって,集合的にモデル化する。
我々のConFragフレームワークは、隣接するフラグメントの混合を利用して、専門家の特徴抽出器間の近傍合意を通じてノイズラベルを識別する。
我々は,年齢予測,価格予測,音楽制作年数推定など,さまざまな領域で新たにキュレートされた6つのベンチマークデータセットの実験を広範囲に実施した。
- 参考スコア(独自算出の注目度): 38.26477510619512
- License:
- Abstract: As with many other problems, real-world regression is plagued by the presence of noisy labels, an inevitable issue that demands our attention. Fortunately, much real-world data often exhibits an intrinsic property of continuously ordered correlations between labels and features, where data points with similar labels are also represented with closely related features. In response, we propose a novel approach named ConFrag, where we collectively model the regression data by transforming them into disjoint yet contrasting fragmentation pairs. This enables the training of more distinctive representations, enhancing the ability to select clean samples. Our ConFrag framework leverages a mixture of neighboring fragments to discern noisy labels through neighborhood agreement among expert feature extractors. We extensively perform experiments on six newly curated benchmark datasets of diverse domains, including age prediction, price prediction, and music production year estimation. We also introduce a metric called Error Residual Ratio (ERR) to better account for varying degrees of label noise. Our approach consistently outperforms fourteen state-of-the-art baselines, being robust against symmetric and random Gaussian label noise.
- Abstract(参考訳): 他の多くの問題と同様に、現実の回帰はノイズの多いラベルの存在に悩まされています。
幸いなことに、多くの実世界のデータは、しばしばラベルと特徴の間に連続的に順序付けられた相関の本質的な性質を示す。
これに対し,ConFrag という新しい手法を提案する。この手法では,これらを不整合かつ対照的なフラグメンテーションペアに変換することにより,回帰データを集合的にモデル化する。
これにより、より独特な表現のトレーニングが可能になり、クリーンなサンプルを選択できるようになる。
我々のConFragフレームワークは、隣接するフラグメントの混合を利用して、専門家の特徴抽出器間の近傍合意を通じてノイズラベルを識別する。
我々は,年齢予測,価格予測,音楽制作年数推定など,さまざまな領域で新たにキュレートされた6つのベンチマークデータセットの実験を広範囲に実施した。
Error Residual Ratio(ERR)と呼ばれるメトリクスも導入し、ラベルノイズの度合いをよりよく説明します。
我々の手法は14の最先端のベースラインを一貫して上回り、対称およびランダムなガウスのラベルノイズに対して頑健である。
関連論文リスト
- Adaptive Collaborative Correlation Learning-based Semi-Supervised Multi-Label Feature Selection [25.195711274756334]
適応的協調相関 lEarning-based Semi-Supervised Multi-label Feature Selection (Access-MFS) 法を提案する。
具体的には、拡張された非相関制約を備えた一般化回帰モデルを導入し、識別的かつ無関係な特徴を選択する。
相関インスタンスとラベル相関を提案回帰モデルに統合し,サンプル類似度グラフとラベル類似度グラフの両方を適応的に学習する。
論文 参考訳(メタデータ) (2024-06-18T01:47:38Z) - Extracting Clean and Balanced Subset for Noisy Long-tailed Classification [66.47809135771698]
そこで我々は,分布マッチングの観点から,クラスプロトタイプを用いた新しい擬似ラベリング手法を開発した。
手動で特定の確率尺度を設定することで、ノイズと長い尾を持つデータの副作用を同時に減らすことができる。
本手法は, クリーンなラベル付きクラスバランスサブセットを抽出し, ラベルノイズ付きロングテール分類において, 効果的な性能向上を実現する。
論文 参考訳(メタデータ) (2024-04-10T07:34:37Z) - Co-Learning Meets Stitch-Up for Noisy Multi-label Visual Recognition [70.00984078351927]
本稿では,多ラベル分類と長期学習の特徴に基づく雑音の低減に焦点をあてる。
よりクリーンなサンプルを合成し,マルチラベルノイズを直接低減するStitch-Up拡張を提案する。
ヘテロジニアス・コラーニング・フレームワークは、長い尾の分布とバランスの取れた分布の不整合を活用するためにさらに設計されている。
論文 参考訳(メタデータ) (2023-07-03T09:20:28Z) - Neighborhood Collective Estimation for Noisy Label Identification and
Correction [92.20697827784426]
ノイズラベルを用いた学習(LNL)は,ノイズラベルに対するモデルオーバーフィットの効果を軽減し,モデル性能と一般化を改善するための戦略を設計することを目的としている。
近年の進歩は、個々のサンプルのラベル分布を予測し、ノイズ検証とノイズラベル補正を行い、容易に確認バイアスを生じさせる。
提案手法では, 候補サンプルの予測信頼性を, 特徴空間近傍と対比することにより再推定する。
論文 参考訳(メタデータ) (2022-08-05T14:47:22Z) - Part-based Pseudo Label Refinement for Unsupervised Person
Re-identification [29.034390810078172]
教師なしの人物再識別(re-ID)は、ラベルなしデータから人物検索のための識別表現を学習することを目的としている。
近年の手法では擬似ラベルを用いることでこの課題が達成されているが,これらのラベルは本質的にノイズが多く,精度が低下している。
本稿では,グローバルな特徴と部分的特徴の相補関係を利用して,ラベルノイズを低減するPseudo Label Refinement (PPLR) フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-28T12:15:53Z) - AggMatch: Aggregating Pseudo Labels for Semi-Supervised Learning [25.27527138880104]
半教師付き学習は、大量のラベルのないデータを活用するための効果的なパラダイムであることが証明されている。
AggMatchは、異なる自信のあるインスタンスを使用して初期擬似ラベルを洗練する。
我々は,AggMatchの標準ベンチマークにおける最新の手法に対する有効性を示す実験を行った。
論文 参考訳(メタデータ) (2022-01-25T16:41:54Z) - Label-Occurrence-Balanced Mixup for Long-tailed Recognition [6.482544017574614]
本稿では,各クラスにおけるラベル発生率を統計的にバランスよく保ちながら,データ量を増やすためのラベル・オクレンス・バランサード・ミックスアップを提案する。
長い視力と音声認識のベンチマークで本手法を検証した。
論文 参考訳(メタデータ) (2021-10-11T02:22:02Z) - Label Noise in Adversarial Training: A Novel Perspective to Study Robust
Overfitting [45.58217741522973]
逆行訓練においてラベルノイズが存在することを示す。
このようなラベルノイズは、正反対例の真のラベル分布とクリーン例から受け継いだラベルとのミスマッチに起因する。
本稿では,ラベルノイズと頑健なオーバーフィッティングに対処するため,ラベルの自動校正手法を提案する。
論文 参考訳(メタデータ) (2021-10-07T01:15:06Z) - Learning to Aggregate and Refine Noisy Labels for Visual Sentiment
Analysis [69.48582264712854]
本研究では,頑健な視覚的感情分析を行うための頑健な学習手法を提案する。
本手法は,トレーニング中にノイズラベルを集約・フィルタリングするために外部メモリに依存している。
公開データセットを用いたラベルノイズを用いた視覚的感情分析のベンチマークを構築した。
論文 参考訳(メタデータ) (2021-09-15T18:18:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。