論文の概要: Noisy Label Refinement with Semantically Reliable Synthetic Images
- arxiv url: http://arxiv.org/abs/2509.04298v1
- Date: Thu, 04 Sep 2025 15:13:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.199915
- Title: Noisy Label Refinement with Semantically Reliable Synthetic Images
- Title(参考訳): 意味的信頼性のある合成画像を用いた雑音ラベルの微細化
- Authors: Yingxuan Li, Jiafeng Mao, Yusuke Matsui,
- Abstract要約: 本稿では,高度なテキスト・画像モデルによって生成された合成画像を用いてこの問題に対処する可能性を探る。
本稿では,合成画像を信頼度の高い基準点として活用して,ノイズのあるデータセット中の誤りラベル付きサンプルを同定し,修正する手法を提案する。
- 参考スコア(独自算出の注目度): 20.79489362717427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic noise in image classification datasets, where visually similar categories are frequently mislabeled, poses a significant challenge to conventional supervised learning approaches. In this paper, we explore the potential of using synthetic images generated by advanced text-to-image models to address this issue. Although these high-quality synthetic images come with reliable labels, their direct application in training is limited by domain gaps and diversity constraints. Unlike conventional approaches, we propose a novel method that leverages synthetic images as reliable reference points to identify and correct mislabeled samples in noisy datasets. Extensive experiments across multiple benchmark datasets show that our approach significantly improves classification accuracy under various noise conditions, especially in challenging scenarios with semantic label noise. Additionally, since our method is orthogonal to existing noise-robust learning techniques, when combined with state-of-the-art noise-robust training methods, it achieves superior performance, improving accuracy by 30% on CIFAR-10 and by 11% on CIFAR-100 under 70% semantic noise, and by 24% on ImageNet-100 under real-world noise conditions.
- Abstract(参考訳): 画像分類データセットのセマンティックノイズは、視覚的に類似したカテゴリがしばしば誤ってラベル付けされているが、従来の教師付き学習アプローチでは大きな課題となっている。
本稿では,高度なテキスト・画像モデルによって生成された合成画像を用いてこの問題に対処する可能性について検討する。
これらの高品質な合成画像には信頼性のあるラベルがあるが、訓練における直接適用はドメインギャップと多様性の制約によって制限される。
従来の手法とは違って,合成画像を信頼度の高い基準点として活用して,ノイズのあるデータセットの誤ラベルを識別し,修正する手法を提案する。
複数のベンチマークデータセットにまたがる大規模な実験により,提案手法は様々なノイズ条件下での分類精度を著しく向上させ,特にセマンティックラベルノイズを伴う難解なシナリオにおいて有効であることが示された。
さらに,本手法は従来のノイズロバスト学習手法と直交するので,最先端のノイズロバスト学習手法と組み合わせることで,CIFAR-10では30%,CIFAR-100では11%,実環境環境では24%の精度向上を実現している。
関連論文リスト
- Explainable Synthetic Image Detection through Diffusion Timestep Ensembling [30.298198387824275]
本稿では,複数の雑音の時間ステップでアンサンブルを訓練することにより,中間雑音画像の特徴を直接活用する合成画像検出手法を提案する。
人間の理解を深めるために,メートル法に基づく説明文生成と改良モジュールを導入する。
本手法は, 正解率98.91%, 正解率95.89%, 正解率95.89%, 正解率98.91%, 正解率95.89%である。
論文 参考訳(メタデータ) (2025-03-08T13:04:20Z) - Mitigating Instance-Dependent Label Noise: Integrating Self-Supervised Pretraining with Pseudo-Label Refinement [3.272177633069322]
実世界のデータセットは、アノテーションプロセス中にヒューマンエラー、あいまいさ、リソース制約のために、ノイズの多いラベルを含むことが多い。
そこで本研究では,SimCLRを用いた自己教師型学習と反復的擬似ラベル改良を組み合わせた新しいフレームワークを提案する。
提案手法は,特に高騒音条件下では,いくつかの最先端手法よりも優れる。
論文 参考訳(メタデータ) (2024-12-06T09:56:49Z) - Mitigating Noisy Supervision Using Synthetic Samples with Soft Labels [13.314778587751588]
ノイズラベルは、特にクラウドソーシングやWeb検索から派生した大規模データセットにおいて、現実世界のデータセットにおいてユビキタスである。
トレーニング中にノイズの多いラベルを過度に適合させる傾向にあるため、ノイズの多いデータセットでディープニューラルネットワークをトレーニングすることは難しい。
ノイズラベルの影響を軽減するために,新しい合成サンプルを用いてモデルを訓練するフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-22T04:49:39Z) - Realistic Noise Synthesis with Diffusion Models [44.404059914652194]
ディープラーニングモデルには、大規模な実世界のトレーニングデータが必要です。
本稿では,これらの課題に対処するために拡散モデルを用いた新しい実音合成拡散器(RNSD)法を提案する。
論文 参考訳(メタデータ) (2023-05-23T12:56:01Z) - Learning with Neighbor Consistency for Noisy Labels [69.83857578836769]
特徴空間におけるトレーニング例間の類似性を利用した雑音ラベルから学習する手法を提案する。
合成(CIFAR-10, CIFAR-100)とリアル(mini-WebVision, Clothing1M, mini-ImageNet-Red)の両方のノイズを評価するデータセットの評価を行った。
論文 参考訳(メタデータ) (2022-02-04T15:46:27Z) - IDR: Self-Supervised Image Denoising via Iterative Data Refinement [66.5510583957863]
本稿では,最先端のデノナイジング性能を実現するために,教師なしの実用的なデノナイジング手法を提案する。
本手法では, 1つのノイズ画像と1つのノイズモデルしか必要とせず, 実際の生画像に容易にアクセス可能である。
実世界のアプリケーションにおける生画像復調性能を評価するため,500シーンのシーンを含む高品質な生画像データセットSenseNoise-500を構築した。
論文 参考訳(メタデータ) (2021-11-29T07:22:53Z) - Learning with Noisy Labels Revisited: A Study Using Real-World Human
Annotations [54.400167806154535]
ノイズラベルを用いた学習に関する既存の研究は、主に合成ラベルノイズに焦点を当てている。
本研究は2つの新しいベンチマークデータセット(CIFAR-10N, CIFAR-100N)を示す。
実世界のノイズラベルは古典的に採用されたクラス依存のラベルではなく、インスタンス依存のパターンに従うことを示す。
論文 参考訳(メタデータ) (2021-10-22T22:42:11Z) - ScanMix: Learning from Severe Label Noise via Semantic Clustering and
Semi-Supervised Learning [33.376639002442914]
提案するトレーニングアルゴリズムScanMixは、セマンティッククラスタリングと半教師付き学習(SSL)を組み合わせて、特徴表現を改善する。
ScanMixは期待最大化(EM)フレームワークに基づいて設計されており、Eステップはトレーニングイメージをクラスタ化するために潜む変数の値を推定します。
CIFAR-10 と CIFAR-100 の対称,非対称,セマンティックラベルノイズの標準ベンチマークおよび WebVision の大規模実ラベルノイズについて,その現状について述べる。
論文 参考訳(メタデータ) (2021-03-21T13:43:09Z) - Data-driven Meta-set Based Fine-Grained Visual Classification [61.083706396575295]
本稿では, ノイズの多いWeb画像に対して, 微粒化認識のためのデータ駆動型メタセットベースアプローチを提案する。
具体的には、少量のクリーンなメタセットでガイドされ、メタラーニング方式で選択ネットを訓練し、分布内および分布外ノイズ画像の識別を行う。
論文 参考訳(メタデータ) (2020-08-06T03:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。