論文の概要: Confidence HNC: A Network Flow Technique for Binary Classification with Noisy Labels
- arxiv url: http://arxiv.org/abs/2503.02352v1
- Date: Tue, 04 Mar 2025 07:21:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:16:22.638859
- Title: Confidence HNC: A Network Flow Technique for Binary Classification with Noisy Labels
- Title(参考訳): 信頼度HNC:雑音ラベルを用いた二項分類のためのネットワークフロー手法
- Authors: Dorit Hochbaum, Torpong Nitayanont,
- Abstract要約: 本稿では,クラスタ内のサンプル間の大きな類似性と,クラスタと補体間の大きな相違性という,2つの目的のバランスをとる分類法について考察する。
HNCまたはSNCと呼ばれるこの方法は、シードノードまたはラベル付きサンプルを必要とし、そのうちの少なくとも1つはクラスタにあり、少なくとも1つは補体である。
ここでの貢献は、信頼HNCと呼ばれるHNCに基づくノイズラベルの存在における新しい方法である。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: We consider here a classification method that balances two objectives: large similarity within the samples in the cluster, and large dissimilarity between the cluster and its complement. The method, referred to as HNC or SNC, requires seed nodes, or labeled samples, at least one of which is in the cluster and at least one in the complement. Other than that, the method relies only on the relationship between the samples. The contribution here is the new method in the presence of noisy labels, based on HNC, called Confidence HNC, in which we introduce confidence weights that allow the given labels of labeled samples to be violated, with a penalty that reflects the perceived correctness of each given label. If a label is violated then it is interpreted that the label was noisy. The method involves a representation of the problem as a graph problem with hyperparameters that is solved very efficiently by the network flow technique of parametric cut. We compare the performance of the new method with leading algorithms on both real and synthetic data with noisy labels and demonstrate that it delivers improved performance in terms of classification accuracy as well as noise detection capability.
- Abstract(参考訳): 本稿では,クラスタ内のサンプル間の大きな類似性と,クラスタと補体間の大きな相違性という,2つの目的のバランスをとる分類法について考察する。
HNCまたはSNCと呼ばれるこの方法は、シードノードまたはラベル付きサンプルを必要とし、そのうちの少なくとも1つはクラスタにあり、少なくとも1つは補体である。
それ以外は、この手法はサンプル間の関係にのみ依存する。
ここでの貢献は、HNCに基づくノイズラベルの存在における新しい手法である Confidence HNC を用いて、ラベル付きサンプルのラベルに違反を許す信頼度重みを導入し、各ラベルの正当性を反映したペナルティを導入することである。
ラベルが侵害された場合、ラベルがうるさいと解釈される。
この方法は、パラメトリックカットのネットワークフロー技術により、非常に効率的に解けるハイパーパラメータのグラフ問題として問題を表現することを含む。
実データと合成データの両方における先行アルゴリズムの性能をノイズラベルと比較し,分類精度とノイズ検出性能の両面で性能の向上を実証した。
関連論文リスト
- Extracting Clean and Balanced Subset for Noisy Long-tailed Classification [66.47809135771698]
そこで我々は,分布マッチングの観点から,クラスプロトタイプを用いた新しい擬似ラベリング手法を開発した。
手動で特定の確率尺度を設定することで、ノイズと長い尾を持つデータの副作用を同時に減らすことができる。
本手法は, クリーンなラベル付きクラスバランスサブセットを抽出し, ラベルノイズ付きロングテール分類において, 効果的な性能向上を実現する。
論文 参考訳(メタデータ) (2024-04-10T07:34:37Z) - Instance-dependent Label Distribution Estimation for Learning with Label Noise [20.479674500893303]
雑音遷移行列(NTM)推定はラベル雑音による学習に有望な手法である。
本稿では、画像分類のためのノイズラベルから学習するためのインスタンス依存ラベル分布推定(ILDE)手法を提案する。
提案手法は, 合成ノイズであっても実雑音であっても, 競合する全ての手法より優れていることを示す。
論文 参考訳(メタデータ) (2022-12-16T10:13:25Z) - Plug-and-Play Pseudo Label Correction Network for Unsupervised Person
Re-identification [36.3733132520186]
グラフベースの擬似ラベル補正ネットワーク(GLC)を提案する。
GLC は k 近傍グラフ上のサンプル間の関係制約を用いて初期雑音ラベルを補正する。
本手法は,様々なクラスタリング手法と互換性があり,最新技術の性能を継続的に向上させる。
論文 参考訳(メタデータ) (2022-06-14T05:59:37Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - Boosting Semi-Supervised Face Recognition with Noise Robustness [54.342992887966616]
本稿では,自動ラベルによるラベル雑音に対して頑健な半教師付き顔認識に対する効果的な解法を提案する。
そこで我々は,gnが強化するロバストな学習能力に基づく,ノイズロバスト学習ラベリング(nroll)という,半教師付き顔認識ソリューションを開発した。
論文 参考訳(メタデータ) (2021-05-10T14:43:11Z) - A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。
人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文 参考訳(メタデータ) (2020-12-22T06:36:58Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z) - GANs for learning from very high class conditional noisy labels [1.6516902135723865]
我々は、GAN(Generative Adversarial Networks)を用いて、バイナリ分類のためのクラス条件付きラベルノイズ(CCN)ロバストなスキームを設計する。
まず、ノイズラベル付きデータと0.1%または1%クリーンラベルから正しいラベル付きデータポイントのセットを生成する。
論文 参考訳(メタデータ) (2020-10-19T15:01:11Z) - Improving Face Recognition by Clustering Unlabeled Faces in the Wild [77.48677160252198]
極値理論に基づく新しいアイデンティティ分離法を提案する。
重なり合うラベルノイズによる問題を大幅に低減する。
制御された設定と実際の設定の両方の実験は、我々のメソッドの一貫性のある改善を示している。
論文 参考訳(メタデータ) (2020-07-14T12:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。