論文の概要: Learning from Noisy Similar and Dissimilar Data
- arxiv url: http://arxiv.org/abs/2002.00995v1
- Date: Mon, 3 Feb 2020 19:59:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 08:20:43.358874
- Title: Learning from Noisy Similar and Dissimilar Data
- Title(参考訳): ノイズ類似データと異種データからの学習
- Authors: Soham Dan, Han Bao, Masashi Sugiyama
- Abstract要約: ノイズSとDラベル付きデータから分類器を学習する方法を示す。
また、このような相互監督データからの学習と、通常のクラスラベルデータからの学習との間に重要な関連性を示す。
- 参考スコア(独自算出の注目度): 84.76686918337134
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the widespread use of machine learning for classification, it becomes
increasingly important to be able to use weaker kinds of supervision for tasks
in which it is hard to obtain standard labeled data. One such kind of
supervision is provided pairwise---in the form of Similar (S) pairs (if two
examples belong to the same class) and Dissimilar (D) pairs (if two examples
belong to different classes). This kind of supervision is realistic in
privacy-sensitive domains. Although this problem has been looked at recently,
it is unclear how to learn from such supervision under label noise, which is
very common when the supervision is crowd-sourced. In this paper, we close this
gap and demonstrate how to learn a classifier from noisy S and D labeled data.
We perform a detailed investigation of this problem under two realistic noise
models and propose two algorithms to learn from noisy S-D data. We also show
important connections between learning from such pairwise supervision data and
learning from ordinary class-labeled data. Finally, we perform experiments on
synthetic and real world datasets and show our noise-informed algorithms
outperform noise-blind baselines in learning from noisy pairwise data.
- Abstract(参考訳): 分類に機械学習が広く使われるようになると、標準ラベル付きデータを得るのが難しいタスクに弱い種類の監視を使用できることがますます重要になる。
例えば、類似(S)ペア(2つの例が同じクラスに属している場合)と類似(D)ペア(2つの例が異なるクラスに属している場合)という形式である。
この種の監視は、プライバシーに敏感なドメインでは現実的です。
近年,この問題が注目されているが,クラウドソース化において非常に一般的なラベルノイズの下で,このような監視からどのように学習するかは定かではない。
本稿では、このギャップを埋めて、ノイズSとDラベル付きデータから分類器を学習する方法を示す。
2つの現実的なノイズモデルの下でこの問題を詳細に検討し,ノイズs-dデータから学習するための2つのアルゴリズムを提案する。
また、このような相互監督データからの学習と、通常のクラスラベルデータからの学習との間に重要な関連性を示す。
最後に,合成データと実世界のデータセットについて実験を行い,ノイズ除去アルゴリズムがノイズブラインベースラインを上回ることを示す。
関連論文リスト
- ROG$_{PL}$: Robust Open-Set Graph Learning via Region-Based Prototype
Learning [52.60434474638983]
本稿では,複雑な雑音グラフデータに対する堅牢なオープンセット学習を実現するために,ROG$_PL$という統一フレームワークを提案する。
このフレームワークは2つのモジュール、すなわちラベルの伝搬による認知と、リージョンによるオープンセットのプロトタイプ学習で構成されている。
我々の知る限り、ROG$_PL$は複雑なノイズを持つグラフデータに対して、最初の堅牢なオープンセットノード分類法である。
論文 参考訳(メタデータ) (2024-02-28T17:25:06Z) - Multiclass Learning from Noisy Labels for Non-decomposable Performance Measures [15.358504449550013]
非分解性性能尺度の2つのクラスに対して雑音ラベルから学習するアルゴリズムを設計する。
どちらの場合も、広範に研究されているクラス条件雑音モデルの下で、アルゴリズムのノイズ補正バージョンを開発する。
実験では,ラベルノイズ処理におけるアルゴリズムの有効性を実証した。
論文 参考訳(メタデータ) (2024-02-01T23:03:53Z) - Double Descent and Overfitting under Noisy Inputs and Distribution Shift for Linear Denoisers [3.481985817302898]
教師付き denoising を研究する上での懸念は,テスト分布からのノイズレストレーニングデータが常に存在するとは限らないことだ。
そこで本研究では,分散シフト下での教師付きノイズ除去とノイズインプット回帰について検討した。
論文 参考訳(メタデータ) (2023-05-26T22:41:40Z) - Learning with Neighbor Consistency for Noisy Labels [69.83857578836769]
特徴空間におけるトレーニング例間の類似性を利用した雑音ラベルから学習する手法を提案する。
合成(CIFAR-10, CIFAR-100)とリアル(mini-WebVision, Clothing1M, mini-ImageNet-Red)の両方のノイズを評価するデータセットの評価を行った。
論文 参考訳(メタデータ) (2022-02-04T15:46:27Z) - Learning with Noisy Labels Revisited: A Study Using Real-World Human
Annotations [54.400167806154535]
ノイズラベルを用いた学習に関する既存の研究は、主に合成ラベルノイズに焦点を当てている。
本研究は2つの新しいベンチマークデータセット(CIFAR-10N, CIFAR-100N)を示す。
実世界のノイズラベルは古典的に採用されたクラス依存のラベルではなく、インスタンス依存のパターンに従うことを示す。
論文 参考訳(メタデータ) (2021-10-22T22:42:11Z) - Learning From Long-Tailed Data With Noisy Labels [0.0]
クラス不均衡とノイズラベルは多くの大規模分類データセットの標準である。
本稿では,近年の自己教師型学習の進歩をもとに,簡単な2段階のアプローチを提案する。
自己指導型学習アプローチは,重度のクラス不均衡に効果的に対処できることが判明した。
論文 参考訳(メタデータ) (2021-08-25T07:45:40Z) - Class2Simi: A Noise Reduction Perspective on Learning with Noisy Labels [98.13491369929798]
そこで我々は,ノイズのあるクラスラベルを持つデータポイントを,ノイズの多い類似ラベルを持つデータペアに変換するClass2Simiというフレームワークを提案する。
Class2Simiは、この変換がミニバッチのオンザフライであるだけでなく、モデル予測上の損失をペアワイズに変化させるため、計算的に効率的である。
論文 参考訳(メタデータ) (2020-06-14T07:55:32Z) - Learning with Out-of-Distribution Data for Audio Classification [60.48251022280506]
我々は,OODインスタンスを破棄するよりも,特定のOODインスタンスを検出・復号化することで,学習に肯定的な影響を及ぼすことを示す。
提案手法は,畳み込みニューラルネットワークの性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-02-11T21:08:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。