論文の概要: Beyond Hard Labels: Investigating data label distributions
- arxiv url: http://arxiv.org/abs/2207.06224v1
- Date: Wed, 13 Jul 2022 14:25:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 12:20:08.936572
- Title: Beyond Hard Labels: Investigating data label distributions
- Title(参考訳): ハードラベルを超える:データラベルディストリビューションの調査
- Authors: Vasco Grossmann, Lars Schmarje, Reinhard Koch
- Abstract要約: 学習の相違を、合成データセットと実世界のデータセットのハードラベルとソフトラベルと比較する。
ソフトラベルの適用により性能が向上し、内部特徴空間のより規則的な構造が得られる。
- 参考スコア(独自算出の注目度): 0.9668407688201357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-quality data is a key aspect of modern machine learning. However, labels
generated by humans suffer from issues like label noise and class ambiguities.
We raise the question of whether hard labels are sufficient to represent the
underlying ground truth distribution in the presence of these inherent
imprecision. Therefore, we compare the disparity of learning with hard and soft
labels quantitatively and qualitatively for a synthetic and a real-world
dataset. We show that the application of soft labels leads to improved
performance and yields a more regular structure of the internal feature space.
- Abstract(参考訳): 高品質なデータは、現代の機械学習の重要な側面である。
しかし、人間が生成するラベルは、ラベルノイズやクラス曖昧さといった問題に苦しんでいる。
我々は,ハードラベルが根底にある真理分布を表現するのに十分かどうかという疑問を提起する。
そこで本研究では,学習の相違を,合成および実世界のデータセットに対して定量的,質的に比較する。
ソフトラベルの適用により性能が向上し,内部特徴空間のより規則的な構造が得られることを示す。
関連論文リスト
- Label Distribution Learning with Biased Annotations by Learning Multi-Label Representation [120.97262070068224]
マルチラベル学習(MLL)は,実世界のデータ表現能力に注目されている。
ラベル分布学習(LDL)は正確なラベル分布の収集において課題に直面している。
論文 参考訳(メタデータ) (2025-02-03T09:04:03Z) - Learning from Ambiguous Data with Hard Labels [34.06499138206804]
現実世界のデータには、共通のシングル・ハード・ラベル・アノテーションのパラダイムが無視する固有の曖昧さがしばしば含まれている。
硬いラベルを持つあいまいなデータを用いた標準的なトレーニングは、過度に自信過剰なモデルを生み出し、その結果、一般化が不十分になる可能性がある。
我々はこの問題を軽減するために、Quantized Label Learning(QLL)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-03T14:54:49Z) - Robust Semi-Supervised Learning in Open Environments [51.741549825533816]
半教師付き学習(SSL)は、ラベルが不足しているときにラベルのないデータを活用することで、パフォーマンスを向上させることを目的としている。
不整合なラベル付きデータを利用すると、大幅な性能劣化が発生することが報告されている。
本稿では,SSLにおけるラベル,特徴,データ分散の不整合に関する技術に焦点をあて,この研究の展開を簡潔に紹介する。
論文 参考訳(メタデータ) (2024-12-24T08:13:01Z) - You can't handle the (dirty) truth: Data-centric insights improve pseudo-labeling [60.27812493442062]
擬似ラベル法を改善するためにラベル付きデータ品質を調査することが重要であることを示す。
具体的には、擬似ラベルの拡張のために、DIPSと呼ばれる新しいデータキャラクタリゼーションと選択フレームワークを導入する。
本研究では,多種多様な実世界のデータセットを対象とした擬似ラベル手法に対するDIPSの適用性と影響を実証する。
論文 参考訳(メタデータ) (2024-06-19T17:58:40Z) - Imprecise Label Learning: A Unified Framework for Learning with Various Imprecise Label Configurations [91.67511167969934]
imprecise label learning (ILL)は、様々な不正確なラベル構成で学習を統合するためのフレームワークである。
我々は、ILLが部分ラベル学習、半教師付き学習、雑音ラベル学習にシームレスに適応できることを実証した。
論文 参考訳(メタデータ) (2023-05-22T04:50:28Z) - Learning From Biased Soft Labels [48.84637168570285]
ある研究では、知識の蒸留とラベルの平滑化がソフトラベルからの学習として統合できることが示されている。
本稿では, バイアス付きソフトラベルが依然として有効かどうかを考察する。
論文 参考訳(メタデータ) (2023-02-16T08:57:48Z) - An Empirical Investigation of Learning from Biased Toxicity Labels [15.822714574671412]
我々は,人間の注釈付きラベルの小さなデータセットと,合成されたラベルの大きいがノイズの多いデータセットを,異なるトレーニング戦略が活用できるかを検討する。
これらの手法の精度と公平性、および両者のトレードオフを評価する。
論文 参考訳(メタデータ) (2021-10-04T17:19:57Z) - Harmless label noise and informative soft-labels in supervised
classification [1.6752182911522517]
トレーニング例の手動ラベリングは、教師付き学習の一般的なプラクティスです。
ラベル処理が非自明な難易度である場合、供給されたラベルは接地ラベルと等しくなく、ラベルノイズをトレーニングデータセットに導入する。
特に、分類困難がラベルエラーの唯一の原因である場合、複数のノイズラベルセットは、分類規則の推定により多くの情報を提供することができる。
論文 参考訳(メタデータ) (2021-04-07T02:56:11Z) - Exploiting Context for Robustness to Label Noise in Active Learning [47.341705184013804]
本稿では,どのラベルが間違っているのかをシステムがどのように識別するか,ラベルノイズの負の影響を最小限に抑えるために,マルチクラスアクティブラーニングシステムをどのように適用できるか,といった課題に対処する。
我々は、これらの関係を符号化し、ノイズラベルが利用できる場合にグラフ上の新しい信念を得るために、ラベルなしデータのグラフィカルな表現を構築した。
これはシーン分類、アクティビティ分類、文書分類の3つの異なる応用で実証されている。
論文 参考訳(メタデータ) (2020-10-18T18:59:44Z) - Limitations of weak labels for embedding and tagging [0.0]
環境音響分析における多くのデータセットやアプローチは、弱いラベル付きデータを用いており、強いラベルで全てのデータサンプルに注釈をつけるのは高すぎるため、弱いラベルが用いられる。
本稿では,弱いラベルを含む教師付き学習問題を定式化し,他の課題とは対照的に,強いラベルと弱いラベルの違いに着目したデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-05T08:54:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。