論文の概要: Life is not black and white -- Combining Semi-Supervised Learning with
fuzzy labels
- arxiv url: http://arxiv.org/abs/2110.06592v1
- Date: Wed, 13 Oct 2021 09:20:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 13:41:43.325140
- Title: Life is not black and white -- Combining Semi-Supervised Learning with
fuzzy labels
- Title(参考訳): 人生は白黒ではない -- 半監督学習とファジィラベルを組み合わせる
- Authors: Lars Schmarje and Reinhard Koch
- Abstract要約: 半教師付き学習は、追加のラベルのないデータを使用することで、この問題を解決できる可能性がある。
ファジィラベルを半監督学習に組み込むことを想定し、潜在的なコスト削減と一貫性の向上を実証する。
- 参考スコア(独自算出の注目度): 2.550900579709111
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The required amount of labeled data is one of the biggest issues in deep
learning. Semi-Supervised Learning can potentially solve this issue by using
additional unlabeled data. However, many datasets suffer from variability in
the annotations. The aggregated labels from these annotation are not consistent
between different annotators and thus are considered fuzzy. These fuzzy labels
are often not considered by Semi-Supervised Learning. This leads either to an
inferior performance or to higher initial annotation costs in the complete
machine learning development cycle. We envision the incorporation of fuzzy
labels into Semi-Supervised Learning and give a proof-of-concept of the
potential lower costs and higher consistency in the complete development cycle.
As part of our concept, we discuss current limitations, futures research
opportunities and potential broad impacts.
- Abstract(参考訳): ラベル付きデータの必要な量は、ディープラーニングの最大の問題のひとつです。
半教師付き学習は、ラベルなしのデータを追加することでこの問題を解決できる。
しかし、多くのデータセットはアノテーションの可変性に苦しむ。
これらのアノテーションからの集約されたラベルは、異なるアノテーション間で一貫性がなく、ファジィであると考えられる。
これらのファジィラベルは、しばしば半教師付き学習では考慮されない。
これにより、パフォーマンスが低下するか、マシンラーニング開発サイクル全体の初期アノテーションコストが上昇する。
我々は,ファジィラベルを半監督学習に組み込むことを想定し,潜在的なコスト削減と開発サイクルの整合性の実証を行う。
私たちのコンセプトでは、現在の限界、将来の研究機会、潜在的に幅広い影響について話し合っています。
関連論文リスト
- You can't handle the (dirty) truth: Data-centric insights improve pseudo-labeling [60.27812493442062]
擬似ラベル法を改善するためにラベル付きデータ品質を調査することが重要であることを示す。
具体的には、擬似ラベルの拡張のために、DIPSと呼ばれる新しいデータキャラクタリゼーションと選択フレームワークを導入する。
本研究では,多種多様な実世界のデータセットを対象とした擬似ラベル手法に対するDIPSの適用性と影響を実証する。
論文 参考訳(メタデータ) (2024-06-19T17:58:40Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - FlatMatch: Bridging Labeled Data and Unlabeled Data with Cross-Sharpness
for Semi-Supervised Learning [73.13448439554497]
Semi-Supervised Learning (SSL) は、ラベル付きデータが極めて少ない豊富なラベル付きデータを活用する効果的な方法である。
ほとんどのSSLメソッドは、通常、異なるデータ変換間のインスタンス単位の一貫性に基づいている。
本研究では,2つのデータセット間の一貫した学習性能を確保するために,クロスシャープネス尺度を最小化するFlatMatchを提案する。
論文 参考訳(メタデータ) (2023-10-25T06:57:59Z) - Towards Imbalanced Large Scale Multi-label Classification with Partially
Annotated Labels [8.977819892091]
マルチラベル分類は、複数のクラスにインスタンスを関連付けることができる日常生活において、広く発生する問題である。
本研究では,ラベルの不均衡の問題に対処し,部分ラベルを用いたニューラルネットワークのトレーニング方法について検討する。
論文 参考訳(メタデータ) (2023-07-31T21:50:48Z) - Imprecise Label Learning: A Unified Framework for Learning with Various Imprecise Label Configurations [91.67511167969934]
imprecise label learning (ILL)は、様々な不正確なラベル構成で学習を統合するためのフレームワークである。
我々は、ILLが部分ラベル学習、半教師付き学習、雑音ラベル学習にシームレスに適応できることを実証した。
論文 参考訳(メタデータ) (2023-05-22T04:50:28Z) - Towards Label-Efficient Incremental Learning: A Survey [42.603603392991715]
本研究では,学習者が様々な分布を持つデータストリームに適応するために,インクリメンタル学習を学習する。
ラベル付け作業を減らすために, セミショット, 数ショット, 自己教師型学習の3つの区分を同定した。
論文 参考訳(メタデータ) (2023-02-01T10:24:55Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - How many labelers do you have? A closer look at gold-standard labels [10.637125300701795]
我々は、非集約ラベル情報へのアクセスによって、ゴールドスタンダードラベルよりも、トレーニングの適格化がより実現可能であることを示す。
我々は,非アグリゲートラベルが学習性能を改善することを含む,実世界のデータセットの予測を行う。
論文 参考訳(メタデータ) (2022-06-24T02:33:50Z) - Fairness in Semi-supervised Learning: Unlabeled Data Help to Reduce
Discrimination [53.3082498402884]
機械学習の台頭における投機は、機械学習モデルによる決定が公正かどうかである。
本稿では,未ラベルデータのラベルを予測するための擬似ラベリングを含む,前処理フェーズにおける公平な半教師付き学習の枠組みを提案する。
偏見、分散、ノイズの理論的分解分析は、半教師付き学習における差別の異なる源とそれらが公平性に与える影響を浮き彫りにする。
論文 参考訳(メタデータ) (2020-09-25T05:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。