論文の概要: Data Consistency for Weakly Supervised Learning
- arxiv url: http://arxiv.org/abs/2202.03987v1
- Date: Tue, 8 Feb 2022 16:48:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-09 17:01:12.928026
- Title: Data Consistency for Weakly Supervised Learning
- Title(参考訳): 弱教師付き学習のためのデータ一貫性
- Authors: Chidubem Arachie, Bert Huang
- Abstract要約: 機械学習モデルのトレーニングには、大量の人間が注釈付けしたデータを使用する。
本稿では、雑音ラベル、すなわち弱い信号を処理する新しい弱監督アルゴリズムを提案する。
本研究では,テキストと画像の分類作業において,最先端の弱い監督手法を著しく上回っていることを示す。
- 参考スコア(独自算出の注目度): 15.365232702938677
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many applications, training machine learning models involves using large
amounts of human-annotated data. Obtaining precise labels for the data is
expensive. Instead, training with weak supervision provides a low-cost
alternative. We propose a novel weak supervision algorithm that processes noisy
labels, i.e., weak signals, while also considering features of the training
data to produce accurate labels for training. Our method searches over
classifiers of the data representation to find plausible labelings. We call
this paradigm data consistent weak supervision. A key facet of our framework is
that we are able to estimate labels for data examples low or no coverage from
the weak supervision. In addition, we make no assumptions about the joint
distribution of the weak signals and true labels of the data. Instead, we use
weak signals and the data features to solve a constrained optimization that
enforces data consistency among the labels we generate. Empirical evaluation of
our method on different datasets shows that it significantly outperforms
state-of-the-art weak supervision methods on both text and image classification
tasks.
- Abstract(参考訳): 多くの応用において、機械学習モデルのトレーニングは、大量の人間の注釈データを使用する。
データの正確なラベルを取得するのはコストがかかる。
代わりに、弱い監督によるトレーニングは、低コストな代替手段を提供する。
本稿では,ノイズの少ないラベル,すなわち弱信号を処理するとともに,トレーニングデータの特徴を考慮し,正確なラベルを生成する新しい弱い監督アルゴリズムを提案する。
本手法は,データ表現の分類器を探索し,妥当なラベリングを求める。
私たちはこのパラダイムデータを、一貫した弱い監視と呼んでいる。
当社のフレームワークの重要な側面は、データサンプルのラベルを低く、あるいは、弱い監督層からカバーできないと見積もることができることです。
また,弱い信号と真のラベルの結合分布については仮定しない。
代わりに、弱い信号とデータ機能を使って、生成するラベル間のデータの一貫性を強制する制約付き最適化を解決します。
異なるデータセット上での手法の実証的評価は,テキスト分類と画像分類の両方において,最先端の弱い監督手法を著しく上回っていることを示している。
関連論文リスト
- Soft Curriculum for Learning Conditional GANs with Noisy-Labeled and
Uncurated Unlabeled Data [70.25049762295193]
本稿では,トレーニング中にノイズラベル付きおよび未処理データを受け入れる条件付き画像生成フレームワークを提案する。
本稿では,ラベルのないデータに新たなラベルを割り当てながら,逆行訓練にインスタンスワイドを割り当てるソフトカリキュラム学習を提案する。
実験により,本手法は,定量および定性性能の両面において,既存の半教師付き・ラベル付きロバストな手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-17T08:31:59Z) - Losses over Labels: Weakly Supervised Learning via Direct Loss
Construction [71.11337906077483]
プログラム可能な弱い監視は、機械学習のパラダイムとして成長している。
ラベルの中間ステップを経由することなく,直接損失を発生させるため,ラベルのロバスト・オーバー・ラベル(Losses over Labels, LoL)を提案する。
いくつかのベンチマークテキストおよび画像分類タスクにおいて、LoLは既存の弱い監督手法を改善していることを示す。
論文 参考訳(メタデータ) (2022-12-13T22:29:14Z) - Learned Label Aggregation for Weak Supervision [8.819582879892762]
本稿では,ラベル付きデータを容易に生成するために,弱い監視信号を集約するデータプログラミング手法を提案する。
生成したラベルの質は、すべてのLFからノイズの多いラベルを集約し、基底真実のラベルを推測するラベル集約モデルに依存する。
合成されたデータを用いてモデルをトレーニングし、モデルに効果的なアーキテクチャを設計できることを示す。
論文 参考訳(メタデータ) (2022-07-27T14:36:35Z) - Label Noise-Resistant Mean Teaching for Weakly Supervised Fake News
Detection [93.6222609806278]
本稿では,弱い教師付き偽ニュース検出のためのラベル雑音耐性平均教育手法 (LNMT) を提案する。
LNMTは、未ラベルのニュースとユーザのフィードバックコメントを活用して、トレーニングデータの量を増やす。
LNMTはラベル伝搬とラベル信頼性推定を備えた平均教師フレームワークを確立する。
論文 参考訳(メタデータ) (2022-06-10T16:01:58Z) - Training Subset Selection for Weak Supervision [17.03788288165262]
弱いラベル付きデータの量と弱いラベルの精度とのトレードオフを示す。
我々は、事前訓練されたデータ表現とカット統計を組み合わせ、弱いラベル付きトレーニングデータの高品質なサブセットを選択する。
弱ラベルの少ないデータを使用することで、ベンチマークタスクにおいて、弱い監視パイプラインの精度が最大19%向上する。
論文 参考訳(メタデータ) (2022-06-06T21:31:32Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - Dash: Semi-Supervised Learning with Dynamic Thresholding [72.74339790209531]
我々は、ラベルのない例を使ってモデルをトレーニングする半教師付き学習(SSL)アプローチを提案する。
提案手法であるDashは、ラベルなしデータ選択の観点から適応性を享受する。
論文 参考訳(メタデータ) (2021-09-01T23:52:29Z) - Boosting Semi-Supervised Face Recognition with Noise Robustness [54.342992887966616]
本稿では,自動ラベルによるラベル雑音に対して頑健な半教師付き顔認識に対する効果的な解法を提案する。
そこで我々は,gnが強化するロバストな学習能力に基づく,ノイズロバスト学習ラベリング(nroll)という,半教師付き顔認識ソリューションを開発した。
論文 参考訳(メタデータ) (2021-05-10T14:43:11Z) - Meta-Learning for Neural Relation Classification with Distant
Supervision [38.755055486296435]
本稿では,参照データの指導の下で,雑音の多い学習データを重み付けするメタラーニング手法を提案する。
いくつかのデータセットの実験では、参照データがトレーニングデータの選択を効果的にガイドできることが示されている。
論文 参考訳(メタデータ) (2020-10-26T12:52:28Z) - Constrained Labeling for Weakly Supervised Learning [15.365232702938677]
本稿では、弱い監視信号を組み合わせるための単純なデータフリーアプローチを提案する。
我々の手法は効率よく安定しており、数回の降下を繰り返して収束する。
本手法は,様々なテキスト・画像分類タスクにおいて,他の弱い監督手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-15T21:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。