論文の概要: Binary Classification with Positive Labeling Sources
- arxiv url: http://arxiv.org/abs/2208.01704v1
- Date: Tue, 2 Aug 2022 19:32:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-04 14:01:41.229436
- Title: Binary Classification with Positive Labeling Sources
- Title(参考訳): 正のラベリング源を用いたバイナリ分類
- Authors: Jieyu Zhang, Yujing Wang, Yaming Yang, Yang Luo, Alexander Ratner
- Abstract要約: WEAPOは、負のラベル付け源を使わずにトレーニングラベルを作成するための、シンプルで競争力のあるWS手法である。
We show WEAPO achieve the highest averaged performance on 10 benchmark datasets。
- 参考スコア(独自算出の注目度): 71.37692084951355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To create a large amount of training labels for machine learning models
effectively and efficiently, researchers have turned to Weak Supervision (WS),
which uses programmatic labeling sources rather than manual annotation.
Existing works of WS for binary classification typically assume the presence of
labeling sources that are able to assign both positive and negative labels to
data in roughly balanced proportions. However, for many tasks of interest where
there is a minority positive class, negative examples could be too diverse for
developers to generate indicative labeling sources. Thus, in this work, we
study the application of WS on binary classification tasks with positive
labeling sources only. We propose WEAPO, a simple yet competitive WS method for
producing training labels without negative labeling sources. On 10 benchmark
datasets, we show WEAPO achieves the highest averaged performance in terms of
both the quality of synthesized labels and the performance of the final
classifier supervised with these labels. We incorporated the implementation of
\method into WRENCH, an existing benchmarking platform.
- Abstract(参考訳): 機械学習モデルのための大量のトレーニングラベルを効果的に効率的に作成するために、研究者は手動のアノテーションではなくプログラムによるラベル付けソースを使用するWeak Supervision(WS)に切り替えた。
バイナリ分類のための既存のWSの作業は、概してバランスの取れた割合で、正と負のラベルの両方をデータに割り当てることができるラベル付けソースの存在を前提としています。
しかし、少数な肯定的なクラスが存在する多くのタスクにおいて、負の例は開発者が指示的なラベリングソースを生成するには多様すぎる可能性がある。
そこで本研究では、正のラベリングソースのみを用いた二項分類タスクにおけるWSの適用について検討する。
WEAPOは、負のラベル付け源を使わずにトレーニングラベルを作成するための、シンプルで競争力のあるWS手法である。
10個のベンチマークデータセットにおいて,合成ラベルの品質とそれらのラベルを監督する最終分類器の性能の両方において,weapoが最高平均性能を達成していることを示す。
我々は、既存のベンチマークプラットフォームであるwrenchに \methodの実装を組み込んだ。
関連論文リスト
- Co-training for Low Resource Scientific Natural Language Inference [65.37685198688538]
遠隔教師付きラベルに分類器のトレーニング力学に基づいて重みを割り当てる新しいコトレーニング手法を提案する。
予測された信頼度に対する任意のしきい値に基づいてサンプルをフィルタリングするのではなく、重要重みを割り当てることにより、自動ラベル付きデータの使用を最大化する。
提案手法は、遠隔監視ベースラインに対するマクロF1の1.5%の改善と、他の強力なSSLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-06-20T18:35:47Z) - Label Propagation for Zero-shot Classification with Vision-Language Models [17.50253820510074]
本稿では,ラベルなしデータの存在下でのゼロショット分類に挑戦する。
分類に測地距離を利用するラベル伝搬(LP)に基づくZLaPを導入する。
提案手法の有効性を14の共通データセットで評価し,ZLaPが最新の研究より優れていることを示す。
論文 参考訳(メタデータ) (2024-04-05T12:58:07Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - CLS: Cross Labeling Supervision for Semi-Supervised Learning [9.929229055862491]
Cross Labeling Supervision (CLS) は、典型的な擬似ラベル処理を一般化するフレームワークである。
CLSは擬似ラベルと相補ラベルの両方を作成でき、正と負の両方の学習をサポートする。
論文 参考訳(メタデータ) (2022-02-17T08:09:40Z) - WRENCH: A Comprehensive Benchmark for Weak Supervision [66.82046201714766]
ベンチマークは、分類とシーケンスタグ付けのための22の異なる実世界のデータセットで構成されている。
ベンチマークプラットフォームとしての有効性を示すために、100以上のメソッドの変種に対して広範な比較を行うためにベンチマークを使用します。
論文 参考訳(メタデータ) (2021-09-23T13:47:16Z) - Weakly Supervised Classification Using Group-Level Labels [12.285265254225166]
本稿では,グループレベルのバイナリラベルを,インスタンスレベルのバイナリ分類モデルの訓練に弱い監督力として利用する手法を提案する。
グループレベルのラベルを個別のインスタンスに対してクラス条件ノイズ(CCN)ラベルとしてモデル化し,強ラベル付きインスタンスでトレーニングされたモデルの予測を正規化するためにノイズラベルを使用する。
論文 参考訳(メタデータ) (2021-08-16T20:01:45Z) - Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced
Semi-Supervised Learning [80.05441565830726]
本稿では,疑似ラベルの重み付けがモデル性能に悪影響を及ぼすような,不均衡な半教師付き学習に対処する。
本稿では,この観測の動機となるバイアスに対処する,一般的な擬似ラベルフレームワークを提案する。
不均衡SSLのための新しい擬似ラベルフレームワークを、DASO(Distributed-Aware Semantics-Oriented Pseudo-label)と呼ぶ。
論文 参考訳(メタデータ) (2021-06-10T11:58:25Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - Boosting the Performance of Semi-Supervised Learning with Unsupervised
Clustering [10.033658645311188]
学習中の間欠的にラベルを完全に無視することは,小サンプル体制における性能を著しく向上させることを示す。
本手法は,最先端のSSLアルゴリズムの高速化に有効であることを示す。
論文 参考訳(メタデータ) (2020-12-01T14:19:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。