論文の概要: Creating Training Sets via Weak Indirect Supervision
- arxiv url: http://arxiv.org/abs/2110.03484v1
- Date: Thu, 7 Oct 2021 14:09:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 15:53:18.180146
- Title: Creating Training Sets via Weak Indirect Supervision
- Title(参考訳): 弱間接監督によるトレーニングセットの作成
- Authors: Jieyu Zhang, Bohan Wang, Xiangchen Song, Yujing Wang, Yaming Yang,
Jing Bai, Alexander Ratner
- Abstract要約: Weak Supervision (WS)フレームワークは、複数の潜在的にノイズの多い監督ソースからトレーニングラベルを合成する。
Weak Indirect Supervision (WIS) は、トレーニングラベルの自動合成のための新しい研究課題である。
我々は,ユーザが提供するラベル関係を利用して間接的な監督源をモデル化し活用する確率論的モデリング手法PLRMを開発した。
- 参考スコア(独自算出の注目度): 66.77795318313372
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Creating labeled training sets has become one of the major roadblocks in
machine learning. To address this, recent Weak Supervision (WS) frameworks
synthesize training labels from multiple potentially noisy supervision sources.
However, existing frameworks are restricted to supervision sources that share
the same output space as the target task. To extend the scope of usable
sources, we formulate Weak Indirect Supervision (WIS), a new research problem
for automatically synthesizing training labels based on indirect supervision
sources that have different output label spaces. To overcome the challenge of
mismatched output spaces, we develop a probabilistic modeling approach, PLRM,
which uses user-provided label relations to model and leverage indirect
supervision sources. Moreover, we provide a theoretically-principled test of
the distinguishability of PLRM for unseen labels, along with an generalization
bound. On both image and text classification tasks as well as an industrial
advertising application, we demonstrate the advantages of PLRM by outperforming
baselines by a margin of 2%-9%.
- Abstract(参考訳): ラベル付きトレーニングセットの作成は、機械学習における主要な障害のひとつになっている。
これを解決するために、最近のWeak Supervision (WS)フレームワークは、潜在的にノイズの多い複数の監督ソースからトレーニングラベルを合成する。
しかし、既存のフレームワークは、ターゲットタスクと同じ出力スペースを共有する監督ソースに制限されている。
利用可能なソースの範囲を拡張するために、異なる出力ラベル空間を持つ間接監督ソースに基づいてトレーニングラベルを自動的に合成する新しい研究課題である弱い間接監督(wis)を定式化する。
ミスマッチアウトプット空間の課題を克服するために,ユーザが提供するラベル関係を用いて間接的監督源をモデル化し活用する確率的モデリング手法plrmを開発した。
さらに,未発見ラベルに対するplrmの識別性を,一般化境界とともに理論的に原理的に検証する。
画像分類タスクとテキスト分類タスクと産業広告アプリケーションの両方において,ベースラインを2%-9%のマージンで上回り,PLRMの利点を実証した。
関連論文リスト
- Class-aware and Augmentation-free Contrastive Learning from Label Proportion [19.41511190742059]
Label Proportion(LLP)からの学習(Learning from Label Proportion)は、トレーニングデータを事前定義されたインスタンスのバッグに整理する、弱教師付き学習シナリオである。
本稿では,インスタンスレベルでのクラス認識管理を導入した拡張フリーコントラストフレームワークTabLLP-BDCを提案する。
我々のソリューションは、2段階のBag Different Contrastive(BDC)学習機構を備えており、堅牢なクラス認識インスタンスレベルの監視を確立する。
論文 参考訳(メタデータ) (2024-08-13T09:04:47Z) - AutoWS: Automated Weak Supervision Framework for Text Classification [1.748907524043535]
本稿では、ドメインエキスパートへの依存を減らしつつ、弱い監督プロセスの効率を高めるための新しい枠組みを提案する。
本手法では,ラベルクラス毎にラベル付きサンプルの小さなセットが必要であり,多数のラベル付きデータにノイズ付きラベルを割り当てるラベル付き関数のセットを自動生成する。
論文 参考訳(メタデータ) (2023-02-07T07:12:05Z) - A Weakly Supervised Learning Framework for Salient Object Detection via
Hybrid Labels [96.56299163691979]
本稿では,ハイブリッドラベル下でのSODタスクに焦点をあてる。
このタスクにおけるラベルノイズと量不均衡の問題に対処するため、我々は3つの洗練されたトレーニング戦略を持つ新しいパイプラインフレームワークを設計する。
5つのSODベンチマーク実験により,本手法は弱教師付き/非教師付き手法と競合する性能を示した。
論文 参考訳(メタデータ) (2022-09-07T06:45:39Z) - Binary Classification with Positive Labeling Sources [71.37692084951355]
WEAPOは、負のラベル付け源を使わずにトレーニングラベルを作成するための、シンプルで競争力のあるWS手法である。
We show WEAPO achieve the highest averaged performance on 10 benchmark datasets。
論文 参考訳(メタデータ) (2022-08-02T19:32:08Z) - Balancing Discriminability and Transferability for Source-Free Domain
Adaptation [55.143687986324935]
従来のドメイン適応(DA)技術は、ドメイン不変表現を学習することでドメイン転送性を改善することを目的としている。
ラベル付けされたソースとラベル付けされていないターゲットへの同時アクセス要件は、ソースフリーなDA設定に適さない。
そこで本研究では,原文と翻訳サンプルの混在が識別可能性と伝達可能性のトレードオフを促進することを示す新しい知見を導出する。
論文 参考訳(メタデータ) (2022-06-16T09:06:22Z) - Self-supervised learning for joint SAR and multispectral land cover
classification [38.8529535887097]
マルチチャネルモデルの自己教師型トレーニングのためのフレームワークと特定のタスクを提案する。
提案手法は,土地被覆分類のラベルと相関する特徴の学習に有効であることを示す。
論文 参考訳(メタデータ) (2021-08-20T09:02:07Z) - MatchGAN: A Self-Supervised Semi-Supervised Conditional Generative
Adversarial Network [51.84251358009803]
本稿では,条件付き生成逆数ネットワーク(GAN)に対する,半教師付き環境下での自己教師型学習手法を提案する。
利用可能な数少ないラベル付きサンプルのラベル空間から無作為なラベルをサンプリングして拡張を行う。
本手法は,ベースラインのトレーニングに使用したラベル付きサンプルの20%に過ぎません。
論文 参考訳(メタデータ) (2020-06-11T17:14:55Z) - Universal Source-Free Domain Adaptation [57.37520645827318]
ドメイン適応のための新しい2段階学習プロセスを提案する。
Procurementの段階では、今後のカテゴリギャップやドメインシフトに関する事前知識を前提とせず、将来的なソースフリーデプロイメントのためのモデルの提供を目標としています。
Deploymentの段階では、幅広いカテゴリギャップをまたいで動作可能な統一適応アルゴリズムを設計することを目的としている。
論文 参考訳(メタデータ) (2020-04-09T07:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。