論文の概要: Interactive Weak Supervision: Learning Useful Heuristics for Data
Labeling
- arxiv url: http://arxiv.org/abs/2012.06046v2
- Date: Mon, 25 Jan 2021 20:03:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-14 13:41:00.719114
- Title: Interactive Weak Supervision: Learning Useful Heuristics for Data
Labeling
- Title(参考訳): Interactive Weak Supervision: データラベリングに有用なヒューリスティックを学ぶ
- Authors: Benedikt Boecking, Willie Neiswanger, Eric Xing, Artur Dubrawski
- Abstract要約: 弱監督は、基礎的な真理ラベルなしでラベル付きデータセットを作成するための有望な代替手段を提供する。
本稿では,対話型弱監督のための最初のフレームワークを開発し,その手法が反復を提案し,ユーザフィードバックから学習する。
私たちの実験は、非常に競争力のあるテストセット性能を達成するモデルのトレーニングに少数のフィードバックが必要であることを示しています。
- 参考スコア(独自算出の注目度): 19.24454872492008
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Obtaining large annotated datasets is critical for training successful
machine learning models and it is often a bottleneck in practice. Weak
supervision offers a promising alternative for producing labeled datasets
without ground truth annotations by generating probabilistic labels using
multiple noisy heuristics. This process can scale to large datasets and has
demonstrated state of the art performance in diverse domains such as healthcare
and e-commerce. One practical issue with learning from user-generated
heuristics is that their creation requires creativity, foresight, and domain
expertise from those who hand-craft them, a process which can be tedious and
subjective. We develop the first framework for interactive weak supervision in
which a method proposes heuristics and learns from user feedback given on each
proposed heuristic. Our experiments demonstrate that only a small number of
feedback iterations are needed to train models that achieve highly competitive
test set performance without access to ground truth training labels. We conduct
user studies, which show that users are able to effectively provide feedback on
heuristics and that test set results track the performance of simulated
oracles.
- Abstract(参考訳): 大きなアノテートされたデータセットを持つことは、成功した機械学習モデルのトレーニングに不可欠である。
弱監督は、複数のノイズのあるヒューリスティックを使って確率的ラベルを生成することで、真実のアノテーションを使わずにラベル付きデータセットを作成するための有望な代替手段を提供する。
このプロセスは大規模なデータセットにスケール可能で、医療やeコマースといったさまざまな領域におけるアートパフォーマンスの状況を示している。
ユーザの生成したヒューリスティックスから学ぶことの現実的な問題は、創造性、先見性、ドメインの専門知識が、それらを手作りする人たちから必要となることだ。
本稿では,提案手法がヒューリスティックスを提案し,提案する各ヒューリスティックに対するユーザフィードバックから学習する,対話型弱い監督のための最初のフレームワークを開発した。
実験の結果,真理学習ラベルにアクセスすることなく,高い競争力を持つテストセットのパフォーマンスを達成できるモデルをトレーニングするには,少数のフィードバックイテレーションが必要なことがわかった。
我々は,ヒューリスティックスに対するフィードバックを効果的に提供できるユーザスタディを行い,テストセットの結果が模擬オラクルの性能を追跡することを示す。
関連論文リスト
- Multimodal Information Bottleneck for Deep Reinforcement Learning with Multiple Sensors [10.454194186065195]
強化学習はロボット制御タスクにおいて有望な成果を上げてきたが、情報の有効活用に苦慮している。
最近の研究は、複数の感覚入力から関節表現を抽出するために、再構成や相互情報に基づく補助的損失を構築している。
生のマルチモーダル観測について,学習した共同表現で情報を圧縮することが有用である。
論文 参考訳(メタデータ) (2024-10-23T04:32:37Z) - An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models [55.01592097059969]
命令データセットの監視された微調整は、目覚ましいゼロショットの一般化能力を達成する上で重要な役割を担っている。
アクティブラーニングは、未ラベルのプールからアノテートするサンプルの有用なサブセットを特定するのに効果的である。
本研究では,能動学習の計算ボトルネックを回避するための実験設計を提案する。
論文 参考訳(メタデータ) (2024-01-12T16:56:54Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - The Trade-off between Universality and Label Efficiency of
Representations from Contrastive Learning [32.15608637930748]
2つのデシダラタの間にはトレードオフがあることを示し、同時に両方を達成できない可能性があることを示す。
我々は、理論データモデルを用いて分析を行い、より多様な事前学習データにより、異なるタスクに対してより多様な機能が得られる一方で、タスク固有の機能に重点を置いていないことを示す。
論文 参考訳(メタデータ) (2023-02-28T22:14:33Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - TRAIL: Near-Optimal Imitation Learning with Suboptimal Data [100.83688818427915]
オフラインデータセットを使用してファクタードトランジションモデルを学習するトレーニング目標を提案する。
我々の理論的分析は、学習された潜在行動空間が下流模倣学習のサンプル効率を高めることを示唆している。
実際に潜伏行動空間を学習するために、エネルギーベースの遷移モデルを学ぶアルゴリズムTRAIL(Transition-Reparametrized Actions for Imitation Learning)を提案する。
論文 参考訳(メタデータ) (2021-10-27T21:05:00Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Self-Supervised Contrastive Learning for Efficient User Satisfaction
Prediction in Conversational Agents [35.2098736872247]
ユーザとエージェントのインタラクションを学習するための,自己指導型コントラスト学習手法を提案する。
自己教師対象を用いた事前学習モデルは,ユーザ満足度予測に転送可能であることを示す。
また、非常に小さなサンプルサイズに対して、より優れた転送性を確保するために、新しい数発の転送学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-21T18:10:58Z) - Sense and Learn: Self-Supervision for Omnipresent Sensors [9.442811508809994]
我々は、生の知覚データから表現や特徴学習のためのSense and Learnというフレームワークを提案する。
これは、面倒なラベル付けプロセスに人間が関与することなく、注釈のないデータから、高レベルで広範囲に有用な特徴を学習できる補助的なタスクで構成されている。
提案手法は、教師付きアプローチと競合する結果を達成し、ネットワークを微調整し、ほとんどの場合、下流タスクを学習することでギャップを埋める。
論文 参考訳(メタデータ) (2020-09-28T11:57:43Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。