論文の概要: One-Round Active Learning
- arxiv url: http://arxiv.org/abs/2104.11843v1
- Date: Fri, 23 Apr 2021 23:59:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-29 05:06:56.819569
- Title: One-Round Active Learning
- Title(参考訳): ワンラウンドアクティブラーニング
- Authors: Tianhao Wang, Si Chen, Ruoxi Jia
- Abstract要約: 1ラウンドのアクティブラーニングは、ラベル付け後の最高のユーティリティを達成するラベル付きデータポイントのサブセットを選択することを目的としている。
データユーティリティ関数の概念に基づく一括能動学習のための汎用フレームワークであるDULOを提案する。
以上の結果から,既存のアクティブな学習手法が複数ラウンドで成功する一方で,DULOは1ラウンドで常に優れた性能を発揮することが示された。
- 参考スコア(独自算出の注目度): 13.25385227263705
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Active learning has been a main solution for reducing data labeling costs.
However, existing active learning strategies assume that a data owner can
interact with annotators in an online, timely manner, which is usually
impractical. Even with such interactive annotators, for existing active
learning strategies to be effective, they often require many rounds of
interactions between the data owner and annotators, which is often
time-consuming. In this work, we initiate the study of one-round active
learning, which aims to select a subset of unlabeled data points that achieve
the highest utility after being labeled with only the information from
initially labeled data points. We propose DULO, a general framework for
one-round active learning based on the notion of data utility functions, which
map a set of data points to some performance measure of the model trained on
the set. We formulate the one-round active learning problem as data utility
function maximization. We further propose strategies to make the estimation and
optimization of data utility functions scalable to large models and large
unlabeled data sets. Our results demonstrate that while existing active
learning approaches could succeed with multiple rounds, DULO consistently
performs better in the one-round setting.
- Abstract(参考訳): アクティブラーニングは、データラベリングコストを削減するための主要なソリューションです。
しかし、既存のアクティブな学習戦略では、データ所有者がオンラインのタイムリーな方法でアノテータと対話できると仮定している。
このようなインタラクティブなアノテータであっても、既存のアクティブな学習戦略が効果的であるためには、多くの場合、データオーナとアノテータの間の多くの相互作用を必要とします。
本研究では,ラベル付きデータポイントから情報のみをラベル付けした上で,最も有効性の高いラベル付きデータポイントのサブセットを選択することを目的とした,1ラウンドアクティブラーニングの研究を開始する。
本研究では,データ・ユーティリティ・関数の概念に基づく1ラウンドアクティブ・ラーニングのための汎用フレームワークであるduloを提案する。
1ラウンドアクティブラーニング問題をデータユーティリティ関数最大化として定式化する。
さらに,大規模モデルや大規模未ラベルデータセットにスケーラブルなデータユーティリティ関数の推定と最適化を行う戦略を提案する。
以上の結果から,既存のアクティブな学習手法が複数ラウンドで成功する一方で,DULOは1ラウンドで常に優れた性能を発揮することが示された。
関連論文リスト
- LLM-assisted Explicit and Implicit Multi-interest Learning Framework for Sequential Recommendation [50.98046887582194]
本研究では,ユーザの興味を2つのレベル – 行動と意味論 – でモデル化する,明示的で暗黙的な多目的学習フレームワークを提案する。
提案するEIMFフレームワークは,小型モデルとLLMを効果的に組み合わせ,多目的モデリングの精度を向上させる。
論文 参考訳(メタデータ) (2024-11-14T13:00:23Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - Zero-shot Active Learning Using Self Supervised Learning [11.28415437676582]
我々は,反復的なプロセスを必要としないモデル非依存の新たなアクティブラーニング手法を提案する。
アクティブラーニングの課題に自己指導型学習機能を活用することを目的としている。
論文 参考訳(メタデータ) (2024-01-03T11:49:07Z) - Learning to Rank for Active Learning via Multi-Task Bilevel Optimization [29.207101107965563]
データ取得のための学習代理モデルを用いて、ラベルのないインスタンスのバッチを選択することを目的とした、アクティブな学習のための新しいアプローチを提案する。
このアプローチにおける重要な課題は、ユーティリティ関数の入力の一部を構成するデータの歴史が時間とともに増大するにつれて、よく一般化する取得関数を開発することである。
論文 参考訳(メタデータ) (2023-10-25T22:50:09Z) - Active learning for data streams: a survey [0.48951183832371004]
オンラインアクティブな学習は機械学習のパラダイムであり、データストリームからラベルに最も情報のあるデータポイントを選択することを目的としている。
それぞれの観測に注釈をつけるのは時間と費用がかかり、大量のラベル付きデータを得るのが難しくなる。
本研究の目的は、データストリームから最も情報性の高い観測をリアルタイムで選択するための、最近提案されたアプローチの概要を提供することである。
論文 参考訳(メタデータ) (2023-02-17T14:24:13Z) - Responsible Active Learning via Human-in-the-loop Peer Study [88.01358655203441]
我々は,データプライバシを同時に保持し,モデルの安定性を向上させるために,Pear Study Learning (PSL) と呼ばれる責任あるアクティブラーニング手法を提案する。
まず,クラウドサイドのタスク学習者(教師)から未学習データを分離する。
トレーニング中、タスク学習者は軽量なアクティブ学習者に指示し、アクティブサンプリング基準に対するフィードバックを提供する。
論文 参考訳(メタデータ) (2022-11-24T13:18:27Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。
アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。
また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:11:55Z) - Active metric learning and classification using similarity queries [21.589707834542338]
本稿では、キーコンポーネントが類似性を反映したデータの表現を学習している問題に対して、新しい統合クエリフレームワークを適用することができることを示す。
提案手法の有効性を,アクティブなメトリック学習とアクティブな分類という2つの課題で実証する。
論文 参考訳(メタデータ) (2022-02-04T03:34:29Z) - Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。
このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文 参考訳(メタデータ) (2021-10-24T22:33:52Z) - Data Shapley Valuation for Efficient Batch Active Learning [21.76249748709411]
Active Data Shapley(ADS)は、バッチアクティブラーニングのためのフィルタリングレイヤーです。
ADSは、ラベルのないデータのプールが現実世界の異常を示す場合に特に効果的であることを示す。
論文 参考訳(メタデータ) (2021-04-16T18:53:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。