論文の概要: Reinforced Meta Active Learning
- arxiv url: http://arxiv.org/abs/2203.04573v1
- Date: Wed, 9 Mar 2022 08:36:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 03:51:15.433216
- Title: Reinforced Meta Active Learning
- Title(参考訳): 強化型メタアクティブラーニング
- Authors: Michael Katz, Eli Kravchik
- Abstract要約: 本稿では,データから直接情報提供度を学習する,オンラインストリームに基づくメタアクティブ学習手法を提案する。
本手法は、強化学習に基づいて、エピソードポリシー検索と文脈的バンディットアプローチを組み合わせたものである。
本研究では,本手法が既存の最先端手法よりも効率的にトレーニングサンプルを選択できることを実データで示す。
- 参考スコア(独自算出の注目度): 11.913086438671357
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In stream-based active learning, the learning procedure typically has access
to a stream of unlabeled data instances and must decide for each instance
whether to label it and use it for training or to discard it. There are
numerous active learning strategies which try to minimize the number of labeled
samples required for training in this setting by identifying and retaining the
most informative data samples. Most of these schemes are rule-based and rely on
the notion of uncertainty, which captures how small the distance of a data
sample is from the classifier's decision boundary. Recently, there have been
some attempts to learn optimal selection strategies directly from the data, but
many of them are still lacking generality for several reasons: 1) They focus on
specific classification setups, 2) They rely on rule-based metrics, 3) They
require offline pre-training of the active learner on related tasks. In this
work we address the above limitations and present an online stream-based meta
active learning method which learns on the fly an informativeness measure
directly from the data, and is applicable to a general class of classification
problems without any need for pretraining of the active learner on related
tasks. The method is based on reinforcement learning and combines episodic
policy search and a contextual bandits approach which are used to train the
active learner in conjunction with training of the model. We demonstrate on
several real datasets that this method learns to select training samples more
efficiently than existing state-of-the-art methods.
- Abstract(参考訳): ストリームベースのアクティブラーニングでは、学習手順は通常、ラベルのないデータインスタンスのストリームにアクセスでき、各インスタンスがラベル付けしてトレーニングに使用するか、あるいは破棄するかを決定する必要があります。
この設定でトレーニングに必要なラベル付きサンプルの数を最小限に抑えるために、最も有益なデータサンプルを識別し保持する、活発な学習戦略が数多く存在する。
これらのスキームの多くはルールベースであり、不確実性の概念に依存しており、データサンプルがどれだけ小さいかが分類器の判断境界から決定される。
近年、データから直接最適な選択戦略を学習する試みがいくつかあるが、それらの多くは、いくつかの理由から、まだ一般的性に欠けている。
1)特定の分類設定に焦点を当てる。
2) ルールベースのメトリクスに依存しています。
3) 関連タスクにおいて, アクティブ学習者のオフライン事前学習が必要である。
本研究では,これらの制約に対処し,データから直接情報伝達度を学習するオンラインストリームベースのメタアクティブ学習手法を提案し,関連するタスクにおいてアクティブ学習者の事前学習を必要とせずに,一般的な分類問題に適用できる。
本手法は, 強化学習に基づいて, エピソジックなポリシー探索と, モデル学習と協調して, アクティブ学習者の訓練に使用される文脈的包括的アプローチを組み合わせる。
本手法が既存の最先端手法よりも効率的にトレーニングサンプルを選択できることを実データで示す。
関連論文リスト
- DST-Det: Simple Dynamic Self-Training for Open-Vocabulary Object Detection [72.25697820290502]
この研究は、ゼロショット分類によって潜在的に新しいクラスを特定するための単純かつ効率的な戦略を導入する。
このアプローチは、アノテーションやデータセット、再学習を必要とせずに、新しいクラスのリコールと精度を高めるセルフトレーニング戦略として言及する。
LVIS、V3Det、COCOを含む3つのデータセットに対する実証的な評価は、ベースラインのパフォーマンスを大幅に改善したことを示している。
論文 参考訳(メタデータ) (2023-10-02T17:52:24Z) - Deep Active Learning with Contrastive Learning Under Realistic Data Pool
Assumptions [2.578242050187029]
アクティブラーニングは、モデルが望まれる精度を迅速に到達できるようにする、ラベルのないデータプールから最も情報性の高いデータを特定することを目的としている。
既存のアクティブラーニング手法の多くは、未ラベルのデータプールに対象タスクに関連するサンプルのみが存在する理想的な環境で評価されている。
我々は,不明瞭でタスク非関連なアウト・オブ・ディストリビューションと,イン・ディストリビューション・サンプルを含む,新しいアクティブ・ラーニング・ベンチマークを導入する。
論文 参考訳(メタデータ) (2023-03-25T10:46:10Z) - Responsible Active Learning via Human-in-the-loop Peer Study [88.01358655203441]
我々は,データプライバシを同時に保持し,モデルの安定性を向上させるために,Pear Study Learning (PSL) と呼ばれる責任あるアクティブラーニング手法を提案する。
まず,クラウドサイドのタスク学習者(教師)から未学習データを分離する。
トレーニング中、タスク学習者は軽量なアクティブ学習者に指示し、アクティブサンプリング基準に対するフィードバックを提供する。
論文 参考訳(メタデータ) (2022-11-24T13:18:27Z) - An Embarrassingly Simple Approach to Semi-Supervised Few-Shot Learning [58.59343434538218]
間接学習の観点から、ラベルなしデータの正負の擬似ラベルを正確に予測するための、単純だが非常に効果的な手法を提案する。
私たちのアプローチは、オフザシェルフ操作のみを使用することで、ほんの数行のコードで実装できます。
論文 参考訳(メタデータ) (2022-09-28T02:11:34Z) - Active Self-Training for Weakly Supervised 3D Scene Semantic
Segmentation [17.27850877649498]
本稿では,自己学習と能動的学習を組み合わせた3次元シーンの弱教師付きセグメンテーション手法を提案する。
提案手法は,従来の作業やベースラインよりもシーンセグメンテーションを改善する効果的な手法であることを示す。
論文 参考訳(メタデータ) (2022-09-15T06:00:25Z) - Towards General and Efficient Active Learning [20.888364610175987]
アクティブラーニングは、限られたアノテーション予算を利用するために最も有益なサンプルを選択することを目的としている。
本稿では,新しい汎用能動学習法(GEAL)を提案する。
提案手法は,同一モデルの単一パス推定を用いて,異なるデータセット上でデータ選択処理を行うことができる。
論文 参考訳(メタデータ) (2021-12-15T08:35:28Z) - Knowledge-driven Active Learning [70.37119719069499]
アクティブな学習戦略は、ディープラーニングモデルをトレーニングするために必要なラベル付きデータの量を最小限にすることを目的としている。
ほとんどの積極的な戦略は不確実なサンプルの選択に基づいており、しばしば決定境界に近いサンプルに制限される。
本稿では、一般的なドメイン知識を考慮し、エキスパートでないユーザがより少ないサンプルでモデルを訓練できるようにする。
論文 参考訳(メタデータ) (2021-10-15T06:11:53Z) - Semi-supervised Batch Active Learning via Bilevel Optimization [89.37476066973336]
両レベル最適化によるデータ要約問題として,本手法を定式化する。
本手法は,ラベル付きサンプルがほとんど存在しない場合,レジーム内のキーワード検出タスクにおいて極めて有効であることを示す。
論文 参考訳(メタデータ) (2020-10-19T16:53:24Z) - Learning to Rank for Active Learning: A Listwise Approach [36.72443179449176]
アクティブラーニングは、大量のデータを空腹のアプリケーションにラベル付けする作業を緩和する代替手段として登場した。
本研究では,単純なリストワイズ手法を用いて,損失予測モジュールの構造を再考する。
4つのデータセットに対する実験結果から,本手法は画像分類と回帰処理の両方において,最近の最先端の能動的学習手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-07-31T21:05:16Z) - Meta-Reinforcement Learning Robust to Distributional Shift via Model
Identification and Experience Relabeling [126.69933134648541]
本稿では,テスト時にアウト・オブ・ディストリビューション・タスクに直面した場合に,効率よく外挿できるメタ強化学習アルゴリズムを提案する。
我々の手法は単純な洞察に基づいており、動的モデルが非政治データに効率的かつ一貫して適応可能であることを認識している。
論文 参考訳(メタデータ) (2020-06-12T13:34:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。