論文の概要: Active Learning from Crowd in Document Screening
- arxiv url: http://arxiv.org/abs/2012.02297v1
- Date: Wed, 11 Nov 2020 16:17:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 23:31:37.532238
- Title: Active Learning from Crowd in Document Screening
- Title(参考訳): 文書スクリーニングにおける群衆からのアクティブラーニング
- Authors: Evgeny Krivosheev, Burcu Sayin, Alessandro Bozzon, Zolt\'an Szl\'avik
- Abstract要約: 我々は、文書を評価し、それらを効率的にスクリーニングする機械学習分類器のセットの構築に注力する。
そこで本研究では,多ラベル能動学習スクリーニング技術である目的認識サンプリングを提案する。
目的認識サンプリングは,アートアクティブラーニングサンプリングの手法を著しく上回っていることを実証する。
- 参考スコア(独自算出の注目度): 76.9545252341746
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we explore how to efficiently combine crowdsourcing and
machine intelligence for the problem of document screening, where we need to
screen documents with a set of machine-learning filters. Specifically, we focus
on building a set of machine learning classifiers that evaluate documents, and
then screen them efficiently. It is a challenging task since the budget is
limited and there are countless number of ways to spend the given budget on the
problem. We propose a multi-label active learning screening specific sampling
technique -- objective-aware sampling -- for querying unlabelled documents for
annotating. Our algorithm takes a decision on which machine filter need more
training data and how to choose unlabeled items to annotate in order to
minimize the risk of overall classification errors rather than minimizing a
single filter error. We demonstrate that objective-aware sampling significantly
outperforms the state of the art active learning sampling strategies.
- Abstract(参考訳): 本稿では,クラウドソーシングとマシンインテリジェンスを効果的に組み合わせて文書のスクリーニングを行う方法を検討する。
具体的には、文書を評価する機械学習分類器のセットの構築に注力し、それらを効率的にスクリーニングする。
予算が限られており、与えられた予算を問題に費やすには数え切れないほど多くの方法があるため、これは困難なタスクです。
本稿では,ラベルなしの文書に注釈を付けて問合せを行うマルチラベルアクティブ・ラーニング・スクリーニング手法であるobjective-aware samplingを提案する。
提案手法では,1つのフィルタ誤差を最小化するのではなく,分類エラーのリスクを最小限に抑えるために,どのマシンフィルタがより多くのトレーニングデータを必要とするか,アノテートすべき未ラベル項目を選択するかを決定する。
目的認識サンプリングは,アートアクティブラーニングサンプリングの手法を著しく上回っていることを実証する。
関連論文リスト
- Combating Label Noise With A General Surrogate Model For Sample
Selection [84.61367781175984]
本稿では,視覚言語サロゲートモデルCLIPを用いて,雑音の多いサンプルを自動的にフィルタリングする手法を提案する。
提案手法の有効性を実世界および合成ノイズデータセットで検証した。
論文 参考訳(メタデータ) (2023-10-16T14:43:27Z) - Cold PAWS: Unsupervised class discovery and addressing the cold-start
problem for semi-supervised learning [0.30458514384586394]
本稿では, 自己教師付き学習, クラスタリング, 多様体学習技術に基づく新しい手法を提案する。
我々は、CIFAR10、Imagenette、DeepWeeds、EuroSATなどの公開データセットを使って、我々のアプローチをテストする。
文献における他の手法と比較して,より単純なアプローチで検討したデータセットに対して,優れた性能が得られる。
論文 参考訳(メタデータ) (2023-05-17T09:17:59Z) - ALBench: A Framework for Evaluating Active Learning in Object Detection [102.81795062493536]
本稿では、オブジェクト検出におけるアクティブラーニングを評価するために、ALBenchという名前のアクティブラーニングベンチマークフレームワークをコントリビュートする。
自動深層モデルトレーニングシステム上で開発されたこのALBenchフレームワークは、使いやすく、さまざまなアクティブな学習アルゴリズムと互換性があり、同じトレーニングおよびテストプロトコルを保証する。
論文 参考訳(メタデータ) (2022-07-27T07:46:23Z) - Active Multi-Task Representation Learning [50.13453053304159]
本研究は,アクティブラーニングの手法を活用することで,資源タスクのサンプリングに関する最初の公式な研究を行う。
提案手法は, 対象タスクに対する各ソースタスクの関連性を反復的に推定し, その関連性に基づいて各ソースタスクからサンプルを抽出するアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-02T08:23:24Z) - Using Self-Supervised Pretext Tasks for Active Learning [7.214674613451605]
本稿では,自己教師付きプレテキストタスクとユニークなデータサンプリング機能を利用して,困難かつ代表的なデータを選択する,新しいアクティブラーニング手法を提案する。
プレテキストタスク学習者は、未ラベルのセットでトレーニングされ、未ラベルのデータは、そのプレテキストタスクの損失によって、バッチにソートされ、グループ化される。
各イテレーションでは、メインタスクモデルを使用して、アノテートされるバッチで最も不確実なデータをサンプリングする。
論文 参考訳(メタデータ) (2022-01-19T07:58:06Z) - Budget-aware Few-shot Learning via Graph Convolutional Network [56.41899553037247]
本稿では,いくつかの例から新しい視覚概念を学習することを目的とした,数ショット学習の課題に取り組む。
数ショット分類における一般的な問題設定は、データラベルの取得においてランダムサンプリング戦略を前提としている。
そこで我々は,新しい対象カテゴリーの学習を目的とした,予算に配慮した数発の学習問題を新たに導入する。
論文 参考訳(メタデータ) (2022-01-07T02:46:35Z) - Adaptive Sample Selection for Robust Learning under Label Noise [1.71982924656402]
ディープニューラルネットワーク(DNN)は、ノイズの多いラベル付きデータの存在下で記憶や過度な適合の影響を受けることが示されている。
著名なアルゴリズムのクラスは、カリキュラム学習に動機づけられたサンプル選択戦略に依存している。
本稿では,バッチ統計のみに依存するデータ依存型適応型サンプル選択手法を提案する。
論文 参考訳(メタデータ) (2021-06-29T12:10:58Z) - Adaptive Task Sampling for Meta-Learning [79.61146834134459]
数ショットの分類のためのメタラーニングの鍵となるアイデアは、テスト時に直面した数ショットの状況を模倣することである。
一般化性能を向上させるための適応型タスクサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-07-17T03:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。