論文の概要: Deep Active Learning with Budget Annotation
- arxiv url: http://arxiv.org/abs/2208.00508v1
- Date: Sun, 31 Jul 2022 20:20:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:11:54.599046
- Title: Deep Active Learning with Budget Annotation
- Title(参考訳): 予算アノテーションを用いた深層アクティブラーニング
- Authors: Kinyua Gikunda
- Abstract要約: 本稿では,インスタンスの不確実性と情報性の両方を計算するためのハイブリッドアプローチを提案する。
我々は、これらのモデルにすでに含まれている情報に対する問い合わせを避けるために、最先端の事前訓練モデルを採用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digital data collected over the decades and data currently being produced
with use of information technology is vastly the unlabeled data or data without
description. The unlabeled data is relatively easy to acquire but expensive to
label even with use of domain experts. Most of the recent works focus on use of
active learning with uncertainty metrics measure to address this problem.
Although most uncertainty selection strategies are very effective, they fail to
take informativeness of the unlabeled instances into account and are prone to
querying outliers. In order to address these challenges we propose an hybrid
approach of computing both the uncertainty and informativeness of an instance,
then automaticaly label the computed instances using budget annotator. To
reduce the annotation cost, we employ the state-of-the-art pre-trained models
in order to avoid querying information already contained in those models. Our
extensive experiments on different sets of datasets demonstrate the efficacy of
the proposed approach.
- Abstract(参考訳): 何十年にもわたって収集されたデジタルデータと、情報技術を使って現在作成されているデータは、説明のないラベルのないデータやデータである。
ラベルなしのデータは比較的簡単に取得できるが、ドメインの専門家を使ってもラベルを付けるのは費用がかかる。
最近の研究のほとんどは、この問題に対処するために不確実性メトリクス測度を用いたアクティブラーニングの利用に重点を置いている。
ほとんどの不確実性の選択戦略は非常に効果的であるが、ラベルのないインスタンスのインフォメーションを考慮に入れず、外れ値の問い合わせをしがちである。
これらの課題に対処するため、我々はインスタンスの不確実性と情報性の両方を計算し、計算されたインスタンスを予算アノテータを使って自動的にラベル付けするハイブリッドアプローチを提案する。
アノテーションのコストを削減するため,既存のモデルに含まれる情報に対する問い合わせを避けるために,最先端の事前訓練モデルを用いる。
様々なデータセットに関する広範な実験により,提案手法の有効性が示された。
関連論文リスト
- Improve Cost Efficiency of Active Learning over Noisy Dataset [1.3846014191157405]
本稿では,正のインスタンスの取得が負のインスタンスに比べて著しくコストがかかる二項分類の事例について考察する。
本研究では,典型的な不確実性サンプリングよりも広い範囲からサンプルをサンプリングする正規分布サンプリング関数を提案する。
我々のシミュレーションは,提案したサンプリング関数がノイズと正のラベル選択を制限し,20%から32%のコスト効率が異なるテストデータセットよりも向上したことを示している。
論文 参考訳(メタデータ) (2024-03-02T23:53:24Z) - Overcoming Overconfidence for Active Learning [1.2776312584227847]
本稿では,アクティブな学習シナリオで発生する過信の問題に対処する2つの新しい手法を提案する。
1つ目はCross-Mix-and-Mix(CMaM)と呼ばれる拡張戦略で、限られたトレーニング分布を拡張してモデルを校正することを目的としている。
2つ目は Ranked Margin Sampling (RankedMS) という選択戦略である。
論文 参考訳(メタデータ) (2023-08-21T09:04:54Z) - Soft Curriculum for Learning Conditional GANs with Noisy-Labeled and
Uncurated Unlabeled Data [70.25049762295193]
本稿では,トレーニング中にノイズラベル付きおよび未処理データを受け入れる条件付き画像生成フレームワークを提案する。
本稿では,ラベルのないデータに新たなラベルを割り当てながら,逆行訓練にインスタンスワイドを割り当てるソフトカリキュラム学習を提案する。
実験により,本手法は,定量および定性性能の両面において,既存の半教師付き・ラベル付きロバストな手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-17T08:31:59Z) - Are labels informative in semi-supervised learning? -- Estimating and
leveraging the missing-data mechanism [4.675583319625962]
半教師付き学習は、ラベルのないデータを利用して機械学習モデルを改善するための強力な技術である。
これは、あるクラスが他のクラスよりもラベル付けされる可能性が高い場合に発生する、情報的ラベルの存在に影響される可能性がある。
本稿では,データ不足のメカニズムを推定し,逆確率重み付けを用いてSSLアルゴリズムを劣化させることにより,この問題に対処する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-02-15T09:18:46Z) - An Embarrassingly Simple Approach to Semi-Supervised Few-Shot Learning [58.59343434538218]
間接学習の観点から、ラベルなしデータの正負の擬似ラベルを正確に予測するための、単純だが非常に効果的な手法を提案する。
私たちのアプローチは、オフザシェルフ操作のみを使用することで、ほんの数行のコードで実装できます。
論文 参考訳(メタデータ) (2022-09-28T02:11:34Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - GuidedMix-Net: Learning to Improve Pseudo Masks Using Labeled Images as
Reference [153.354332374204]
半教師付きセマンティックセマンティックセグメンテーションのための新しい手法である GuidedMix-Net を提案する。
まず、ラベル付きデータとラベルなしデータの間に特徴アライメントの目的を導入し、類似した画像対をキャプチャする。
MITransは、ラベルなしデータのさらなるプログレッシブな精細化のための強力な知識モジュールであることが示されている。
ラベル付きデータに対する教師付き学習とともに、ラベル付きデータの予測が生成した擬似マスクとともに学習される。
論文 参考訳(メタデータ) (2021-06-29T02:48:45Z) - Low-Regret Active learning [64.36270166907788]
トレーニングに最も有用なラベル付きデータポイントを識別するオンライン学習アルゴリズムを開発した。
私たちの仕事の中心は、予測可能な(簡単な)インスタンスの低い後悔を達成するために調整された睡眠専門家のための効率的なアルゴリズムです。
論文 参考訳(メタデータ) (2021-04-06T22:53:45Z) - Active Learning for Noisy Data Streams Using Weak and Strong Labelers [3.9370369973510746]
我々は、人間のラベリング能力に触発された、新しい弱くて強力なラベリング問題を考える。
そこで本研究では,フィルタリング,多様性の追加,情報的サンプル選択,ラベル抽出の4段階からなるオンライン能動学習アルゴリズムを提案する。
我々は,個々のサンプルの情報とモデル信頼度を組み合わせることで,情報ゲインを測定する決定関数を導出する。
論文 参考訳(メタデータ) (2020-10-27T09:18:35Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。