論文の概要: Cost-Based Budget Active Learning for Deep Learning
- arxiv url: http://arxiv.org/abs/2012.05196v1
- Date: Wed, 9 Dec 2020 17:42:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 06:14:15.497149
- Title: Cost-Based Budget Active Learning for Deep Learning
- Title(参考訳): ディープラーニングのためのコストベース予算アクティブラーニング
- Authors: Patrick K. Gikunda, Nicolas Jouandeau
- Abstract要約: 予算に制約のある集団における分類の不確実性やインスタンスの多様性を考慮したコストベースのバグデットアクティブラーニング(CBAL)を提案する。
min-maxに基づく原則的アプローチは、選択されたインスタンスのラベル付けと決定コストを最小化すると考えられる。
- 参考スコア(独自算出の注目度): 0.9732863739456035
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Majorly classical Active Learning (AL) approach usually uses statistical
theory such as entropy and margin to measure instance utility, however it fails
to capture the data distribution information contained in the unlabeled data.
This can eventually cause the classifier to select outlier instances to label.
Meanwhile, the loss associated with mislabeling an instance in a typical
classification task is much higher than the loss associated with the opposite
error. To address these challenges, we propose a Cost-Based Bugdet Active
Learning (CBAL) which considers the classification uncertainty as well as
instance diversity in a population constrained by a budget. A principled
approach based on the min-max is considered to minimize both the labeling and
decision cost of the selected instances, this ensures a near-optimal results
with significantly less computational effort. Extensive experimental results
show that the proposed approach outperforms several state-of -the-art active
learning approaches.
- Abstract(参考訳): 古典的アクティブラーニング(AL)のアプローチは、典型的にはエントロピーやマージンといった統計理論を使って例の効用を計測するが、ラベルのないデータに含まれるデータ分布情報の取得には失敗する。
これにより、最終的に分類器はラベル付けする外れ値のインスタンスを選択することができる。
一方、典型的な分類タスクにおけるインスタンスの誤ラベルに関連する損失は、反対のエラーに関連する損失よりもはるかに大きい。
これらの課題に対処するために、予算に制約された人口の分類の不確実性と事例多様性を考慮したコストベースバグデットアクティブラーニング(CBAL)を提案する。
min-maxに基づく原理的なアプローチは、選択されたインスタンスのラベル付けと決定コストの両方を最小化すると考えられており、計算労力を大幅に削減してほぼ最適である。
広範な実験結果から,提案手法は,最先端のアクティブラーニング手法よりも優れていることが示された。
関連論文リスト
- Improve Cost Efficiency of Active Learning over Noisy Dataset [1.3846014191157405]
本稿では,正のインスタンスの取得が負のインスタンスに比べて著しくコストがかかる二項分類の事例について考察する。
本研究では,典型的な不確実性サンプリングよりも広い範囲からサンプルをサンプリングする正規分布サンプリング関数を提案する。
我々のシミュレーションは,提案したサンプリング関数がノイズと正のラベル選択を制限し,20%から32%のコスト効率が異なるテストデータセットよりも向上したことを示している。
論文 参考訳(メタデータ) (2024-03-02T23:53:24Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - A Unified Approach to Count-Based Weakly-Supervised Learning [30.953260850416157]
弱いラベル付きデータから学習するための統一的なアプローチを開発する。
我々は、n 個の出力が真に設定されていることを正確に k 個の確率で計算する。
我々は3つの弱い教師付き学習パラダイムに対するアプローチを評価する。
論文 参考訳(メタデータ) (2023-11-22T22:23:34Z) - Active Learning in the Predict-then-Optimize Framework: A Margin-Based
Approach [5.371816551086118]
本研究では,ラベルのないデータストリームから特徴サンプルのラベルを要求するかどうかを逐次決定する学習手法を開発した。
我々の能動学習法は,予測パラメータによって引き起こされる決定誤差によって直接情報を得る最初の方法である。
論文 参考訳(メタデータ) (2023-05-11T05:44:36Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - MaxMatch: Semi-Supervised Learning with Worst-Case Consistency [149.03760479533855]
半教師付き学習(SSL)のための最悪ケース整合正則化手法を提案する。
本稿では,ラベル付きトレーニングデータとラベル付きトレーニングデータとを別々に比較した経験的損失項からなるSSLの一般化について述べる。
この境界によって動機づけられたSSLの目的は、元のラベルのないサンプルと、その複数の拡張版との最大の矛盾を最小限に抑えるものである。
論文 参考訳(メタデータ) (2022-09-26T12:04:49Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Toward Optimal Probabilistic Active Learning Using a Bayesian Approach [4.380488084997317]
アクティブラーニングは、コストの高いラベリングリソースを効率よく効果的に割り当てることで、ラベリングコストを削減することを目的としている。
提案したモデルにおける既存の選択戦略を再構築することにより、どの側面が現在の最先端に包含されていないかを説明することができる。
論文 参考訳(メタデータ) (2020-06-02T15:59:42Z) - Progressive Identification of True Labels for Partial-Label Learning [112.94467491335611]
部分ラベル学習(Partial-label Learning, PLL)は、典型的な弱教師付き学習問題であり、各トレーニングインスタンスには、真のラベルである候補ラベルのセットが設けられている。
既存のほとんどの手法は、特定の方法で解決しなければならない制約付き最適化として精巧に設計されており、計算複雑性をビッグデータにスケールアップするボトルネックにしている。
本稿では,モデルと最適化アルゴリズムの柔軟性を備えた分類器の新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T08:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。