Fugu-MT 論文翻訳(概要): NTKCPL: Active Learning on Top of Self-Supervised Model by Estimating True Coverage

論文の概要: NTKCPL: Active Learning on Top of Self-Supervised Model by Estimating True Coverage

arxiv url: http://arxiv.org/abs/2306.04099v1
Date: Wed, 7 Jun 2023 01:43:47 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-08 16:39:32.725608
Title: NTKCPL: Active Learning on Top of Self-Supervised Model by Estimating True Coverage
Title（参考訳）: NTKCPL:真のカバレッジ推定による自己監督モデル上でのアクティブラーニング
Authors: Ziting Wen, Oscar Pizarro, Stefan Williams
Abstract要約: ニューラル・タンジェント・カーネル・クラスタリング・プシュード・ラベル(NTKCPL)の新しいアクティブ・ラーニング・ストラテジーを提案する。擬似ラベルとNTK近似を用いたモデル予測に基づいて経験的リスクを推定する。提案手法を5つのデータセット上で検証し,ほとんどの場合,ベースライン法よりも優れていることを示す。
参考スコア（独自算出の注目度）: 3.4806267677524896
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: High annotation cost for training machine learning classifiers has driven extensive research in active learning and self-supervised learning. Recent research has shown that in the context of supervised learning different active learning strategies need to be applied at various stages of the training process to ensure improved performance over the random baseline. We refer to the point where the number of available annotations changes the suitable active learning strategy as the phase transition point. In this paper, we establish that when combining active learning with self-supervised models to achieve improved performance, the phase transition point occurs earlier. It becomes challenging to determine which strategy should be used for previously unseen datasets. We argue that existing active learning algorithms are heavily influenced by the phase transition because the empirical risk over the entire active learning pool estimated by these algorithms is inaccurate and influenced by the number of labeled samples. To address this issue, we propose a novel active learning strategy, neural tangent kernel clustering-pseudo-labels (NTKCPL). It estimates empirical risk based on pseudo-labels and the model prediction with NTK approximation. We analyze the factors affecting this approximation error and design a pseudo-label clustering generation method to reduce the approximation error. We validate our method on five datasets, empirically demonstrating that it outperforms the baseline methods in most cases and is valid over a wider range of training budgets.
Abstract（参考訳）: 機械学習分類器を訓練するための高アノテーションコストは、アクティブラーニングと自己教師型学習の広範な研究を促している。近年の研究では、教師付き学習の文脈において、ランダムなベースラインに対するパフォーマンス向上を確保するために、トレーニングプロセスのさまざまな段階で異なるアクティブラーニング戦略を適用する必要があることが示されている。利用可能なアノテーションの数が相転移点として適切なアクティブラーニング戦略を変更する点について述べる。本稿では,アクティブラーニングと自己教師付きモデルを組み合わせた場合,相転移点が早期に出現することを示す。以前は見つからなかったデータセットに使用する戦略を決定するのは難しい。これらのアルゴリズムによって推定されるアクティブ学習プール全体の経験的リスクは、ラベル付きサンプルの数によって不正確で影響を受けやすいため、既存のアクティブ学習アルゴリズムは相転移の影響を強く受けている。そこで本研究では,新しいアクティブラーニング戦略であるneural tangent kernel clustering-pseudo-labels (ntkcpl)を提案する。疑似ラベルに基づく経験的リスクとntk近似によるモデル予測を推定する。この近似誤差に影響する要因を分析し,近似誤差を低減するために擬似ラベルクラスタリング法を設計する。提案手法を5つのデータセット上で検証し,その多くがベースラインメソッドを上回っており,幅広いトレーニング予算で有効であることを実証した。

関連論文リスト

Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文参考訳（メタデータ） (2024-01-18T08:12:23Z)
Learning Objective-Specific Active Learning Strategies with Attentive Neural Processes [72.75421975804132]
学びアクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。能動学習問題の対称性と独立性を利用した新しい分類法を提案する。私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文参考訳（メタデータ） (2023-09-11T14:16:37Z)
Active Learning Guided by Efficient Surrogate Learners [25.52920030051264]
1つのデータポイントが新しいラベルを受け取るたびに、ディープラーニングモデルを再トレーニングするのは現実的ではない。本稿では,ニューラルネットワークの主学習者とともに,ガウス過程の力を利用する新しい能動学習アルゴリズムを提案する。提案モデルでは,新しいデータインスタンス毎のサロゲート学習者を積極的に更新し,ニューラルネットワークの連続学習ダイナミクスをエミュレートし,活用する。
論文参考訳（メタデータ） (2023-01-07T01:35:25Z)
Responsible Active Learning via Human-in-the-loop Peer Study [88.01358655203441]
我々は,データプライバシを同時に保持し,モデルの安定性を向上させるために,Pear Study Learning (PSL) と呼ばれる責任あるアクティブラーニング手法を提案する。まず,クラウドサイドのタスク学習者(教師)から未学習データを分離する。トレーニング中、タスク学習者は軽量なアクティブ学習者に指示し、アクティブサンプリング基準に対するフィードバックを提供する。
論文参考訳（メタデータ） (2022-11-24T13:18:27Z)
Making Look-Ahead Active Learning Strategies Feasible with Neural Tangent Kernels [6.372625755672473]
本稿では,仮説的ラベル付き候補データを用いた再学習に基づく,能動的学習獲得戦略の近似手法を提案する。通常、これはディープ・ネットワークでは実現できないが、我々はニューラル・タンジェント・カーネルを用いて再トレーニングの結果を近似する。
論文参考訳（メタデータ） (2022-06-25T06:13:27Z)
Towards Diverse Evaluation of Class Incremental Learning: A Representation Learning Perspective [67.45111837188685]
クラスインクリメンタル学習(CIL)アルゴリズムは、インクリメンタルに到着したデータから新しいオブジェクトクラスを継続的に学習することを目的としている。表現学習における様々な評価プロトコルを用いて,CILアルゴリズムによって訓練されたニューラルネットワークモデルを実験的に解析する。
論文参考訳（メタデータ） (2022-06-16T11:44:11Z)
MCDAL: Maximum Classifier Discrepancy for Active Learning [74.73133545019877]
近年の最先端のアクティブラーニング手法は, 主にGAN(Generative Adversarial Networks)をサンプル取得に活用している。本稿では,MCDAL(Maximum Discrepancy for Active Learning)と呼ぶ新しいアクティブラーニングフレームワークを提案する。特に,両者の差分を最大化することにより,より厳密な決定境界を学習する2つの補助的分類層を利用する。
論文参考訳（メタデータ） (2021-07-23T06:57:08Z)
Active Learning for Sequence Tagging with Deep Pre-trained Models and Bayesian Uncertainty Estimates [52.164757178369804]
自然言語処理のためのトランスファーラーニングとアクティブラーニングの最近の進歩は、必要なアノテーション予算を大幅に削減する可能性を開く。我々は,様々なベイズ不確実性推定手法とモンテカルロドロップアウトオプションの実験的研究を,アクティブ学習フレームワークで実施する。また, 能動学習中にインスタンスを取得するためには, 完全サイズのトランスフォーマーを蒸留版に置き換えることにより, 計算性能が向上することを示した。
論文参考訳（メタデータ） (2021-01-20T13:59:25Z)
Ask-n-Learn: Active Learning via Reliable Gradient Representations for Image Classification [29.43017692274488]
深い予測モデルは、ラベル付きトレーニングデータという形で人間の監督に依存する。 Ask-n-Learnは,各アルゴリズムで推定されたペスドラベルを用いて得られる勾配埋め込みに基づく能動的学習手法である。
論文参考訳（メタデータ） (2020-09-30T05:19:56Z)
Active Learning for Gaussian Process Considering Uncertainties with Application to Shape Control of Composite Fuselage [7.358477502214471]
ガウス過程に不確実性のある2つの新しい能動学習アルゴリズムを提案する。提案手法は不確実性の影響を取り入れ,予測性能の向上を実現する。本手法は, 複合胴体の自動形状制御における予測モデルの改善に応用されている。
論文参考訳（メタデータ） (2020-04-23T02:04:53Z)
Fase-AL -- Adaptation of Fast Adaptive Stacking of Ensembles for Supporting Active Learning [0.0]
本研究は,Active Learning を用いて非ラベルのインスタンスで分類モデルを誘導する FASE-AL アルゴリズムを提案する。このアルゴリズムは、正しく分類されたインスタンスの割合で有望な結果を得る。
論文参考訳（メタデータ） (2020-01-30T17:25:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。