論文の概要: BAL: Balancing Diversity and Novelty for Active Learning
- arxiv url: http://arxiv.org/abs/2312.15944v1
- Date: Tue, 26 Dec 2023 08:14:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 15:31:49.771556
- Title: BAL: Balancing Diversity and Novelty for Active Learning
- Title(参考訳): BAL: アクティブラーニングのための多様性とノベルティのバランス
- Authors: Jingyao Li, Pengguang Chen, Shaozuo Yu, Shu Liu, and Jiaya Jia
- Abstract要約: 多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning (BAL)を導入する。
我々のアプローチは、広く認識されているベンチマークにおいて、確立されたすべてのアクティブな学習方法より1.20%優れています。
- 参考スコア(独自算出の注目度): 53.289700543331925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of Active Learning is to strategically label a subset of the
dataset to maximize performance within a predetermined labeling budget. In this
study, we harness features acquired through self-supervised learning. We
introduce a straightforward yet potent metric, Cluster Distance Difference, to
identify diverse data. Subsequently, we introduce a novel framework, Balancing
Active Learning (BAL), which constructs adaptive sub-pools to balance diverse
and uncertain data. Our approach outperforms all established active learning
methods on widely recognized benchmarks by 1.20%. Moreover, we assess the
efficacy of our proposed framework under extended settings, encompassing both
larger and smaller labeling budgets. Experimental results demonstrate that,
when labeling 80% of the samples, the performance of the current SOTA method
declines by 0.74%, whereas our proposed BAL achieves performance comparable to
the full dataset. Codes are available at https://github.com/JulietLJY/BAL.
- Abstract(参考訳): Active Learningの目的は、データセットのサブセットを戦略的にラベル付けして、所定のラベル付け予算内でパフォーマンスを最大化することである。
本研究では,自己教師付き学習によって得られた特徴を活用する。
多様なデータを識別するために、単純だが強力なメトリクスであるクラスタ距離差を導入する。
次に,多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning(BAL)を導入する。
このアプローチは、広く認識されたベンチマークで確立されたすべてのアクティブラーニング手法を1.20%上回っている。
さらに,提案フレームワークの有効性を,より大規模かつ小規模のラベリング予算を包含して評価する。
実験の結果,サンプルの80%をラベル付けした場合,現在のSOTA法の性能は0.74%低下することがわかった。
コードはhttps://github.com/JulietLJY/BAL.comで入手できる。
関連論文リスト
- Active Prompt Learning with Vision-Language Model Priors [9.173468790066956]
視覚言語モデルの事前学習画像とテキストエンコーダを利用するクラス誘導クラスタリングを提案する。
適応型クラスワイドしきい値に基づく予算削減型選択クエリを提案する。
論文 参考訳(メタデータ) (2024-11-23T02:34:33Z) - Diversify and Conquer: Diversity-Centric Data Selection with Iterative Refinement [8.509688686402438]
命令データ上での大規模言語モデルの微調整は、事前訓練された知識の強化と命令追従能力の向上に不可欠である。
この作業は問題に対処する: 効果的なトレーニングのために、データの最適なサブセットをどうやって決定できるのか?
提案手法では,k平均クラスタリングを用いて,選択したサブセットが全データセットを効果的に表現できるようにする。
論文 参考訳(メタデータ) (2024-09-17T17:25:31Z) - Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。
トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。
広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文 参考訳(メタデータ) (2024-06-07T11:37:45Z) - Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Improving Robustness and Efficiency in Active Learning with Contrastive
Loss [13.994967246046008]
本稿では,教師付き環境下での能動学習に比較学習の損失を生かして,教師付きコントラッシブ・アクティブ・ラーニング(SCAL)を提案する。
多様な特徴表現の偏りのない情報的データサンプルを選択するために,能動的学習における効率的なクエリ戦略を提案する。
論文 参考訳(メタデータ) (2021-09-13T21:09:21Z) - Rebuilding Trust in Active Learning with Actionable Metrics [77.99796068970569]
アクティブラーニング(AL)は研究の活発な領域であるが、プレッシャーのあるニーズにもかかわらず、業界ではほとんど使われない。
これは部分的には目的のずれによるものであり、研究は選択したデータセットで最高の結果を得るよう努力している。
積極的学習における産業実践者の信頼回復を支援するために,様々な活動可能な指標を提示する。
論文 参考訳(メタデータ) (2020-12-18T09:34:59Z) - Semi-supervised Batch Active Learning via Bilevel Optimization [89.37476066973336]
両レベル最適化によるデータ要約問題として,本手法を定式化する。
本手法は,ラベル付きサンプルがほとんど存在しない場合,レジーム内のキーワード検出タスクにおいて極めて有効であることを示す。
論文 参考訳(メタデータ) (2020-10-19T16:53:24Z) - A Comprehensive Benchmark Framework for Active Learning Methods in
Entity Matching [17.064993611446898]
本稿では,EMのための統合型アクティブラーニングベンチマークフレームワークを構築する。
このフレームワークの目的は、積極的学習の組み合わせがEMにどのような効果をもたらすかについて、実践者のための具体的なガイドラインを可能にすることである。
また、F1スコアの観点から学習モデルの品質を約9%向上し、モデルの品質に影響を与えることなく、サンプル選択のレイテンシを最大10倍削減する新しい最適化も含んでいる。
論文 参考訳(メタデータ) (2020-03-29T19:08:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。