論文の概要: BAL: Balancing Diversity and Novelty for Active Learning
- arxiv url: http://arxiv.org/abs/2312.15944v1
- Date: Tue, 26 Dec 2023 08:14:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 15:31:49.771556
- Title: BAL: Balancing Diversity and Novelty for Active Learning
- Title(参考訳): BAL: アクティブラーニングのための多様性とノベルティのバランス
- Authors: Jingyao Li, Pengguang Chen, Shaozuo Yu, Shu Liu, and Jiaya Jia
- Abstract要約: 多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning (BAL)を導入する。
我々のアプローチは、広く認識されているベンチマークにおいて、確立されたすべてのアクティブな学習方法より1.20%優れています。
- 参考スコア(独自算出の注目度): 53.289700543331925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of Active Learning is to strategically label a subset of the
dataset to maximize performance within a predetermined labeling budget. In this
study, we harness features acquired through self-supervised learning. We
introduce a straightforward yet potent metric, Cluster Distance Difference, to
identify diverse data. Subsequently, we introduce a novel framework, Balancing
Active Learning (BAL), which constructs adaptive sub-pools to balance diverse
and uncertain data. Our approach outperforms all established active learning
methods on widely recognized benchmarks by 1.20%. Moreover, we assess the
efficacy of our proposed framework under extended settings, encompassing both
larger and smaller labeling budgets. Experimental results demonstrate that,
when labeling 80% of the samples, the performance of the current SOTA method
declines by 0.74%, whereas our proposed BAL achieves performance comparable to
the full dataset. Codes are available at https://github.com/JulietLJY/BAL.
- Abstract(参考訳): Active Learningの目的は、データセットのサブセットを戦略的にラベル付けして、所定のラベル付け予算内でパフォーマンスを最大化することである。
本研究では,自己教師付き学習によって得られた特徴を活用する。
多様なデータを識別するために、単純だが強力なメトリクスであるクラスタ距離差を導入する。
次に,多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning(BAL)を導入する。
このアプローチは、広く認識されたベンチマークで確立されたすべてのアクティブラーニング手法を1.20%上回っている。
さらに,提案フレームワークの有効性を,より大規模かつ小規模のラベリング予算を包含して評価する。
実験の結果,サンプルの80%をラベル付けした場合,現在のSOTA法の性能は0.74%低下することがわかった。
コードはhttps://github.com/JulietLJY/BAL.comで入手できる。
関連論文リスト
- Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - Re-Benchmarking Pool-Based Active Learning for Binary Classification [27.034593234956713]
アクティブラーニング(英: Active Learning)は、ラベル付きデータを取得する際の機械学習モデルの性能を大幅に向上させるパラダイムである。
アクティブな学習戦略を評価するためのベンチマークはいくつか存在するが、それらの発見はいくつかの誤解を示している。
この不一致は、コミュニティのために透明で再現可能なベンチマークを開発する動機となります。
論文 参考訳(メタデータ) (2023-06-15T08:47:50Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Revisiting Deep Active Learning for Semantic Segmentation [37.3546941940388]
本研究では,本論文で提案する各種能動的学習目標の性能について,データ分布が決定的であることを示す。
半教師付き学習とアクティブラーニングの統合は,2つの目標が整列した際の性能向上を実証する。
論文 参考訳(メタデータ) (2023-02-08T14:23:37Z) - Improving Robustness and Efficiency in Active Learning with Contrastive
Loss [13.994967246046008]
本稿では,教師付き環境下での能動学習に比較学習の損失を生かして,教師付きコントラッシブ・アクティブ・ラーニング(SCAL)を提案する。
多様な特徴表現の偏りのない情報的データサンプルを選択するために,能動的学習における効率的なクエリ戦略を提案する。
論文 参考訳(メタデータ) (2021-09-13T21:09:21Z) - Towards Reducing Labeling Cost in Deep Object Detection [61.010693873330446]
本稿では,検知器の不確実性と頑健性の両方を考慮した,アクティブラーニングのための統一的なフレームワークを提案する。
提案手法は, 確率分布のドリフトを抑えながら, 極めて確実な予測を擬似ラベル化することができる。
論文 参考訳(メタデータ) (2021-06-22T16:53:09Z) - Rebuilding Trust in Active Learning with Actionable Metrics [77.99796068970569]
アクティブラーニング(AL)は研究の活発な領域であるが、プレッシャーのあるニーズにもかかわらず、業界ではほとんど使われない。
これは部分的には目的のずれによるものであり、研究は選択したデータセットで最高の結果を得るよう努力している。
積極的学習における産業実践者の信頼回復を支援するために,様々な活動可能な指標を提示する。
論文 参考訳(メタデータ) (2020-12-18T09:34:59Z) - Semi-supervised Batch Active Learning via Bilevel Optimization [89.37476066973336]
両レベル最適化によるデータ要約問題として,本手法を定式化する。
本手法は,ラベル付きサンプルがほとんど存在しない場合,レジーム内のキーワード検出タスクにおいて極めて有効であることを示す。
論文 参考訳(メタデータ) (2020-10-19T16:53:24Z) - A Comprehensive Benchmark Framework for Active Learning Methods in
Entity Matching [17.064993611446898]
本稿では,EMのための統合型アクティブラーニングベンチマークフレームワークを構築する。
このフレームワークの目的は、積極的学習の組み合わせがEMにどのような効果をもたらすかについて、実践者のための具体的なガイドラインを可能にすることである。
また、F1スコアの観点から学習モデルの品質を約9%向上し、モデルの品質に影響を与えることなく、サンプル選択のレイテンシを最大10倍削減する新しい最適化も含んでいる。
論文 参考訳(メタデータ) (2020-03-29T19:08:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。