論文の概要: Enhancing Cost Efficiency in Active Learning with Candidate Set Query
- arxiv url: http://arxiv.org/abs/2502.06209v1
- Date: Mon, 10 Feb 2025 07:20:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:34:10.598534
- Title: Enhancing Cost Efficiency in Active Learning with Candidate Set Query
- Title(参考訳): Candidate Set Query を用いたアクティブラーニングにおけるコスト効率の向上
- Authors: Yeho Gwon, Sehyun Hwang, Hoyoung Kim, Jungseul Ok, Suha Kwak,
- Abstract要約: 本稿では,候補集合クエリと呼ばれる新しいクエリ設計を特徴とする,コスト効率の高い能動学習フレームワークを提案する。
従来のALクエリとは異なり、オラクルはすべての可能なクラスを検査する必要があるが、我々のメソッドは、基底真実クラスを含む可能性のある候補クラスのセットを絞り込む。
- 参考スコア(独自算出の注目度): 31.759752092751604
- License:
- Abstract: This paper introduces a cost-efficient active learning (AL) framework for classification, featuring a novel query design called candidate set query. Unlike traditional AL queries requiring the oracle to examine all possible classes, our method narrows down the set of candidate classes likely to include the ground-truth class, significantly reducing the search space and labeling cost. Moreover, we leverage conformal prediction to dynamically generate small yet reliable candidate sets, adapting to model enhancement over successive AL rounds. To this end, we introduce an acquisition function designed to prioritize data points that offer high information gain at lower cost. Empirical evaluations on CIFAR-10, CIFAR-100, and ImageNet64x64 demonstrate the effectiveness and scalability of our framework. Notably, it reduces labeling cost by 42% on ImageNet64x64.
- Abstract(参考訳): 本稿では、コスト効率の高い能動学習(AL)フレームワークを導入し、候補集合クエリと呼ばれる新しいクエリ設計を特徴とする。
従来のALクエリとは違って,提案手法では,探索空間とラベリングコストを大幅に削減する。
さらに、連続するALラウンドのモデル拡張に適応して、コンフォメーション予測を活用して、小さいが信頼性の高い候補集合を動的に生成する。
この目的のために我々は,高情報ゲインを低コストで提供するデータポイントの優先順位付けを目的とした取得機能を導入する。
CIFAR-10, CIFAR-100, ImageNet64x64の実証評価により, フレームワークの有効性とスケーラビリティが示された。
特に、ImageNet64x64では、ラベルのコストを42%削減している。
関連論文リスト
- PoliPrompt: A High-Performance Cost-Effective LLM-Based Text Classification Framework for Political Science [1.6967824074619953]
本稿では,大規模言語モデルを活用して分類精度を向上させる3段階のインコンテキスト学習手法を提案する。
我々は,BBCの報道,カバノー最高裁判所の確認,2018年の選挙キャンペーン広告のデータセットを用いて,我々のアプローチを検証する。
その結果, 管理可能な経済コストによる分類F1スコア(ゼロショット分類では+0.36)の大幅な改善が見られた。
論文 参考訳(メタデータ) (2024-09-02T21:05:31Z) - Cost-Aware Uncertainty Reduction in Schema Matching with GPT-4: The Prompt-Matcher Framework [1.13107643869251]
GPT-4の優れた性能により、不確実性を低減できる可能性を探る。
我々は,GPT-4のセマンティック・マッチとアブブレーション・マッチのプロンプトを作成し,最先端の結果を得た。
本稿では,複数の自動スキーママッチングアルゴリズムの統合プロセスにおける不確実性を低減するために,新しいフレームワークであるPrompt-Matcherを導入する。
論文 参考訳(メタデータ) (2024-08-24T16:54:08Z) - Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning [70.22819290458581]
人間のフィードバックによる強化学習(RLHF)は、現在の大規模言語モデルパイプラインにおいて広く採用されているアプローチである。
提案手法では,(1)OODを回避するためのオン・ポリシー・クエリと,(2)プライオリティ・クエリの最も情報性の高いデータを選択するためのアクティブ・ラーニングという2つの重要なイノベーションを導入している。
論文 参考訳(メタデータ) (2024-07-02T10:09:19Z) - OCCAM: Towards Cost-Efficient and Accuracy-Aware Image Classification Inference [11.267210747162961]
画像分類クエリに対して最適な分類器割り当て戦略を計算するための原理的手法であるOCCAMを提案する。
さまざまな実世界のデータセットにおいて、OCCAMは40%のコスト削減を実現し、精度の低下はほとんど、あるいはまったくない。
論文 参考訳(メタデータ) (2024-06-06T21:05:39Z) - BAL: Balancing Diversity and Novelty for Active Learning [53.289700543331925]
多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning (BAL)を導入する。
我々のアプローチは、広く認識されているベンチマークにおいて、確立されたすべてのアクティブな学習方法より1.20%優れています。
論文 参考訳(メタデータ) (2023-12-26T08:14:46Z) - Making LLMs Worth Every Penny: Resource-Limited Text Classification in
Banking [3.9412826185755017]
LLM(Lew-shot and Large Language Model)は、クラス毎にたった1~5つの例で効果的に機能する。
我々の研究は、バンクス77財務意図検出データセットによるこれらの手法のパフォーマンスとコストのトレードオフに対処する。
今後の研究に刺激を与えるため、人間の専門家によるBanking77のキュレートされたサブセットと、広範なエラー分析を提供する。
論文 参考訳(メタデータ) (2023-11-10T15:10:36Z) - Investigating the Limitation of CLIP Models: The Worst-Performing
Categories [53.360239882501325]
コントラスト言語-画像事前学習(CLIP)は、自然言語を視覚概念に統合する基礎モデルを提供する。
通常、十分に設計されたテキストプロンプトによって、多くの領域で満足な全体的な精度が達成できると期待されている。
しかし、最悪のカテゴリにおけるパフォーマンスは、全体的なパフォーマンスよりも著しく劣っていることがわかった。
論文 参考訳(メタデータ) (2023-10-05T05:37:33Z) - Realistic Unsupervised CLIP Fine-tuning with Universal Entropy Optimization [101.08992036691673]
本稿では,未知のクラスにおける配布外サンプルの存在を考慮し,教師なしの微調整シナリオについて考察する。
特に,分布外検出と既知のクラスに関連するインスタンスの認識を同時に強化することに注力する。
我々はUniversal Entropy Optimization(UEO)と呼ばれるシンプルで効率的で効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-24T16:47:17Z) - Bayesian Optimization Over Iterative Learners with Structured Responses:
A Budget-aware Planning Approach [31.918476422203412]
本稿では,HPO 問題を解決するため,Budget-Aware Planning for Iterative Learningers (BAPI) と呼ばれる新しい手法を提案する。
反復学習者のための多様なHPOベンチマークの実験では、ほとんどの場合、BAPIは最先端のベースラインよりも優れた性能を示している。
論文 参考訳(メタデータ) (2022-06-25T18:44:06Z) - Progressive Identification of True Labels for Partial-Label Learning [112.94467491335611]
部分ラベル学習(Partial-label Learning, PLL)は、典型的な弱教師付き学習問題であり、各トレーニングインスタンスには、真のラベルである候補ラベルのセットが設けられている。
既存のほとんどの手法は、特定の方法で解決しなければならない制約付き最適化として精巧に設計されており、計算複雑性をビッグデータにスケールアップするボトルネックにしている。
本稿では,モデルと最適化アルゴリズムの柔軟性を備えた分類器の新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T08:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。