Fugu-MT 論文翻訳(概要): Multiple-criteria Based Active Learning with Fixed-size Determinantal Point Processes

論文の概要: Multiple-criteria Based Active Learning with Fixed-size Determinantal Point Processes

arxiv url: http://arxiv.org/abs/2107.01622v1
Date: Sun, 4 Jul 2021 13:22:54 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-06 14:54:25.520037
Title: Multiple-criteria Based Active Learning with Fixed-size Determinantal Point Processes
Title（参考訳）: 定サイズ決定点プロセスを用いた複数基準に基づく能動学習
Authors: Xueying Zhan and Qing Li and Antoni B. Chan
Abstract要約: 本稿では,情報性,代表性,多様性の3つの相補的基準を取り入れた,複数基準に基づく能動学習アルゴリズムを提案する。提案手法は,他の複数基準のALアルゴリズムよりも性能が優れ,安定であることを示す。
参考スコア（独自算出の注目度）: 43.71112693633952
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Active learning aims to achieve greater accuracy with less training data by selecting the most useful data samples from which it learns. Single-criterion based methods (i.e., informativeness and representativeness based methods) are simple and efficient; however, they lack adaptability to different real-world scenarios. In this paper, we introduce a multiple-criteria based active learning algorithm, which incorporates three complementary criteria, i.e., informativeness, representativeness and diversity, to make appropriate selections in the active learning rounds under different data types. We consider the selection process as a Determinantal Point Process, which good balance among these criteria. We refine the query selection strategy by both selecting the hardest unlabeled data sample and biasing towards the classifiers that are more suitable for the current data distribution. In addition, we also consider the dependencies and relationships between these data points in data selection by means of centroidbased clustering approaches. Through evaluations on synthetic and real-world datasets, we show that our method performs significantly better and is more stable than other multiple-criteria based AL algorithms.
Abstract（参考訳）: アクティブラーニングは、学習する最も有用なデータサンプルを選択して、トレーニングデータの少ない精度でより正確にすることを目的としている。単一基準に基づく手法(すなわち情報性や代表性に基づく手法)は単純で効率的であるが、異なる現実世界のシナリオへの適応性に欠ける。本稿では,情報性,代表性,多様性という3つの相補的基準を取り入れ,異なるデータ型の下でのアクティブラーニングラウンドにおいて適切な選択を行うマルチクリテリア型アクティブラーニングアルゴリズムを提案する。我々は,選択過程を決定点過程とみなし,これらの基準のバランスが良好である。提案手法は,最もラベルのないデータサンプルの選択と,現在のデータ分布に適した分類器への偏りを両立させることにより,クエリ選択戦略を洗練する。さらに,データ選択におけるこれらのデータポイント間の依存関係と関係を,セントロイドクラスタリング手法を用いて検討する。本手法は,合成データと実世界のデータを用いた評価により,他のマルチクリトリア型alアルゴリズムよりも優れた性能と安定性を示す。

関連論文リスト

Nearly Optimal Active Preference Learning and Its Application to LLM Alignment [68.56793807995417]
大規模言語モデルの調整は、人間の好みラベルの高品質なデータセットに依存する。既存の多くのアプローチでは、G-やD-最適化のような古典的な実験的な設計基準が採用されている。本研究では,これら設計目標の適合性に疑問を呈する,選好学習に特有な単純な直観を同定する。
論文参考訳（メタデータ） (2026-02-02T03:21:29Z)
Disentangling the Roles of Representation and Selection in Data Pruning [6.141776277655227]
我々はデータプルーニングをデータ表現と選択アルゴリズムの2つの重要なコンポーネントに分解する。我々の理論的および実証的な結果は、表現の重要な役割を浮き彫りにする。異なる選択アルゴリズムは異なる設定で優れており、どのアルゴリズムも他のアルゴリズムより一貫して優れているわけではない。
論文参考訳（メタデータ） (2025-07-04T15:25:04Z)
Add-One-In: Incremental Sample Selection for Large Language Models via a Choice-Based Greedy Paradigm [50.492124556982674]
本稿では,新しい選択型サンプル選択フレームワークを提案する。個々のサンプル品質の評価から、異なるサンプルのコントリビューション値の比較へと焦点をシフトする。われわれのアプローチをより大きな医療データセットで検証し、現実の応用における実用性を強調した。
論文参考訳（メタデータ） (2025-03-04T07:32:41Z)
Diversify and Conquer: Diversity-Centric Data Selection with Iterative Refinement [8.509688686402438]
命令データ上での大規模言語モデルの微調整は、事前訓練された知識の強化と命令追従能力の向上に不可欠である。この作業は問題に対処する: 効果的なトレーニングのために、データの最適なサブセットをどうやって決定できるのか? 提案手法では,k平均クラスタリングを用いて,選択したサブセットが全データセットを効果的に表現できるようにする。
論文参考訳（メタデータ） (2024-09-17T17:25:31Z)
Take the essence and discard the dross: A Rethinking on Data Selection for Fine-Tuning Large Language Models [36.22392593103493]
微調整された大規模言語モデル(LLM)のデータ選択は、既存のデータセットから高品質なサブセットを選択することを目的としている。既存の調査では、微調整フェーズの詳細な調査を見落としている。特徴抽出, 基準設計, セレクタ評価を含む新しい3段階の手法を導入し, これらの手法を体系的に分類し, 評価する。
論文参考訳（メタデータ） (2024-06-20T08:58:58Z)
DsDm: Model-Aware Dataset Selection with Datamodels [81.01744199870043]
標準的なプラクティスは、データ品質という人間の考え方にマッチする例をフィルタリングすることです。質の高い"データソースとの類似性に応じた選択は、ランダムに選択するデータに比べてパフォーマンスが向上しない(さらに傷つく)可能性がある。我々のフレームワークは、データ品質に関する手作業による概念を回避し、学習プロセスがターゲットタスクの予測にデータポイントをトレーニングする方法を明確にモデル化する。
論文参考訳（メタデータ） (2024-01-23T17:22:00Z)
A Contrast Based Feature Selection Algorithm for High-dimensional Data set in Machine Learning [9.596923373834093]
本稿では,異なるクラス間で示される相違点に基づいて識別的特徴を抽出する新しいフィルタ特徴選択手法であるContrastFSを提案する。提案手法の有効性と有効性について検証し,提案手法が無視可能な計算で良好に動作することを示す。
論文参考訳（メタデータ） (2024-01-15T05:32:35Z)
A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文参考訳（メタデータ） (2023-12-17T04:41:07Z)
Exploiting Diversity of Unlabeled Data for Label-Efficient Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文参考訳（メタデータ） (2022-07-25T16:11:55Z)
Cost-Effective Online Contextual Model Selection [14.094350329970537]
我々は,このタスクを,学習者が文脈とともにラベルのないデータポイントを受信する,オンラインコンテキストアクティブモデル選択問題として定式化する。目標は、ラベルの過剰な量を得ることなく、任意のコンテキストに対して最良のモデルを出力することである。本稿では,適応モデル選択のためのポリシークラスに定義された新しい不確実性サンプリングクエリ基準に依存する,文脈型アクティブモデル選択アルゴリズム(CAMS)を提案する。
論文参考訳（メタデータ） (2022-07-13T08:22:22Z)
Active metric learning and classification using similarity queries [21.589707834542338]
本稿では、キーコンポーネントが類似性を反映したデータの表現を学習している問題に対して、新しい統合クエリフレームワークを適用することができることを示す。提案手法の有効性を,アクティブなメトリック学習とアクティブな分類という2つの課題で実証する。
論文参考訳（メタデータ） (2022-02-04T03:34:29Z)
Online Active Model Selection for Pre-trained Classifiers [72.84853880948894]
我々は,任意のラウンドにおいて高い確率で最良のモデルをラベル付けし,出力する情報的サンプルを積極的に選択するオンライン選択的サンプリング手法を設計する。我々のアルゴリズムは、敵とストリームの両方のオンライン予測タスクに利用できる。
論文参考訳（メタデータ） (2020-10-19T19:53:15Z)
Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文参考訳（メタデータ） (2020-06-15T10:08:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。