論文の概要: Multiple-criteria Based Active Learning with Fixed-size Determinantal
Point Processes
- arxiv url: http://arxiv.org/abs/2107.01622v1
- Date: Sun, 4 Jul 2021 13:22:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 14:54:25.520037
- Title: Multiple-criteria Based Active Learning with Fixed-size Determinantal
Point Processes
- Title(参考訳): 定サイズ決定点プロセスを用いた複数基準に基づく能動学習
- Authors: Xueying Zhan and Qing Li and Antoni B. Chan
- Abstract要約: 本稿では,情報性,代表性,多様性の3つの相補的基準を取り入れた,複数基準に基づく能動学習アルゴリズムを提案する。
提案手法は,他の複数基準のALアルゴリズムよりも性能が優れ,安定であることを示す。
- 参考スコア(独自算出の注目度): 43.71112693633952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active learning aims to achieve greater accuracy with less training data by
selecting the most useful data samples from which it learns. Single-criterion
based methods (i.e., informativeness and representativeness based methods) are
simple and efficient; however, they lack adaptability to different real-world
scenarios. In this paper, we introduce a multiple-criteria based active
learning algorithm, which incorporates three complementary criteria, i.e.,
informativeness, representativeness and diversity, to make appropriate
selections in the active learning rounds under different data types. We
consider the selection process as a Determinantal Point Process, which good
balance among these criteria. We refine the query selection strategy by both
selecting the hardest unlabeled data sample and biasing towards the classifiers
that are more suitable for the current data distribution. In addition, we also
consider the dependencies and relationships between these data points in data
selection by means of centroidbased clustering approaches. Through evaluations
on synthetic and real-world datasets, we show that our method performs
significantly better and is more stable than other multiple-criteria based AL
algorithms.
- Abstract(参考訳): アクティブラーニングは、学習する最も有用なデータサンプルを選択して、トレーニングデータの少ない精度でより正確にすることを目的としている。
単一基準に基づく手法(すなわち情報性や代表性に基づく手法)は単純で効率的であるが、異なる現実世界のシナリオへの適応性に欠ける。
本稿では,情報性,代表性,多様性という3つの相補的基準を取り入れ,異なるデータ型の下でのアクティブラーニングラウンドにおいて適切な選択を行うマルチクリテリア型アクティブラーニングアルゴリズムを提案する。
我々は,選択過程を決定点過程とみなし,これらの基準のバランスが良好である。
提案手法は,最もラベルのないデータサンプルの選択と,現在のデータ分布に適した分類器への偏りを両立させることにより,クエリ選択戦略を洗練する。
さらに,データ選択におけるこれらのデータポイント間の依存関係と関係を,セントロイドクラスタリング手法を用いて検討する。
本手法は,合成データと実世界のデータを用いた評価により,他のマルチクリトリア型alアルゴリズムよりも優れた性能と安定性を示す。
関連論文リスト
- Diversify and Conquer: Diversity-Centric Data Selection with Iterative Refinement [8.509688686402438]
命令データ上での大規模言語モデルの微調整は、事前訓練された知識の強化と命令追従能力の向上に不可欠である。
この作業は問題に対処する: 効果的なトレーニングのために、データの最適なサブセットをどうやって決定できるのか?
提案手法では,k平均クラスタリングを用いて,選択したサブセットが全データセットを効果的に表現できるようにする。
論文 参考訳(メタデータ) (2024-09-17T17:25:31Z) - DsDm: Model-Aware Dataset Selection with Datamodels [81.01744199870043]
標準的なプラクティスは、データ品質という人間の考え方にマッチする例をフィルタリングすることです。
質の高い"データソースとの類似性に応じた選択は、ランダムに選択するデータに比べてパフォーマンスが向上しない(さらに傷つく)可能性がある。
我々のフレームワークは、データ品質に関する手作業による概念を回避し、学習プロセスがターゲットタスクの予測にデータポイントをトレーニングする方法を明確にモデル化する。
論文 参考訳(メタデータ) (2024-01-23T17:22:00Z) - A Contrast Based Feature Selection Algorithm for High-dimensional Data
set in Machine Learning [9.596923373834093]
本稿では,異なるクラス間で示される相違点に基づいて識別的特徴を抽出する新しいフィルタ特徴選択手法であるContrastFSを提案する。
提案手法の有効性と有効性について検証し,提案手法が無視可能な計算で良好に動作することを示す。
論文 参考訳(メタデータ) (2024-01-15T05:32:35Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。
アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。
また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:11:55Z) - Cost-Effective Online Contextual Model Selection [14.094350329970537]
我々は,このタスクを,学習者が文脈とともにラベルのないデータポイントを受信する,オンラインコンテキストアクティブモデル選択問題として定式化する。
目標は、ラベルの過剰な量を得ることなく、任意のコンテキストに対して最良のモデルを出力することである。
本稿では,適応モデル選択のためのポリシークラスに定義された新しい不確実性サンプリングクエリ基準に依存する,文脈型アクティブモデル選択アルゴリズム(CAMS)を提案する。
論文 参考訳(メタデータ) (2022-07-13T08:22:22Z) - Active metric learning and classification using similarity queries [21.589707834542338]
本稿では、キーコンポーネントが類似性を反映したデータの表現を学習している問題に対して、新しい統合クエリフレームワークを適用することができることを示す。
提案手法の有効性を,アクティブなメトリック学習とアクティブな分類という2つの課題で実証する。
論文 参考訳(メタデータ) (2022-02-04T03:34:29Z) - Online Active Model Selection for Pre-trained Classifiers [72.84853880948894]
我々は,任意のラウンドにおいて高い確率で最良のモデルをラベル付けし,出力する情報的サンプルを積極的に選択するオンライン選択的サンプリング手法を設計する。
我々のアルゴリズムは、敵とストリームの両方のオンライン予測タスクに利用できる。
論文 参考訳(メタデータ) (2020-10-19T19:53:15Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。