論文の概要: Active Feature Selection for the Mutual Information Criterion
- arxiv url: http://arxiv.org/abs/2012.06979v1
- Date: Sun, 13 Dec 2020 06:40:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-09 19:31:59.799990
- Title: Active Feature Selection for the Mutual Information Criterion
- Title(参考訳): 相互情報基準のためのアクティブな特徴選択
- Authors: Shachar Schnapp and Sivan Sabato
- Abstract要約: ラベルなしデータを利用できる新しい特徴選択環境であるアクティブ特徴選択について検討する。
我々は,従来の相互情報基準を用いた特徴選択に焦点を合わせ,ラベルと最大の相互情報を持つ$k$の特徴を選択する。
アクティブな機能選択設定では、データセットのサイズよりもはるかに少ないラベルを使用することが目標であり、Emphentireデータセットに基づいたラベルとの相互情報が大きい$k$の機能を見つけることが目標である。
- 参考スコア(独自算出の注目度): 21.376800678915558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study active feature selection, a novel feature selection setting in which
unlabeled data is available, but the budget for labels is limited, and the
examples to label can be actively selected by the algorithm. We focus on
feature selection using the classical mutual information criterion, which
selects the $k$ features with the largest mutual information with the label. In
the active feature selection setting, the goal is to use significantly fewer
labels than the data set size and still find $k$ features whose mutual
information with the label based on the \emph{entire} data set is large. We
explain and experimentally study the choices that we make in the algorithm, and
show that they lead to a successful algorithm, compared to other more naive
approaches. Our design draws on insights which relate the problem of active
feature selection to the study of pure-exploration multi-armed bandits
settings. While we focus here on mutual information, our general methodology
can be adapted to other feature-quality measures as well. The code is available
at the following url: https://github.com/ShacharSchnapp/ActiveFeatureSelection.
- Abstract(参考訳): ラベル付きデータを利用できる新しい特徴選択設定であるアクティブ特徴選択について検討するが、ラベルの予算は限られており、ラベルへのサンプルをアルゴリズムで積極的に選択することができる。
我々は,従来の相互情報基準を用いた特徴選択に焦点を合わせ,ラベルと最大の相互情報を持つ$k$の特徴を選択する。
アクティブな機能選択設定では、データセットのサイズよりもはるかに少ないラベルを使用することが目標であり、なおも \emph{entire}データセットに基づいたラベルとの相互情報が大きい$k$の機能を見つける。
アルゴリズムにおける選択を説明・実験的に検討し,他のナイーブなアプローチと比較してアルゴリズムが成功することを示す。
本設計では,アクティブな特徴選択の問題と純粋探索型マルチアームバンディット設定の関連性について考察する。
ここでは相互情報に注目しながら、我々の一般的な方法論は他の特徴品質尺度にも適用することができる。
コードは以下のurlで入手できる。 https://github.com/shacharschnapp/activefeatureselection。
関連論文リスト
- Cost-constrained multi-label group feature selection using shadow features [1.87071394890391]
複数ラベル分類における特徴選択の問題について,特徴群に割り当てられたコストを考慮した検討を行った。
このタスクでは、ラベルベクトルを予測するのに有用な機能のサブセットを選択することを目的としているが、同時に、選択した機能に関連するコストは、想定される予算を超えない。
論文 参考訳(メタデータ) (2024-08-03T19:31:59Z) - Multi-Label Feature Selection Using Adaptive and Transformed Relevance [0.0]
本稿では,ATRと呼ばれる情報理論に基づく新しい多ラベル特徴選択手法を提案する。
ATRは、個々のラベルと抽象的なラベル空間の識別能力を考慮している。
提案実験は,広範囲な特徴空間とラベル空間を特徴とするベンチマークにおけるATRのスケーラビリティを実証するものである。
論文 参考訳(メタデータ) (2023-09-26T09:01:38Z) - Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。
アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。
また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:11:55Z) - Parallel feature selection based on the trace ratio criterion [4.30274561163157]
本研究は,PFSTを用いた並列特徴選択という,新しい並列特徴選択手法を提案する。
提案手法は,Fisher's Discriminant Analysisで用いられるクラス分離性の尺度であるトレース基準を用いて特徴的有用性を評価する。
実験により,本手法は,比較対象の他の手法による時間的差のごく一部で,少数の特徴セットを生成できることが確認された。
論文 参考訳(メタデータ) (2022-03-03T10:50:33Z) - Active metric learning and classification using similarity queries [21.589707834542338]
本稿では、キーコンポーネントが類似性を反映したデータの表現を学習している問題に対して、新しい統合クエリフレームワークを適用することができることを示す。
提案手法の有効性を,アクティブなメトリック学習とアクティブな分類という2つの課題で実証する。
論文 参考訳(メタデータ) (2022-02-04T03:34:29Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Few-shot Learning for Unsupervised Feature Selection [59.75321498170363]
教師なし特徴選択のための数ショット学習法を提案する。
提案手法では,未ラベルのターゲットインスタンスがいくつかある場合,対象タスクで関連する特徴のサブセットを選択することができる。
提案手法が既存の特徴選択法より優れていることを示す。
論文 参考訳(メタデータ) (2021-07-02T03:52:51Z) - Active Learning for Noisy Data Streams Using Weak and Strong Labelers [3.9370369973510746]
我々は、人間のラベリング能力に触発された、新しい弱くて強力なラベリング問題を考える。
そこで本研究では,フィルタリング,多様性の追加,情報的サンプル選択,ラベル抽出の4段階からなるオンライン能動学習アルゴリズムを提案する。
我々は,個々のサンプルの情報とモデル信頼度を組み合わせることで,情報ゲインを測定する決定関数を導出する。
論文 参考訳(メタデータ) (2020-10-27T09:18:35Z) - Online Active Model Selection for Pre-trained Classifiers [72.84853880948894]
我々は,任意のラウンドにおいて高い確率で最良のモデルをラベル付けし,出力する情報的サンプルを積極的に選択するオンライン選択的サンプリング手法を設計する。
我々のアルゴリズムは、敵とストリームの両方のオンライン予測タスクに利用できる。
論文 参考訳(メタデータ) (2020-10-19T19:53:15Z) - SPL-MLL: Selecting Predictable Landmarks for Multi-Label Learning [87.27700889147144]
我々は、入力(予測可能)に応じて予測しやすく、他の可能なラベル(表現可能)をうまく回復できるランドマークとして、ラベルの小さなサブセットを選択することを提案する。
我々は,ADM(Alternating Direction Method)を用いてこの問題を解決する。実世界のデータセットに関する実証研究により,本手法が他の最先端手法よりも優れた分類性能を実現することを示す。
論文 参考訳(メタデータ) (2020-08-16T11:07:44Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。