論文の概要: A Novel Meta Learning Framework for Feature Selection using Data
Synthesis and Fuzzy Similarity
- arxiv url: http://arxiv.org/abs/2005.09856v2
- Date: Thu, 21 May 2020 03:41:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 04:47:57.696368
- Title: A Novel Meta Learning Framework for Feature Selection using Data
Synthesis and Fuzzy Similarity
- Title(参考訳): データ合成とファジィ類似性を用いた特徴選択のための新しいメタ学習フレームワーク
- Authors: Zixiao Shen, Xin Chen, Jonathan M. Garibaldi
- Abstract要約: 本稿ではファジィ類似性に基づく特徴選択のための新しいメタ学習フレームワークを提案する。
提案手法は、任意のデータセットに対して、4つの候補FSメソッドから最高のFSメソッドを推奨することを目的としている。
5つのデータセットのベストメソッドと1つのデータセットの2番目のベストメソッドをうまく推奨し、4つのFSメソッドのどれよりも優れていた。
- 参考スコア(独自算出の注目度): 10.925672064009026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel meta learning framework for feature selection
(FS) based on fuzzy similarity. The proposed method aims to recommend the best
FS method from four candidate FS methods for any given dataset. This is
achieved by firstly constructing a large training data repository using data
synthesis. Six meta features that represent the characteristics of the training
dataset are then extracted. The best FS method for each of the training
datasets is used as the meta label. Both the meta features and the
corresponding meta labels are subsequently used to train a classification model
using a fuzzy similarity measure based framework. Finally the trained model is
used to recommend the most suitable FS method for a given unseen dataset. This
proposed method was evaluated based on eight public datasets of real-world
applications. It successfully recommended the best method for five datasets and
the second best method for one dataset, which outperformed any of the four
individual FS methods. Besides, the proposed method is computationally
efficient for algorithm selection, leading to negligible additional time for
the feature selection process. Thus, the paper contributes a novel method for
effectively recommending which feature selection method to use for any new
given dataset.
- Abstract(参考訳): 本稿では,ファジィ類似性に基づく特徴選択(fs)のための新しいメタ学習フレームワークを提案する。
提案手法は、任意のデータセットに対して、4つの候補FSメソッドから最高のFSメソッドを推奨することを目的としている。
これはまず、データ合成を使用して大規模なトレーニングデータリポジトリを構築することで実現される。
次に、トレーニングデータセットの特徴を表す6つのメタ特徴を抽出する。
トレーニングデータセット毎に最適なFSメソッドがメタラベルとして使用される。
メタ特徴と対応するメタラベルは、ファジィ類似度尺度に基づくフレームワークを使用して分類モデルのトレーニングに使用される。
最後に、トレーニングされたモデルは、与えられた未確認データセットに対して最も適切なFSメソッドを推奨するために使用される。
提案手法は実世界の8つの公開データセットに基づいて評価した。
5つのデータセットのベストメソッドと1つのデータセットの2番目のベストメソッドをうまく推奨し、4つのFSメソッドのどれよりも優れていた。
また,提案手法はアルゴリズム選択に計算効率が高く,特徴選択プロセスに要する時間も不要である。
そこで本研究では,任意の新しいデータセットに対して,どの特徴選択方法を効果的に推奨する新しい手法を提案する。
関連論文リスト
- A Closer Look at Deep Learning on Tabular Data [52.50778536274327]
タブラルデータは、機械学習の様々な領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - DST-Det: Simple Dynamic Self-Training for Open-Vocabulary Object Detection [72.25697820290502]
この研究は、ゼロショット分類によって潜在的に新しいクラスを特定するための単純かつ効率的な戦略を導入する。
このアプローチは、アノテーションやデータセット、再学習を必要とせずに、新しいクラスのリコールと精度を高めるセルフトレーニング戦略として言及する。
LVIS、V3Det、COCOを含む3つのデータセットに対する実証的な評価は、ベースラインのパフォーマンスを大幅に改善したことを示している。
論文 参考訳(メタデータ) (2023-10-02T17:52:24Z) - Towards Free Data Selection with General-Purpose Models [71.92151210413374]
望ましいデータ選択アルゴリズムは、限られたアノテーション予算の有用性を最大化するために、最も情報性の高いサンプルを効率的に選択することができる。
アクティブな学習手法で表現された現在のアプローチは、通常、時間を要するモデルのトレーニングとバッチデータ選択を繰り返し繰り返す、面倒なパイプラインに従う。
FreeSelは重いバッチ選択プロセスをバイパスし、効率を大幅に改善し、既存のアクティブラーニングメソッドよりも530倍高速である。
論文 参考訳(メタデータ) (2023-09-29T15:50:14Z) - Fast Classification with Sequential Feature Selection in Test Phase [1.1470070927586016]
本稿では,分類のための能動的特徴獲得のための新しいアプローチを提案する。
最適な予測性能を達成するために、最も情報性の高い機能のサブセットを順次選択する作業である。
提案手法では,既存の手法に比べてはるかに高速で効率の良い新しい遅延モデルが提案されている。
論文 参考訳(メタデータ) (2023-06-25T21:31:46Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Automatic learning algorithm selection for classification via
convolutional neural networks [0.0]
本研究の目的は,メタ機能を特定することなく,データ固有の構造を学習することである。
シミュレーションデータセットを用いた実験により, 線形および非線形パターンの同定において, 提案手法がほぼ完璧な性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-05-16T01:57:01Z) - Efficient Data-specific Model Search for Collaborative Filtering [56.60519991956558]
協調フィルタリング(CF)はレコメンダシステムの基本的なアプローチである。
本稿では,機械学習(AutoML)の最近の進歩を動機として,データ固有のCFモデルを設計することを提案する。
ここでキーとなるのは、最先端(SOTA)のCFメソッドを統一し、それらを入力エンコーディング、埋め込み関数、インタラクション、予測関数の非結合ステージに分割する新しいフレームワークである。
論文 参考訳(メタデータ) (2021-06-14T14:30:32Z) - A concise method for feature selection via normalized frequencies [0.0]
本稿では,普遍的特徴選択のための簡潔な手法を提案する。
提案手法は, フィルタ法とラッパー法を融合して行う。
評価結果から,提案手法は,精度,精度,リコール,Fスコア,AUCの点で,いくつかの最先端技術に優れた性能を示した。
論文 参考訳(メタデータ) (2021-06-10T15:29:54Z) - Fast Few-Shot Classification by Few-Iteration Meta-Learning [173.32497326674775]
数ショット分類のための高速な最適化に基づくメタラーニング手法を提案する。
我々の戦略はメタ学習において学習すべき基礎学習者の目的の重要な側面を可能にする。
我々は、我々のアプローチの速度と効果を実証し、総合的な実験分析を行う。
論文 参考訳(メタデータ) (2020-10-01T15:59:31Z) - A Novel Weighted Combination Method for Feature Selection using Fuzzy
Sets [10.925672064009026]
提案手法は主に,ブートストラップを用いたファジィ集合生成,ファジィ集合の重み付け,デファジィ化に基づく特徴ランキングの3つのプロセスからなる。
提案手法は、4つの最先端特徴選択法を組み合わせて実装し、3つの公開バイオメディカルデータセットに基づく性能評価を行った。
論文 参考訳(メタデータ) (2020-05-11T11:30:34Z) - IVFS: Simple and Efficient Feature Selection for High Dimensional
Topology Preservation [33.424663018395684]
本稿では,サンプル類似性保存を向上する簡易かつ効果的な特徴選択アルゴリズムを提案する。
提案アルゴリズムは、全データの対距離と位相パターンを適切に保存することができる。
論文 参考訳(メタデータ) (2020-04-02T23:05:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。