論文の概要: On-the-Fly Joint Feature Selection and Classification
- arxiv url: http://arxiv.org/abs/2004.10245v1
- Date: Tue, 21 Apr 2020 19:19:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 06:12:58.207633
- Title: On-the-Fly Joint Feature Selection and Classification
- Title(参考訳): オンザフライ共同特徴選択と分類
- Authors: Yasitha Warahena Liyanage, Daphney-Stavroula Zois, Charalampos Chelmis
- Abstract要約: 本稿では,共同で特徴選択と分類を行うためのフレームワークを提案する。
我々は、関連する最適化問題の最適解を導出し、その構造を解析する。
提案アルゴリズムの性能を複数の公開データセット上で評価する。
- 参考スコア(独自算出の注目度): 16.84451472788859
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Joint feature selection and classification in an online setting is essential
for time-sensitive decision making. However, most existing methods treat this
coupled problem independently. Specifically, online feature selection methods
can handle either streaming features or data instances offline to produce a
fixed set of features for classification, while online classification methods
classify incoming instances using full knowledge about the feature space.
Nevertheless, all existing methods utilize a set of features, common for all
data instances, for classification. Instead, we propose a framework to perform
joint feature selection and classification on-the-fly, so as to minimize the
number of features evaluated for every data instance and maximize
classification accuracy. We derive the optimum solution of the associated
optimization problem and analyze its structure. Two algorithms are proposed,
ETANA and F-ETANA, which are based on the optimum solution and its properties.
We evaluate the performance of the proposed algorithms on several public
datasets, demonstrating (i) the dominance of the proposed algorithms over the
state-of-the-art, and (ii) its applicability to broad range of application
domains including clinical research and natural language processing.
- Abstract(参考訳): オンライン環境での機能選択と分類は、時間に敏感な意思決定に不可欠である。
しかし、既存の手法の多くは、この結合問題を独立に扱う。
具体的には、オンラインの機能選択メソッドはストリーミング機能またはデータインスタンスをオフラインで処理して、分類のための固定された機能セットを生成することができる。
それでも、既存のすべてのメソッドは、すべてのデータインスタンスに共通する一連の機能を使って分類する。
そこで本研究では,データインスタンス毎に評価された特徴数を最小化し,分類精度を最大化するために,共同機能選択と分類をオンザフライで行うフレームワークを提案する。
最適化問題の最適解を導出し,その構造を分析する。
最適解とその性質に基づく2つのアルゴリズムであるETANAとF-ETANAを提案する。
提案アルゴリズムの性能をいくつかの公開データセットで評価し、実証した。
(i)最先端技術における提案アルゴリズムの優位化
(ii)臨床研究や自然言語処理を含む幅広い応用分野に適用可能であること。
関連論文リスト
- An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - An Evolutionary Correlation-aware Feature Selection Method for
Classification Problems [3.2550305883611244]
本稿では,3つの目標を達成するために分布推定アルゴリズムを提案する。
第一に、EDAの拡張として、適合度関数に基づいて競合する各イテレーションにおいて、提案手法は2つの個人しか生成しない。
第二に、各イテレーションにおける個人の機能数を決定するためのガイド技術を提供する。
本論文の主な貢献として,各特徴の重要さだけでなく,特徴間の相互作用についても考察できる。
論文 参考訳(メタデータ) (2021-10-16T20:20:43Z) - Dynamic Instance-Wise Classification in Correlated Feature Spaces [15.351282873821935]
典型的な機械学習環境では、すべてのテストインスタンスの予測は、モデルトレーニング中に発見された機能の共通サブセットに基づいている。
それぞれのテストインスタンスに対して個別に評価する最適な特徴を順次選択し、分類精度に関して更なる改善が得られないことを判断すると、選択プロセスが終了して予測を行う新しい手法を提案する。
提案手法の有効性, 一般化性, 拡張性について, 多様なアプリケーション領域の様々な実世界のデータセットで説明する。
論文 参考訳(メタデータ) (2021-06-08T20:20:36Z) - Joint Adaptive Graph and Structured Sparsity Regularization for
Unsupervised Feature Selection [6.41804410246642]
本稿では,共同適応グラフと構造付き空間正規化unsupervised feature selection (JASFS)法を提案する。
最適な機能のサブセットがグループで選択され、選択された機能の数が自動的に決定される。
8つのベンチマーク実験の結果,提案手法の有効性と有効性を示した。
論文 参考訳(メタデータ) (2020-10-09T08:17:04Z) - Feature Selection Methods for Cost-Constrained Classification in Random
Forests [3.4806267677524896]
コストに敏感な特徴選択は、機能選択の問題であり、モデルに含めるための個々のコストを上昇させる。
ランダムフォレスト(Random Forests)は、機能選択において特に困難な問題を定義している。
小木構造から特徴を選択する新しい高速多変量特徴選択法であるShallow Tree Selectionを提案する。
論文 参考訳(メタデータ) (2020-08-14T11:39:52Z) - A novel embedded min-max approach for feature selection in nonlinear
support vector machine classification [0.0]
min-max最適化問題に基づく組込み特徴選択法を提案する。
双対性理論を活用することにより、min-max問題を等価に修正し、それ以上のアドを伴わずに解決する。
提案手法の効率性と有用性は,いくつかのベンチマークデータセットで検証される。
論文 参考訳(メタデータ) (2020-04-21T09:40:38Z) - Extreme Algorithm Selection With Dyadic Feature Representation [78.13985819417974]
我々は,数千の候補アルゴリズムの固定セットを考慮に入れた,極端なアルゴリズム選択(XAS)の設定を提案する。
我々は、XAS設定に対する最先端のAS技術の適用性を評価し、Dyadic特徴表現を利用したアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-29T09:40:58Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。