論文の概要: Fast Classification with Sequential Feature Selection in Test Phase
- arxiv url: http://arxiv.org/abs/2306.14347v1
- Date: Sun, 25 Jun 2023 21:31:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 15:24:03.252520
- Title: Fast Classification with Sequential Feature Selection in Test Phase
- Title(参考訳): 逐次特徴選択によるテストフェーズの高速分類
- Authors: Ali Mirzaei, Vahid Pourahmadi, Hamid Sheikhzadeh, Alireza
Abdollahpourrostam
- Abstract要約: 本稿では,分類のための能動的特徴獲得のための新しいアプローチを提案する。
最適な予測性能を達成するために、最も情報性の高い機能のサブセットを順次選択する作業である。
提案手法では,既存の手法に比べてはるかに高速で効率の良い新しい遅延モデルが提案されている。
- 参考スコア(独自算出の注目度): 1.1470070927586016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a novel approach to active feature acquisition for
classification, which is the task of sequentially selecting the most
informative subset of features to achieve optimal prediction performance during
testing while minimizing cost. The proposed approach involves a new lazy model
that is significantly faster and more efficient compared to existing methods,
while still producing comparable accuracy results. During the test phase, the
proposed approach utilizes Fisher scores for feature ranking to identify the
most important feature at each step. In the next step the training dataset is
filtered based on the observed value of the selected feature and then we
continue this process to reach to acceptable accuracy or limit of the budget
for feature acquisition. The performance of the proposed approach was evaluated
on synthetic and real datasets, including our new synthetic dataset, CUBE
dataset and also real dataset Forest. The experimental results demonstrate that
our approach achieves competitive accuracy results compared to existing
methods, while significantly outperforming them in terms of speed. The source
code of the algorithm is released at github with this link:
https://github.com/alimirzaei/FCwSFS.
- Abstract(参考訳): 本稿では,最も有益な特徴のサブセットを順次選択し,コストを最小化しつつ,テスト中に最適な予測性能を達成するための新しい手法を提案する。
提案手法には,既存の手法に比べてはるかに高速で効率の良い新しい遅延モデルが伴うが,精度は同等である。
テストフェーズにおいて,提案手法は,各ステップで最も重要な特徴を特定するために,Fisherスコアを用いて特徴ランク付けを行う。
次のステップでは、選択した特徴の観測値に基づいてトレーニングデータセットをフィルタリングし、このプロセスを継続して、特徴取得の予算の許容精度または限界に達する。
提案手法の性能を,我々の新しい合成データセット,CUBEデータセット,および実際のデータセットフォレストなど,合成および実データに基づいて評価した。
実験結果から,本手法は従来の手法に比べて精度が向上するが,速度面では性能が優れていることが示された。
アルゴリズムのソースコードはgithub.com/alimirzaei/FCwSFSというリンクで公開されている。
関連論文リスト
- Towards Free Data Selection with General-Purpose Models [71.92151210413374]
望ましいデータ選択アルゴリズムは、限られたアノテーション予算の有用性を最大化するために、最も情報性の高いサンプルを効率的に選択することができる。
アクティブな学習手法で表現された現在のアプローチは、通常、時間を要するモデルのトレーニングとバッチデータ選択を繰り返し繰り返す、面倒なパイプラインに従う。
FreeSelは重いバッチ選択プロセスをバイパスし、効率を大幅に改善し、既存のアクティブラーニングメソッドよりも530倍高速である。
論文 参考訳(メタデータ) (2023-09-29T15:50:14Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - A Tent L\'evy Flying Sparrow Search Algorithm for Feature Selection: A
COVID-19 Case Study [1.6436293069942312]
情報科学の急速な発展によって引き起こされる「次元のカルス」は、大きなデータセットを扱う際に悪影響を及ぼす可能性がある。
本研究では,スナロー探索アルゴリズム(SSA)の変種であるTent L'evy Flying Sparrow Searchアルゴリズム(TFSSA)を提案する。
TFSSAは、分類のためにパッキングパターンにおける機能の最も優れたサブセットを選択するために使用される。
論文 参考訳(メタデータ) (2022-09-20T15:12:10Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - A concise method for feature selection via normalized frequencies [0.0]
本稿では,普遍的特徴選択のための簡潔な手法を提案する。
提案手法は, フィルタ法とラッパー法を融合して行う。
評価結果から,提案手法は,精度,精度,リコール,Fスコア,AUCの点で,いくつかの最先端技術に優れた性能を示した。
論文 参考訳(メタデータ) (2021-06-10T15:29:54Z) - RFCBF: enhance the performance and stability of Fast Correlation-Based
Filter [6.781877756322586]
分類精度を向上させるために再サンプリング技術を組み合わせた新しいFCBF拡張RFCBFを提案する。
実験結果から,RFCBFアルゴリズムは従来の最先端手法よりも,分類精度と実行時間で有意に優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-05-30T12:36:32Z) - AutoSimulate: (Quickly) Learning Synthetic Data Generation [70.82315853981838]
目的の新たな微分可能近似に基づく最適な合成データ生成法を提案する。
提案手法は,学習データ生成の高速化(最大50Times$)と,実世界のテストデータセットの精度向上(+8.7%$)を実現している。
論文 参考訳(メタデータ) (2020-08-16T11:36:11Z) - Fast Template Matching and Update for Video Object Tracking and
Segmentation [56.465510428878]
私たちが取り組もうとしている主な課題は、フレームの列にまたがるマルチインスタンスの半教師付きビデオオブジェクトセグメンテーションである。
課題は、結果を予測するためのマッチングメソッドの選択と、ターゲットテンプレートを更新するかどうかを決定することである。
本稿では,これら2つの決定を同時に行うために,強化学習を利用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-04-16T08:58:45Z) - IVFS: Simple and Efficient Feature Selection for High Dimensional
Topology Preservation [33.424663018395684]
本稿では,サンプル類似性保存を向上する簡易かつ効果的な特徴選択アルゴリズムを提案する。
提案アルゴリズムは、全データの対距離と位相パターンを適切に保存することができる。
論文 参考訳(メタデータ) (2020-04-02T23:05:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。