論文の概要: A Novel Community Detection Based Genetic Algorithm for Feature
Selection
- arxiv url: http://arxiv.org/abs/2008.03543v1
- Date: Sat, 8 Aug 2020 15:39:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 09:14:48.637875
- Title: A Novel Community Detection Based Genetic Algorithm for Feature
Selection
- Title(参考訳): 特徴選択のための新しいコミュニティ検出に基づく遺伝的アルゴリズム
- Authors: Mehrdad Rostami, Kamal Berahmand, Saman Forouzandeh
- Abstract要約: 著者らは3つのステップで機能するコミュニティ検出に基づく遺伝的アルゴリズムを提案する。
提案手法の性能から,9つのベンチマーク分類問題を解析した。
- 参考スコア(独自算出の注目度): 3.8848561367220276
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The selection of features is an essential data preprocessing stage in data
mining. The core principle of feature selection seems to be to pick a subset of
possible features by excluding features with almost no predictive information
as well as highly associated redundant features. In the past several years, a
variety of meta-heuristic methods were introduced to eliminate redundant and
irrelevant features as much as possible from high-dimensional datasets. Among
the main disadvantages of present meta-heuristic based approaches is that they
are often neglecting the correlation between a set of selected features. In
this article, for the purpose of feature selection, the authors propose a
genetic algorithm based on community detection, which functions in three steps.
The feature similarities are calculated in the first step. The features are
classified by community detection algorithms into clusters throughout the
second step. In the third step, features are picked by a genetic algorithm with
a new community-based repair operation. Nine benchmark classification problems
were analyzed in terms of the performance of the presented approach. Also, the
authors have compared the efficiency of the proposed approach with the findings
from four available algorithms for feature selection. The findings indicate
that the new approach continuously yields improved classification accuracy.
- Abstract(参考訳): 特徴の選択は、データマイニングにおける重要なデータ前処理段階である。
機能選択の中核的な原則は、予測情報をほとんど含まない機能と高度に関連付けられた冗長機能を取り除き、可能な機能のサブセットを選択することである。
過去数年間、高次元データセットから可能な限り冗長で無関係な特徴を取り除くために様々なメタヒューリスティック手法が導入された。
現在のメタヒューリスティックなアプローチの主な欠点は、選択された機能のセット間の相関をしばしば無視していることだ。
本稿では,特徴選択のために,コミュニティ検出に基づく遺伝的アルゴリズムを提案する。
特徴類似度を第1ステップで算出する。
この機能はコミュニティ検出アルゴリズムによって第2段階を通してクラスタに分類される。
第3のステップでは、新しいコミュニティベースの修復操作を備えた遺伝的アルゴリズムによって特徴が選択される。
提案手法の性能の観点から9つのベンチマーク分類問題を解析した。
また,提案手法の効率を,特徴選択のための4つのアルゴリズムから得られた結果と比較した。
その結果,新しいアプローチは継続的に分類精度を向上させることが示唆された。
関連論文リスト
- Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - A Performance-Driven Benchmark for Feature Selection in Tabular Deep
Learning [131.2910403490434]
データサイエンティストは通常、データセットにできるだけ多くの機能を集め、既存の機能から新しい機能を設計する。
既存のタブ形式の特徴選択のためのベンチマークでは、古典的な下流モデル、おもちゃの合成データセット、あるいは下流のパフォーマンスに基づいて特徴セレクタを評価していない。
変換器を含む下流ニューラルネットワーク上で評価された課題のある特徴選択ベンチマークを構築した。
また,従来の特徴選択法よりも高い性能を有するニューラルネットワークのための,Lassoのインプット・グラディエント・ベース・アナログも提案する。
論文 参考訳(メタデータ) (2023-11-10T05:26:10Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Sequential Attention for Feature Selection [12.89764845700709]
本稿では,ニューラルネットワークの最先端な実験結果を実現するSequential Attentionと呼ばれる特徴選択アルゴリズムを提案する。
この設定への適応が古典的直交整合探索(OMP)アルゴリズムと等価であることを示すことによって、線形回帰のためのアルゴリズムの理論的な洞察を与える。
論文 参考訳(メタデータ) (2022-09-29T15:49:06Z) - Fair Feature Subset Selection using Multiobjective Genetic Algorithm [0.0]
フェアネスと精度を両立させる特徴部分選択手法を提案する。
モデル性能の指標としてF1-Scoreを用いる。
最も一般的なフェアネスベンチマークデータセットの実験では、進化的アルゴリズムを用いることで、フェアネスと精度のトレードオフを効果的に探索できることが示されている。
論文 参考訳(メタデータ) (2022-04-30T22:51:19Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - An Evolutionary Correlation-aware Feature Selection Method for
Classification Problems [3.2550305883611244]
本稿では,3つの目標を達成するために分布推定アルゴリズムを提案する。
第一に、EDAの拡張として、適合度関数に基づいて競合する各イテレーションにおいて、提案手法は2つの個人しか生成しない。
第二に、各イテレーションにおける個人の機能数を決定するためのガイド技術を提供する。
本論文の主な貢献として,各特徴の重要さだけでなく,特徴間の相互作用についても考察できる。
論文 参考訳(メタデータ) (2021-10-16T20:20:43Z) - A Systematic Characterization of Sampling Algorithms for Open-ended
Language Generation [71.31905141672529]
本稿では,自己回帰型言語モデルに広く採用されている祖先サンプリングアルゴリズムについて検討する。
エントロピー低減, 秩序保存, 斜面保全の3つの重要な特性を同定した。
これらの特性を満たすサンプリングアルゴリズムのセットが,既存のサンプリングアルゴリズムと同等に動作することがわかった。
論文 参考訳(メタデータ) (2020-09-15T17:28:42Z) - On-the-Fly Joint Feature Selection and Classification [16.84451472788859]
本稿では,共同で特徴選択と分類を行うためのフレームワークを提案する。
我々は、関連する最適化問題の最適解を導出し、その構造を解析する。
提案アルゴリズムの性能を複数の公開データセット上で評価する。
論文 参考訳(メタデータ) (2020-04-21T19:19:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。