論文の概要: MVMR-FS : Non-parametric feature selection algorithm based on Maximum
inter-class Variation and Minimum Redundancy
- arxiv url: http://arxiv.org/abs/2307.14643v1
- Date: Thu, 27 Jul 2023 06:33:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-28 15:28:58.748057
- Title: MVMR-FS : Non-parametric feature selection algorithm based on Maximum
inter-class Variation and Minimum Redundancy
- Title(参考訳): MVMR-FS : クラス間最大変動と最小冗長性に基づく非パラメトリック特徴選択アルゴリズム
- Authors: Haitao Nie, Shengbo Zhang, Bin Xie
- Abstract要約: クラス間の最大変動と最小冗長度に基づく非パラメトリック特徴選択アルゴリズムを提案する。
10種類の最先端手法と比較して、MVMR-FSは最も高い平均精度を達成し、5%から11%の精度向上を実現している。
- 参考スコア(独自算出の注目度): 1.2522889958051284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How to accurately measure the relevance and redundancy of features is an
age-old challenge in the field of feature selection. However, existing
filter-based feature selection methods cannot directly measure redundancy for
continuous data. In addition, most methods rely on manually specifying the
number of features, which may introduce errors in the absence of expert
knowledge. In this paper, we propose a non-parametric feature selection
algorithm based on maximum inter-class variation and minimum redundancy,
abbreviated as MVMR-FS. We first introduce supervised and unsupervised kernel
density estimation on the features to capture their similarities and
differences in inter-class and overall distributions. Subsequently, we present
the criteria for maximum inter-class variation and minimum redundancy (MVMR),
wherein the inter-class probability distributions are employed to reflect
feature relevance and the distances between overall probability distributions
are used to quantify redundancy. Finally, we employ an AGA to search for the
feature subset that minimizes the MVMR. Compared with ten state-of-the-art
methods, MVMR-FS achieves the highest average accuracy and improves the
accuracy by 5% to 11%.
- Abstract(参考訳): 機能の妥当性と冗長性を正確に測定する方法は、機能選択の分野における長年の課題である。
しかし、既存のフィルタに基づく特徴選択手法では、連続データに対する冗長性を直接測定することはできない。
加えて、ほとんどのメソッドは、専門家の知識がなければエラーを引き起こす可能性のある機能の数を手動で指定する。
本稿では,MVMR-FSを省略した最大クラス間変動と最小冗長性に基づく非パラメトリック特徴選択アルゴリズムを提案する。
まず、その類似点とクラス間分布と全体分布の差を捉えるために、カーネル密度の教師付きおよび教師なし推定を導入する。
次に,クラス間の最大変動と最小冗長性(MVMR)の基準を示し,クラス間確率分布を用いて特徴の関連性を反映し,全体の確率分布間の距離を用いて冗長性を定量化する。
最後に、MVMRを最小限に抑える機能サブセットを探すためにAGAを使用します。
10種類の最先端手法と比較して、MVMR-FSは高い平均精度を達成し、5%から11%の精度向上を実現している。
関連論文リスト
- Distance-based mutual congestion feature selection with genetic algorithm for high-dimensional medical datasets [2.6037922505725675]
あらゆるデータ分布に適用可能な、普遍的に最適な特徴選択方法はありません。
本稿では, 応答変数の特徴値と観測値の分布を考慮したフィルタ手法として, 距離に基づくMutual Congestion (DMC)を提案する。
ハイブリッドDMC-GAwARはバイナリ分類データセットに適用でき、最近の研究よりもその優位性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-07-22T13:08:50Z) - Learning Algorithms for Verification of Markov Decision Processes [20.5951492453299]
マルコフ決定過程(MDP)の検証に学習アルゴリズムを適用するための一般的な枠組みを提案する。
提案するフレームワークは,検証における中核的な問題である確率的到達性に重点を置いている。
論文 参考訳(メタデータ) (2024-03-14T08:54:19Z) - Feature Selection via Maximizing Distances between Class Conditional
Distributions [9.596923373834093]
積分確率測定(IPMs)により測定されたクラス条件分布間の距離に基づく新しい特徴選択フレームワークを提案する。
本フレームワークは, 教師付き分類のための分布感覚における特徴の識別的情報を直接探索する。
実験により,本フレームワークは,摂動に対する分類精度とロバスト性の観点から,最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-01-15T06:10:10Z) - Anomaly Detection Under Uncertainty Using Distributionally Robust
Optimization Approach [0.9217021281095907]
異常検出は、大多数のパターンに従わないデータポイントを見つける問題として定義される。
1クラスのサポートベクトルマシン(SVM)メソッドは、通常のデータポイントと異常を区別するための決定境界を見つけることを目的としている。
誤分類の確率が低い分布的に頑健な確率制約モデルを提案する。
論文 参考訳(メタデータ) (2023-12-03T06:13:22Z) - A Targeted Accuracy Diagnostic for Variational Approximations [8.969208467611896]
変分推論(VI)はマルコフ・チェイン・モンテカルロ(MCMC)の魅力的な代替品である
既存の方法は、全変分分布の品質を特徴付ける。
配電近似精度(TADDAA)のためのTArgeted診断法を提案する。
論文 参考訳(メタデータ) (2023-02-24T02:50:18Z) - Optimization of Annealed Importance Sampling Hyperparameters [77.34726150561087]
Annealed Importance Smpling (AIS) は、深層生成モデルの難易度を推定するために使われる一般的なアルゴリズムである。
本稿では、フレキシブルな中間分布を持つパラメータAISプロセスを提案し、サンプリングに少ないステップを使用するようにブリッジング分布を最適化する。
我々は, 最適化AISの性能評価を行い, 深部生成モデルの限界推定を行い, 他の推定値と比較した。
論文 参考訳(メタデータ) (2022-09-27T07:58:25Z) - Meta Learning Low Rank Covariance Factors for Energy-Based Deterministic
Uncertainty [58.144520501201995]
ニューラルネットワーク層のBi-Lipschitz正規化は、各レイヤの特徴空間におけるデータインスタンス間の相対距離を保存する。
注意セットエンコーダを用いて,タスク固有の共分散行列を効率的に構築するために,対角的,対角的,低ランクな要素のメタ学習を提案する。
また,最終的な予測分布を達成するために,スケールしたエネルギーを利用する推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-12T22:04:19Z) - Hybrid Random Features [60.116392415715275]
ハイブリッドランダム特徴(HRF)と呼ばれるソフトマックスとガウス核の線形化のための新しいランダム特徴法を提案する。
HRFは、カーネル推定の品質を自動的に適応し、定義された関心領域の最も正確な近似を提供する。
論文 参考訳(メタデータ) (2021-10-08T20:22:59Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - A Discriminative Technique for Multiple-Source Adaptation [55.5865665284915]
本稿では,マルチソース適応のための新しい識別手法,MSA,問題を提案する。
我々のソリューションは、ソースドメインからのラベルなしデータから容易に正確に推定できる条件付き確率のみを必要とする。
実世界の応用実験により、新しい識別的MSAアルゴリズムは、以前の生成解よりも優れていたことがさらに証明された。
論文 参考訳(メタデータ) (2020-08-25T14:06:15Z) - Rethink Maximum Mean Discrepancy for Domain Adaptation [77.2560592127872]
本論文は,(1)最大平均距離の最小化は,それぞれソースとクラス内距離の最大化に等しいが,その差を暗黙の重みと共同で最小化し,特徴判別性は低下する,という2つの本質的な事実を理論的に証明する。
いくつかのベンチマークデータセットの実験は、理論的な結果の有効性を証明しただけでなく、我々のアプローチが比較した最先端手法よりも大幅に向上できることを実証した。
論文 参考訳(メタデータ) (2020-07-01T18:25:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。