論文の概要: ReliefE: Feature Ranking in High-dimensional Spaces via Manifold
Embeddings
- arxiv url: http://arxiv.org/abs/2101.09577v1
- Date: Sat, 23 Jan 2021 20:23:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 10:25:07.683902
- Title: ReliefE: Feature Ranking in High-dimensional Spaces via Manifold
Embeddings
- Title(参考訳): ReliefE: マニフォールド埋め込みによる高次元空間の特徴ランク付け
- Authors: Bla\v{z} \v{S}krlj, Sa\v{s}o D\v{z}eroski, Nada Lavra\v{c} and Matej
Petkovi\'c
- Abstract要約: リリーフ・ファミリのアルゴリズムは、最も重要で無関係なインスタンスを反復的に計算することで、機能に重要性を割り当てる。
最近の埋め込みベース手法はコンパクトな低次元表現を学習する。
ReliefEアルゴリズムは高速で、機能ランキングが向上する可能性がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature ranking has been widely adopted in machine learning applications such
as high-throughput biology and social sciences. The approaches of the popular
Relief family of algorithms assign importances to features by iteratively
accounting for nearest relevant and irrelevant instances. Despite their high
utility, these algorithms can be computationally expensive and not-well suited
for high-dimensional sparse input spaces. In contrast, recent embedding-based
methods learn compact, low-dimensional representations, potentially
facilitating down-stream learning capabilities of conventional learners. This
paper explores how the Relief branch of algorithms can be adapted to benefit
from (Riemannian) manifold-based embeddings of instance and target spaces,
where a given embedding's dimensionality is intrinsic to the dimensionality of
the considered data set. The developed ReliefE algorithm is faster and can
result in better feature rankings, as shown by our evaluation on 20 real-life
data sets for multi-class and multi-label classification tasks. The utility of
ReliefE for high-dimensional data sets is ensured by its implementation that
utilizes sparse matrix algebraic operations. Finally, the relation of ReliefE
to other ranking algorithms is studied via the Fuzzy Jaccard Index.
- Abstract(参考訳): 特徴ランキングは、高スループット生物学や社会科学などの機械学習アプリケーションで広く採用されている。
一般的なレリーフ・ファミリのアルゴリズムのアプローチは、最も重要で無関係なインスタンスを反復的に計算することで、特徴に重要性を割り当てる。
高い実用性にもかかわらず、これらのアルゴリズムは計算コストが高く、高次元スパース入力空間に適している。
対照的に、最近の埋め込み型手法はコンパクトで低次元の表現を学習し、従来の学習者の下流学習能力を促進する可能性がある。
本稿では、与えられた埋め込みの次元性が考慮されたデータセットの次元性に内在する、例と対象空間の(リーマン多様体に基づく)埋め込みの恩恵を受けるアルゴリズムのレリーフブランチについて検討する。
開発したReliefEアルゴリズムはより高速で,マルチクラスおよびマルチラベル分類タスクを対象とした20のリアルタイムデータセットの評価結果から,より優れた特徴ランク付けを実現することができる。
高次元データセットに対するReliefEの有用性は、スパース行列代数演算を利用する実装によって保証される。
最後に,他のランキングアルゴリズムとの関係をファジィjaccard indexを用いて検討する。
関連論文リスト
- Machine Learning Training Optimization using the Barycentric Correction
Procedure [0.0]
本研究では,機械学習アルゴリズムとBCP(Barycentric correct procedure)と呼ばれる効率的な手法を組み合わせることを提案する。
この組み合わせによって、実データと合成データの時間に関する大きな利点が得られ、インスタンス数や次元が増加すると精度を損なうことなく得られることがわかった。
論文 参考訳(メタデータ) (2024-03-01T13:56:36Z) - Spectral Entry-wise Matrix Estimation for Low-Rank Reinforcement
Learning [53.445068584013896]
低ランク構造を持つ強化学習(RL)における行列推定問題について検討した。
低ランク帯では、回収される行列は期待される腕の報酬を指定し、低ランクマルコフ決定プロセス(MDP)では、例えばMDPの遷移カーネルを特徴付ける。
簡単なスペクトルベースの行列推定手法は,行列の特異部分空間を効率よく復元し,ほぼ最小の入力誤差を示すことを示す。
論文 参考訳(メタデータ) (2023-10-10T17:06:41Z) - Provably Efficient Representation Learning with Tractable Planning in
Low-Rank POMDP [81.00800920928621]
部分的に観測可能なマルコフ決定過程(POMDP)における表現学習の研究
まず,不確実性(OFU)に直面した最大推定(MLE)と楽観性を組み合わせた復調性POMDPのアルゴリズムを提案する。
次に、このアルゴリズムをより広範な$gamma$-observable POMDPのクラスで機能させる方法を示す。
論文 参考訳(メタデータ) (2023-06-21T16:04:03Z) - Efficient Learning of Minimax Risk Classifiers in High Dimensions [3.093890460224435]
高次元データは、医療やゲノム学など、数万もの特徴を持つ領域で一般的である。
本稿では,このような手法を用いて,最近提案されたミニマックスリスク分類器の効率的な学習アルゴリズムを提案する。
複数の高次元データセットに対する実験により,提案アルゴリズムは高次元シナリオにおいて効率的であることが示された。
論文 参考訳(メタデータ) (2023-06-11T11:08:20Z) - Learning Structure Aware Deep Spectral Embedding [11.509692423756448]
本稿では, スペクトル埋込み損失と構造保存損失を組み合わせ, 深層スペクトルの埋込みを考慮した新しい構造解析手法を提案する。
両タイプの情報を同時に符号化し,構造認識型スペクトル埋め込みを生成するディープニューラルネットワークアーキテクチャを提案する。
提案アルゴリズムは,公開されている6つの実世界のデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-05-14T18:18:05Z) - Linearized Wasserstein dimensionality reduction with approximation
guarantees [65.16758672591365]
LOT Wassmap は、ワーッサーシュタイン空間の低次元構造を明らかにするための計算可能なアルゴリズムである。
我々は,LOT Wassmapが正しい埋め込みを実現し,サンプルサイズの増加とともに品質が向上することを示す。
また、LOT Wassmapがペア距離計算に依存するアルゴリズムと比較して計算コストを大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-02-14T22:12:16Z) - Analysis of Self-Supervised Learning and Dimensionality Reduction
Methods in Clustering-Based Active Learning for Speech Emotion Recognition [3.3670613441132984]
本稿では,クラスタリングに基づくアクティブラーニング(AL)手法における特徴空間の構造の使い方を示す。
本稿では,クラスタリングに基づくALの関数化手法の探索において,CPCと多次元化手法を組み合わせる。
音声感情認識システム展開のシミュレーション実験により,特徴空間の局所的および大域的トポロジをALに応用できることが示唆された。
論文 参考訳(メタデータ) (2022-06-21T08:44:55Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Progressively Pretrained Dense Corpus Index for Open-Domain Question
Answering [87.32442219333046]
本稿では,段落エンコーダを事前学習するための簡易かつ資源効率の高い手法を提案する。
本手法は,事前学習に7倍の計算資源を使用する既存の高密度検索法より優れている。
論文 参考訳(メタデータ) (2020-04-30T18:09:50Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z) - Multi-Objective Genetic Programming for Manifold Learning: Balancing
Quality and Dimensionality [4.4181317696554325]
最先端の多様体学習アルゴリズムはこの変換の実行方法において不透明である。
多様体の品質と次元の競合する目的を自動的にバランスさせる多目的アプローチを導入する。
提案手法は,基礎および最先端の多様体学習手法と競合する。
論文 参考訳(メタデータ) (2020-01-05T23:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。