論文の概要: Ensemble- and Distance-Based Feature Ranking for Unsupervised Learning
- arxiv url: http://arxiv.org/abs/2011.11679v1
- Date: Mon, 23 Nov 2020 19:17:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 02:56:29.663359
- Title: Ensemble- and Distance-Based Feature Ranking for Unsupervised Learning
- Title(参考訳): 教師なし学習のためのアンサンブルと距離に基づく特徴ランキング
- Authors: Matej Petkovi\'c, Dragi Kocev, Bla\v{z} \v{S}krlj, Sa\v{s}o
D\v{z}eroski
- Abstract要約: 教師なしの特徴ランク付けと選択のための2つの新しい手法(グループ)を提案する。
最初のグループには、予測クラスタリングツリーのアンサンブルから計算される機能ランキングスコア(Genie3スコア、RandomForestスコア)が含まれている。
2つ目の方法は、特徴ランクアルゴリズムのReliefファミリの教師なし拡張であるUReliefである。
- 参考スコア(独自算出の注目度): 2.7921429800866533
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this work, we propose two novel (groups of) methods for unsupervised
feature ranking and selection. The first group includes feature ranking scores
(Genie3 score, RandomForest score) that are computed from ensembles of
predictive clustering trees. The second method is URelief, the unsupervised
extension of the Relief family of feature ranking algorithms. Using 26
benchmark data sets and 5 baselines, we show that both the Genie3 score
(computed from the ensemble of extra trees) and the URelief method outperform
the existing methods and that Genie3 performs best overall, in terms of
predictive power of the top-ranked features. Additionally, we analyze the
influence of the hyper-parameters of the proposed methods on their performance,
and show that for the Genie3 score the highest quality is achieved by the most
efficient parameter configuration. Finally, we propose a way of discovering the
location of the features in the ranking, which are the most relevant in
reality.
- Abstract(参考訳): 本研究では,教師なし機能ランキングと選択のための2つの新しい手法(グループ)を提案する。
最初のグループは、予測クラスタリングツリーのアンサンブルから計算される特徴ランキングスコア(genie3スコア、ランダムフォレストスコア)を含む。
第2の方法はureliefであり、特徴ランク付けアルゴリズムのリリーフファミリの教師なし拡張である。
26のベンチマークデータセットと5つのベースラインを用いて、Genie3スコア(余分な木のアンサンブルから推定される)とUReliefメソッドの両方が既存の手法より優れており、Genie3は上位機能の予測能力において、全体的な性能が最も優れていることを示す。
さらに,提案手法のハイパーパラメータが性能に与える影響を解析し,genie3スコアにおいて最も効率的なパラメータ構成によって最高品質が達成されることを示す。
最後に,現実に最も関係のあるランキングにおける特徴の所在を探索する方法を提案する。
関連論文リスト
- On the Evaluation Consistency of Attribution-based Explanations [42.1421504321572]
本稿では,画像領域における属性メソッドのベンチマークを行うオープンプラットフォームであるMeta-Rankを紹介する。
1) 異なる設定下での属性評価手法の評価は、異なる性能ランキングを得ることができ、2) 多数のケースで矛盾するが、同一のトレーニング軌道に沿った個別のチェックポイントにまたがる顕著な一貫性を示す。
論文 参考訳(メタデータ) (2024-07-28T11:49:06Z) - RankSHAP: Shapley Value Based Feature Attributions for Learning to Rank [28.438428292619577]
我々は、機能属性コミュニティで人気がある軸論的ゲーム理論のアプローチを採用し、全てのランク付けベースの特徴属性メソッドが満足すべき基本公理のセットを特定する。
次にRang-SHAPを導入し、古典的なShapley値をランキングに拡張します。
また、既存の帰属アルゴリズムの公理解析を行い、提案した公理に準拠するかどうかを判断する。
論文 参考訳(メタデータ) (2024-05-03T04:43:24Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - An Evolutionary Correlation-aware Feature Selection Method for
Classification Problems [3.2550305883611244]
本稿では,3つの目標を達成するために分布推定アルゴリズムを提案する。
第一に、EDAの拡張として、適合度関数に基づいて競合する各イテレーションにおいて、提案手法は2つの個人しか生成しない。
第二に、各イテレーションにおける個人の機能数を決定するためのガイド技術を提供する。
本論文の主な貢献として,各特徴の重要さだけでなく,特徴間の相互作用についても考察できる。
論文 参考訳(メタデータ) (2021-10-16T20:20:43Z) - Hierarchical Ranking for Answer Selection [19.379777219863964]
階層的ランキング(hierarchical ranking)と呼ばれる,回答選択のための新しい戦略を提案する。
ポイントレベルのランキング、ペアレベルのランキング、リストレベルのランキングの3つのレベルを導入します。
WikiQA と TREC-QA の2つの公開データセットによる実験結果から,提案した階層的ランキングが有効であることを示す。
論文 参考訳(メタデータ) (2021-02-01T07:35:52Z) - Feature Importance Ranking for Deep Learning [7.287652818214449]
固定サイズの最適特徴部分集合を探索するための演算子とセレクタからなる新しいデュアルネットアーキテクチャを提案する。
学習中、オペレータは、セレクタによって生成された最適な特徴サブセット候補を介して教師付き学習タスクのために訓練される。
デプロイメントでは、セレクタが最適な特徴サブセットを生成し、機能の重要性をランク付けする一方、オペレータはテストデータの最適なサブセットに基づいて予測を行う。
論文 参考訳(メタデータ) (2020-10-18T12:20:27Z) - Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。
このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。
そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T16:52:51Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - SetRank: A Setwise Bayesian Approach for Collaborative Ranking from
Implicit Feedback [50.13745601531148]
提案手法は,提案システムにおける暗黙的フィードバックの特性に対応するために,協調的ランキング(SeetRank)のためのセッティングワイドベイズ的手法を提案する。
具体的には、SetRankは、新しい設定された選好比較の後方確率を最大化することを目的としている。
また、SetRankの理論解析により、余剰リスクの境界が$sqrtM/N$に比例できることを示す。
論文 参考訳(メタデータ) (2020-02-23T06:40:48Z) - PointHop++: A Lightweight Learning Model on Point Sets for 3D
Classification [55.887502438160304]
ポイントホップ法は、Zhangらによって、教師なし特徴抽出を伴う3Dポイントクラウド分類のために提案された。
1)モデルパラメータ数の観点からモデルの複雑さを減らし,2)クロスエントロピー基準に基づいて自動的に識別特徴を順序付けする。
ModelNet40ベンチマークデータセットで実施した実験により、PointHop++法がディープニューラルネットワーク(DNN)ソリューションと同等に動作し、他の教師なし特徴抽出法を上回る性能を示す。
論文 参考訳(メタデータ) (2020-02-09T04:49:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。