論文の概要: Worse than Random: The Importance of a Baseline for Unsupervised Feature Selection
- arxiv url: http://arxiv.org/abs/2605.22973v1
- Date: Thu, 21 May 2026 19:04:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.067549
- Title: Worse than Random: The Importance of a Baseline for Unsupervised Feature Selection
- Title(参考訳): ランダムよりも悪い: 教師なしの特徴選択のためのベースラインの重要性
- Authors: Muhammad Rajabinasab, Michael E. Houle, Oussama Chelly, Arthur Zimek,
- Abstract要約: 本稿では,教師なし特徴選択法を評価するためのベースラインとして,ランダムな特徴選択を提案する。
教師なし特徴選択における最先端手法の多くは、性能と効率の両面でランダムな特徴選択により性能が向上していることを示す。
- 参考スコア(独自算出の注目度): 3.4555387017929866
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many novel unsupervised feature selection methods are proposed each year, yet their empirical evaluation is limited to supervised and unsupervised evaluation metrics computed on selected datasets, along with comparisons to existing methods. However, in the absence of an established evaluation baseline, it is difficult to determine the value added to the existing literature by each of these methods, and how effective their underlying approaches are. We propose using random feature selection as a baseline for evaluating the unsupervised feature selection methods. We empirically show that many of the state-of-the-art methods in unsupervised feature selection are outperformed by random feature selection in both performance and efficiency. Accordingly, we emphasize on the strict requirement of considering random feature selection as a baseline in the development process of novel unsupervised feature selection methods to ensure a consistent improvement over random feature selection.
- Abstract(参考訳): 多くの新しい教師なし特徴選択法が毎年提案されているが、その経験的評価は、既存の手法との比較とともに、選択されたデータセット上で計算された教師なし評価指標に限られている。
しかし, 評価基準が確立されていない場合, 既存の文献に付加される価値を各手法で決定することは困難であり, その基礎となるアプローチがどの程度有効かは明らかでない。
本稿では,教師なし特徴選択法を評価するためのベースラインとして,ランダムな特徴選択を提案する。
教師なし特徴選択における最先端の手法の多くは、性能と効率の両面でランダムな特徴選択により性能が向上していることを実証的に示す。
そこで我々は、ランダムな特徴選択よりも一貫した改善を確実にするために、新しい教師なし特徴選択法の開発プロセスにおいて、ランダムな特徴選択をベースラインとして考えるという厳密な要件を強調した。
関連論文リスト
- A Principled Approach to Randomized Selection under Uncertainty: Applications to Peer Review and Grant Funding [61.86327960322782]
本稿では,各項目の品質の間隔推定に基づくランダム化意思決定の枠組みを提案する。
最適化に基づく最適化手法であるMERITを導入する。
MERITが既存のアプローチで保証されていない望ましい公理特性を満たすことを証明している。
論文 参考訳(メタデータ) (2025-06-23T19:59:30Z) - Know When to Abstain: Optimal Selective Classification with Likelihood Ratios [10.317060648446828]
我々は、Neyman-Pearson補題のレンズを通して最適な選択関数の設計を再考する。
この視点は、いくつかのポストホック選択ベースラインの挙動を統一し、選択分類への新たなアプローチを動機付けていることを示す。
提案手法は,教師付き学習モデルと視覚言語モデルの両方を含む,様々な視覚・言語タスクにまたがって評価する。
論文 参考訳(メタデータ) (2025-05-21T01:26:21Z) - How to Select Datapoints for Efficient Human Evaluation of NLG Models? [57.60407340254572]
我々は,人間の評価に最も有用なデータポイントを得るために,セレクタスイートを開発し,分析する。
本研究では,自動測定値の分散に基づくセレクタ,モデル出力の多様性,項目応答理論がランダム選択より優れていることを示す。
特に,情報源に基づく推定手法を導入し,情報源のテキストに基づいて人体評価に有用な項目を推定する。
論文 参考訳(メタデータ) (2025-01-30T10:33:26Z) - Bilevel Optimization for Feature Selection in the Data-Driven Newsvendor
Problem [8.281391209717105]
本稿では、意思決定者が過去のデータにアクセス可能な機能ベースのニュースベンダー問題について検討する。
そこで本研究では,スパースモデル,説明可能なモデル,およびアウト・オブ・サンプル性能の改善を目的とした特徴選択について検討する。
本稿では,2レベルプログラムに対する混合整数線形プログラムの修正について述べる。
論文 参考訳(メタデータ) (2022-09-12T08:52:26Z) - Black-box Selective Inference via Bootstrapping [5.960626580825523]
条件選択推論は選択イベントの正確な特徴を必要とするが、ラッソのようないくつかの例を除いてしばしば利用できない。
この研究は、選択イベントを推定するための一般的なアプローチを導入し、選択イベントに条件付けされた実行可能な推論を容易にすることで、この問題に対処する。
論文 参考訳(メタデータ) (2022-03-28T05:18:21Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Joint Adaptive Graph and Structured Sparsity Regularization for
Unsupervised Feature Selection [6.41804410246642]
本稿では,共同適応グラフと構造付き空間正規化unsupervised feature selection (JASFS)法を提案する。
最適な機能のサブセットがグループで選択され、選択された機能の数が自動的に決定される。
8つのベンチマーク実験の結果,提案手法の有効性と有効性を示した。
論文 参考訳(メタデータ) (2020-10-09T08:17:04Z) - Outlier Detection Ensemble with Embedded Feature Selection [42.8338013000469]
組込み特徴選択(ODEFS)を用いた外乱検出アンサンブルフレームワークを提案する。
各ランダムなサブサンプリングベースの学習コンポーネントに対して、ODEFSは、特徴選択と外れ値検出をペアのランキング式に統一する。
我々は、特徴選択と例選択を同時に最適化するために閾値付き自己評価学習を採用する。
論文 参考訳(メタデータ) (2020-01-15T13:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。