論文の概要: On Evaluation of Unsupervised Feature Selection for Pattern Classification
- arxiv url: http://arxiv.org/abs/2601.08257v2
- Date: Mon, 19 Jan 2026 11:59:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 18:45:13.498111
- Title: On Evaluation of Unsupervised Feature Selection for Pattern Classification
- Title(参考訳): パターン分類のための教師なし特徴選択の評価について
- Authors: Gyu-Il Kim, Dae-Won Kim, Jaesung Lee,
- Abstract要約: 本研究では,マルチラベル分類フレームワークを用いて評価パラダイムを再検討する。
複数の代表的手法を用いた21のマルチラベルデータセットの実験により、シングルラベル設定で報告されたデータセットとパフォーマンスランキングが著しく異なることが示された。
- 参考スコア(独自算出の注目度): 6.177907646830357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised feature selection aims to identify a compact subset of features that captures the intrinsic structure of data without supervised label. Most existing studies evaluate the performance of methods using the single-label dataset that can be instantiated by selecting a label from multi-label data while maintaining the original features. Because the chosen label can vary arbitrarily depending on the experimental setting, the superiority among compared methods can be changed with regard to which label happens to be selected. Thus, evaluating unsupervised feature selection methods based solely on single-label accuracy is unreasonable for assessing their true discriminative ability. This study revisits this evaluation paradigm by adopting a multi-label classification framework. Experiments on 21 multi-label datasets using several representative methods demonstrate that performance rankings differ markedly from those reported under single-label settings, suggesting the possibility of multi-label evaluation settings for fair and reliable comparison of unsupervised feature selection methods.
- Abstract(参考訳): 非教師付き特徴選択は、教師付きラベルなしでデータ固有の構造をキャプチャする特徴のコンパクトなサブセットを特定することを目的としている。
既存の研究の多くは、元の特徴を維持しつつ、複数のラベルデータからラベルを選択してインスタンス化できる単一ラベルデータセットを用いた手法の性能を評価している。
選択されたラベルは、実験設定に応じて任意に変化するので、どのラベルが選択されたかで比較した方法の優越性を変更することができる。
したがって, 単一ラベル精度のみに基づく教師なし特徴選択法の評価は, 真の識別能力の評価には適さない。
本研究では,この評価パラダイムをマルチラベル分類フレームワークを用いて再検討する。
複数の代表的手法を用いた21のマルチラベルデータセットに対する実験により、シングルラベル設定下で報告されたものとは、性能ランキングが著しく異なることが示され、教師なし特徴選択方法の公平かつ信頼性の高い比較のためのマルチラベル評価設定の可能性が示唆された。
関連論文リスト
- One Size Does Not Fit All: Exploring Variable Thresholds for Distance-Based Multi-Label Text Classification [1.8165993946919816]
距離に基づく教師なしテキスト分類では、ラベルとテキスト間の意味的類似性を使用してラベルの関連性を決定する。
類似度分布は、モデル、データセット、さらにはラベルセットの間で統計的に有意な差異を示す。
検証セットを用いてラベル固有の閾値を最適化する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-10-13T08:52:14Z) - Least-Ambiguous Multi-Label Classifier [2.0482700732041397]
単陽性多言語学習(SPMLL)に対するモデルに依存しないアプローチを提案する。
本手法は,ラベル分布の仮定に頼らずに,シングルラベルトレーニングとマルチラベル評価の監督ギャップを埋める。
論文 参考訳(メタデータ) (2025-09-12T20:45:24Z) - Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Combining Self-labeling with Selective Sampling [2.0305676256390934]
この研究は、選択的サンプリングシナリオにおける自己ラベル技術とアクティブラーニングを組み合わせたものである。
選択したクラスに対してバイアスを課すことにより,自己ラベルの適用がパフォーマンスに悪影響を及ぼすことを示す。
提案手法は,現在の選択的サンプリング手法と一致し,より良い結果が得られる。
論文 参考訳(メタデータ) (2023-01-11T11:58:45Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Few-shot Learning for Multi-label Intent Detection [59.66787898744991]
State-of-the-art work estimates label-instancelevance scores and using threshold to select multiple associated intent labels。
2つのデータセットの実験により、提案モデルが1ショットと5ショットの両方の設定において強いベースラインを著しく上回ることが示された。
論文 参考訳(メタデータ) (2020-10-11T14:42:18Z) - SPL-MLL: Selecting Predictable Landmarks for Multi-Label Learning [87.27700889147144]
我々は、入力(予測可能)に応じて予測しやすく、他の可能なラベル(表現可能)をうまく回復できるランドマークとして、ラベルの小さなサブセットを選択することを提案する。
我々は,ADM(Alternating Direction Method)を用いてこの問題を解決する。実世界のデータセットに関する実証研究により,本手法が他の最先端手法よりも優れた分類性能を実現することを示す。
論文 参考訳(メタデータ) (2020-08-16T11:07:44Z) - Unsupervised Person Re-identification via Multi-label Classification [55.65870468861157]
本稿では,教師なしのReIDを多ラベル分類タスクとして定式化し,段階的に真のラベルを求める。
提案手法は,まず,各人物画像に単一クラスラベルを割り当てることから始まり,ラベル予測のために更新されたReIDモデルを活用することで,多ラベル分類へと進化する。
マルチラベル分類におけるReIDモデルのトレーニング効率を高めるために,メモリベースマルチラベル分類損失(MMCL)を提案する。
論文 参考訳(メタデータ) (2020-04-20T12:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。