論文の概要: Cascaded two-stage feature clustering and selection via separability and consistency in fuzzy decision systems
- arxiv url: http://arxiv.org/abs/2407.15893v1
- Date: Mon, 22 Jul 2024 02:44:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-24 21:34:58.534862
- Title: Cascaded two-stage feature clustering and selection via separability and consistency in fuzzy decision systems
- Title(参考訳): ファジィ決定系における分離性と整合性による2段階特徴クラスタリングと選択
- Authors: Yuepeng Chen, Weiping Ding, Hengrong Ju, Jiashuang Huang, Tao Yin,
- Abstract要約: 特徴選択は、計算複雑性を減らし、モデルパフォーマンスを改善し、オーバーフィッティングのリスクを軽減することができるため、機械学習において重要なテクニックである。
本稿では,ファジィ決定システムのための2段階特徴クラスタリングと選択アルゴリズムを提案する。
提案アルゴリズムの有効性を18の公開データセットと現実世界の統合失調症データセットを用いて評価した。
- 参考スコア(独自算出の注目度): 8.048511956662336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature selection is a vital technique in machine learning, as it can reduce computational complexity, improve model performance, and mitigate the risk of overfitting. However, the increasing complexity and dimensionality of datasets pose significant challenges in the selection of features. Focusing on these challenges, this paper proposes a cascaded two-stage feature clustering and selection algorithm for fuzzy decision systems. In the first stage, we reduce the search space by clustering relevant features and addressing inter-feature redundancy. In the second stage, a clustering-based sequentially forward selection method that explores the global and local structure of data is presented. We propose a novel metric for assessing the significance of features, which considers both global separability and local consistency. Global separability measures the degree of intra-class cohesion and inter-class separation based on fuzzy membership, providing a comprehensive understanding of data separability. Meanwhile, local consistency leverages the fuzzy neighborhood rough set model to capture uncertainty and fuzziness in the data. The effectiveness of our proposed algorithm is evaluated through experiments conducted on 18 public datasets and a real-world schizophrenia dataset. The experiment results demonstrate our algorithm's superiority over benchmarking algorithms in both classification accuracy and the number of selected features.
- Abstract(参考訳): 特徴選択は、計算複雑性を減らし、モデルパフォーマンスを改善し、オーバーフィッティングのリスクを軽減することができるため、機械学習において重要なテクニックである。
しかし、データセットの複雑さと次元性の増大は、特徴の選択に重大な課題をもたらす。
これらの課題に焦点をあて,ファジィ意思決定システムのための2段階特徴クラスタリングと選択アルゴリズムを提案する。
第1段階では,関連する特徴をクラスタリングし,機能間冗長性に対処することにより,探索空間を縮小する。
第2段階では、データの大域的および局所的な構造を探索するクラスタリングに基づくシーケンシャルな前方選択法を示す。
本稿では,グローバルな分離性と局所的な一貫性を両立させる特徴の意義を評価するための新しい指標を提案する。
グローバルセパビリティはファジィメンバシップに基づくクラス内凝集度とクラス間分離度を測定し、データセパビリティの包括的な理解を提供する。
一方、局所的な一貫性はファジィ近傍粗設定モデルを利用して、データの不確実性とファジィ性を捉える。
提案アルゴリズムの有効性を18の公開データセットと現実世界の統合失調症データセットを用いて評価した。
実験結果は,分類精度と選択した特徴数の両方において,ベンチマークアルゴリズムよりもアルゴリズムの方が優れていることを示す。
関連論文リスト
- Unsupervised feature selection algorithm framework based on neighborhood interval disturbance fusion [8.869067846581943]
多くの教師なし特徴選択アルゴリズムの普遍性と安定性はデータセット構造に大きな影響を与えている。
本稿では、データセットを前処理し、間隔法を用いてデータセットを近似し、新しい間隔データセットの利点と欠点を実験的に検証する。
論文 参考訳(メタデータ) (2024-10-20T05:39:04Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Contextual Model Aggregation for Fast and Robust Federated Learning in
Edge Computing [88.76112371510999]
フェデレーション学習は、ネットワークエッジにおける分散機械学習の第一候補である。
既存のアルゴリズムは、性能の緩やかな収束や堅牢性の問題に直面している。
そこで本稿では,損失低減に対する最適コンテキスト依存境界を実現するためのコンテキストアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T21:42:31Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Fast and Interpretable Consensus Clustering via Minipatch Learning [0.0]
IMPACC: Interpretable MiniPatch Adaptive Consensus Clustering を開発した。
我々は、信頼性と計算コストの両面で改善された観測のための適応型サンプリング手法を開発した。
その結果,より正確で解釈可能なクラスタソリューションが得られた。
論文 参考訳(メタデータ) (2021-10-05T22:39:28Z) - A review of systematic selection of clustering algorithms and their
evaluation [0.0]
本稿では,クラスタリングアルゴリズムとそれに対応する検証概念の体系的選択ロジックを同定することを目的とする。
目標は、潜在的なユーザが自分のニーズと基盤となるデータクラスタリングの問題の性質に最も適したアルゴリズムを選択できるようにすることだ。
論文 参考訳(メタデータ) (2021-06-24T07:01:46Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - On-the-Fly Joint Feature Selection and Classification [16.84451472788859]
本稿では,共同で特徴選択と分類を行うためのフレームワークを提案する。
我々は、関連する最適化問題の最適解を導出し、その構造を解析する。
提案アルゴリズムの性能を複数の公開データセット上で評価する。
論文 参考訳(メタデータ) (2020-04-21T19:19:39Z) - Outlier Detection Ensemble with Embedded Feature Selection [42.8338013000469]
組込み特徴選択(ODEFS)を用いた外乱検出アンサンブルフレームワークを提案する。
各ランダムなサブサンプリングベースの学習コンポーネントに対して、ODEFSは、特徴選択と外れ値検出をペアのランキング式に統一する。
我々は、特徴選択と例選択を同時に最適化するために閾値付き自己評価学習を採用する。
論文 参考訳(メタデータ) (2020-01-15T13:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。