論文の概要: An Online Sparse Streaming Feature Selection Algorithm
- arxiv url: http://arxiv.org/abs/2208.01562v1
- Date: Tue, 2 Aug 2022 16:08:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:32:59.879291
- Title: An Online Sparse Streaming Feature Selection Algorithm
- Title(参考訳): オンラインスパースストリーミング特徴選択アルゴリズム
- Authors: Feilong Chen, Di Wu, Jie Yang, Yi He
- Abstract要約: 我々は不確実性のあるオンラインスパースストリーミング特徴選択アルゴリズム(OS2FSU)を提案する。
OS2FSUは,1)特徴選択の導出前の疎ストリーミング特徴の欠落を事前に推定するために潜時因子分析を用い,2)特徴選択を行う際の推定ストリーミング特徴とラベルの不確かさを軽減するためにファジィ論理と周辺粗さ集合を用いる。
結果、OS2FSUはOSFSでデータ不足が発生した場合、競合より優れていることが示された。
- 参考スコア(独自算出の注目度): 14.414813893419506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online streaming feature selection (OSFS), which conducts feature selection
in an online manner, plays an important role in dealing with high-dimensional
data. In many real applications such as intelligent healthcare platform,
streaming feature always has some missing data, which raises a crucial
challenge in conducting OSFS, i.e., how to establish the uncertain relationship
between sparse streaming features and labels. Unfortunately, existing OSFS
algorithms never consider such uncertain relationship. To fill this gap, we in
this paper propose an online sparse streaming feature selection with
uncertainty (OS2FSU) algorithm. OS2FSU consists of two main parts: 1) latent
factor analysis is utilized to pre-estimate the missing data in sparse
streaming features before con-ducting feature selection, and 2) fuzzy logic and
neighborhood rough set are employed to alleviate the uncertainty between
estimated streaming features and labels during conducting feature selection. In
the experiments, OS2FSU is compared with five state-of-the-art OSFS algorithms
on six real datasets. The results demonstrate that OS2FSU outperforms its
competitors when missing data are encountered in OSFS.
- Abstract(参考訳): オンラインストリーミング機能選択(osfs: online streaming feature selection)は,高次元データを扱う上で重要な役割を担っている。
インテリジェントヘルスケアプラットフォームのような現実の多くのアプリケーションでは、ストリーミング機能は常に欠落したデータを持っているため、OSFSを実行する上で重要な課題、すなわちスパースストリーミング機能とラベルの間の不確実な関係を確立する方法が生じる。
残念ながら、既存のosfsアルゴリズムはそのような不確定な関係を決して考慮しない。
本稿では,このギャップを埋めるために,不確実性(OS2FSU)アルゴリズムを用いたオンラインスパースストリーミング機能選択を提案する。
OS2FSUは2つの主な部分から構成される。
1)特徴選択に先立って,希少なストリーミング特徴の欠落データを事前に見積もるために潜在因子分析を利用する。
2) ファジィ論理と周辺粗集合を用いて, 特徴選択を行う際の推定ストリーミング特徴とラベルの不確かさを軽減する。
実験では、OS2FSUは6つの実際のデータセット上の5つの最先端OSFSアルゴリズムと比較される。
その結果、OS2FSUはOSFSでデータ不足が発生した場合、競合より優れていることが示された。
関連論文リスト
- FSDR: A Novel Deep Learning-based Feature Selection Algorithm for Pseudo
Time-Series Data using Discrete Relaxation [9.769546018094665]
深層学習に基づく特徴選択アルゴリズム:離散緩和(FSDR)による特徴選択
FSDRは、既存のDLベースまたは従来のメソッドの範囲を超えて、多数の特徴次元を収容することができる。
論文 参考訳(メタデータ) (2024-03-13T10:37:52Z) - Privacy-preserving Federated Primal-dual Learning for Non-convex and
Non-smooth Problems with Model Sparsification [54.767648945613004]
フェデレートラーニング(FL)は急速に成長している分野として認識されている。
パラメータの非平滑性と非共有性は、FLアプリケーションで一般的である。
論文 参考訳(メタデータ) (2023-10-30T14:15:47Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Online Sparse Streaming Feature Selection Using Adapted Classification [5.587715545506331]
既存の方法は、データを欠くことなく、特徴を関連性または無関係に分割する。
適応型分類(OS2FS-AC)に基づくオンラインスパースストリーミングの特徴選択を提案する。
10個の実世界のデータセットの実験結果から、OS2FS-ACは最先端のアルゴリズムよりも性能が良いことが示された。
論文 参考訳(メタデータ) (2023-02-25T03:03:53Z) - FedSDG-FS: Efficient and Secure Feature Selection for Vertical Federated
Learning [21.79965380400454]
Vertical Learning(VFL)は、複数のデータオーナに対して、大きな重複するデータサンプルセットに関する機能のサブセットをそれぞれ保持して、有用なグローバルモデルを共同でトレーニングすることを可能にする。
VFLのために設計された既存のFSは、ノイズの多い特徴の数について事前知識を仮定するか、有用な特徴の訓練後のしきい値について事前知識を仮定する。
本稿では,FedSDG-FS(Federated Dual-Gate Based Feature Selection)アプローチを提案する。
論文 参考訳(メタデータ) (2023-02-21T03:09:45Z) - NP-Match: When Neural Processes meet Semi-Supervised Learning [133.009621275051]
半教師付き学習(SSL)は近年広く研究されており、ラベル付きデータへの依存を減らすためにラベル付きデータを活用する効果的な方法である。
本研究では,ニューラルネットワーク(NP)を半教師付き画像分類タスクに調整し,NP-Matchと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-07-03T15:24:31Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Online Feature Selection for Efficient Learning in Networked Systems [3.13468877208035]
データ駆動エンジニアリングのための現在のAI/MLメソッドは、主にオフラインでトレーニングされたモデルを使用する。
多数の利用可能なデータソースから小さな特徴セットを選択するオンライン安定特徴セットアルゴリズム(OSFS)を提案する。
OSFSは、調査されたすべてのデータセットに対して、1~3桁の規模で設定された機能のサイズを大幅に削減する。
論文 参考訳(メタデータ) (2021-12-15T16:31:59Z) - A User-Guided Bayesian Framework for Ensemble Feature Selection in Life
Science Applications (UBayFS) [0.0]
本稿では,ベイズ統計フレームワークに組み込んだアンサンブル特徴選択手法UBayFSを提案する。
提案手法は,データとドメイン知識の2つの情報源を考慮し,特徴選択のプロセスを強化する。
標準的な機能セレクタとの比較では、UBayFSは競争力のあるパフォーマンスを実現し、ドメイン知識を組み込むための柔軟性を提供する。
論文 参考訳(メタデータ) (2021-04-30T06:51:33Z) - Federated Doubly Stochastic Kernel Learning for Vertically Partitioned
Data [93.76907759950608]
本稿では,垂直分割データに対する2倍のカーネル学習アルゴリズムを提案する。
本稿では,FDSKLがカーネルを扱う場合,最先端のフェデレーション学習手法よりもはるかに高速であることを示す。
論文 参考訳(メタデータ) (2020-08-14T05:46:56Z) - Deep F-measure Maximization for End-to-End Speech Understanding [52.36496114728355]
本稿では,F測度に対する微分可能な近似法を提案し,標準バックプロパゲーションを用いてネットワークをトレーニングする。
我々は、アダルト、コミュニティ、犯罪の2つの標準フェアネスデータセットの実験を行い、ATISデータセットの音声・インテリジェンス検出と音声・COCOデータセットの音声・イメージ概念分類を行った。
これらの4つのタスクのすべてにおいて、F測定は、クロスエントロピー損失関数で訓練されたモデルと比較して、最大8%の絶対的な絶対的な改善を含む、マイクロF1スコアの改善をもたらす。
論文 参考訳(メタデータ) (2020-08-08T03:02:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。