論文の概要: Correlation Based Feature Subset Selection for Multivariate Time-Series
Data
- arxiv url: http://arxiv.org/abs/2112.03705v1
- Date: Fri, 26 Nov 2021 17:39:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-12 17:37:13.448580
- Title: Correlation Based Feature Subset Selection for Multivariate Time-Series
Data
- Title(参考訳): 多変量時系列データに対する相関型特徴集合選択
- Authors: Bahavathy Kathirgamanathan, Padraig Cunningham
- Abstract要約: 時系列データのストリームの相関は、与えられたデータマイニングタスクには、機能のごく一部しか必要としないことを意味する。
単一特徴分類器出力の相関パターンに基づいて特徴部分選択を行う手法を提案する。
- 参考スコア(独自算出の注目度): 2.055949720959582
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Correlations in streams of multivariate time series data means that
typically, only a small subset of the features are required for a given data
mining task. In this paper, we propose a technique which we call Merit Score
for Time-Series data (MSTS) that does feature subset selection based on the
correlation patterns of single feature classifier outputs. We assign a Merit
Score to the feature subsets which is used as the basis for selecting 'good'
feature subsets. The proposed technique is evaluated on datasets from the UEA
multivariate time series archive and is compared against a Wrapper approach for
feature subset selection. MSTS is shown to be effective for feature subset
selection and is in particular effective as a data reduction technique. MSTS is
shown here to be computationally more efficient than the Wrapper strategy in
selecting a suitable feature subset, being more than 100 times faster for some
larger datasets while also maintaining a good classification accuracy.
- Abstract(参考訳): 多変量時系列データのストリーム内の相関は、通常、特定のデータマイニングタスクに必要な機能のごく一部のみであることを意味する。
本稿では,1つの特徴分類器出力の相関パターンに基づいて特徴集合選択を行う時系列データ(msts)に対して,メリットスコアと呼ばれる手法を提案する。
機能サブセットを'良い'機能サブセットを選択する基盤として使用する機能サブセットにメリットスコアを割り当てます。
提案手法は,UEA多変量時系列アーカイブのデータセットを用いて評価し,特徴部分選択のためのWrapperアプローチと比較する。
MSTSは特徴部分集合の選択に有効であることが示されており、特にデータ還元技術として有効である。
mstsは、適切な機能サブセットを選択する際のラッパー戦略よりも計算効率が良く、いくつかの大きなデータセットでは100倍以上高速であり、分類精度も良好である。
関連論文リスト
- Adapt-$\infty$: Scalable Lifelong Multimodal Instruction Tuning via Dynamic Data Selection [89.42023974249122]
Adapt-$infty$は、Lifelong Instruction Tuningの新しいマルチウェイおよびアダプティブデータ選択アプローチである。
勾配に基づくサンプルベクトルをグループ化して擬似スキルクラスタを構築する。
セレクタエキスパートのプールから各スキルクラスタの最高のパフォーマンスデータセレクタを選択する。
論文 参考訳(メタデータ) (2024-10-14T15:48:09Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Towards Free Data Selection with General-Purpose Models [71.92151210413374]
望ましいデータ選択アルゴリズムは、限られたアノテーション予算の有用性を最大化するために、最も情報性の高いサンプルを効率的に選択することができる。
アクティブな学習手法で表現された現在のアプローチは、通常、時間を要するモデルのトレーニングとバッチデータ選択を繰り返し繰り返す、面倒なパイプラインに従う。
FreeSelは重いバッチ選択プロセスをバイパスし、効率を大幅に改善し、既存のアクティブラーニングメソッドよりも530倍高速である。
論文 参考訳(メタデータ) (2023-09-29T15:50:14Z) - Utilizing Semantic Textual Similarity for Clinical Survey Data Feature
Selection [4.5574502769585745]
調査データから結果を予測する機械学習モデルは、過度に適合し、結果として一般化性が低下する可能性がある。
この機能の選択は、学習する機能の最適なサブセットを選択しようとするものだ。
特徴名と対象名の関係を言語モデル(LM)を用いて評価し,意味的テキスト類似度(STS)スコアを生成する。
STSを用いて最小冗長-最大関連性(mRMR)アルゴリズムで特徴を直接選択する性能について検討する。
論文 参考訳(メタデータ) (2023-08-19T03:10:51Z) - Parallel feature selection based on the trace ratio criterion [4.30274561163157]
本研究は,PFSTを用いた並列特徴選択という,新しい並列特徴選択手法を提案する。
提案手法は,Fisher's Discriminant Analysisで用いられるクラス分離性の尺度であるトレース基準を用いて特徴的有用性を評価する。
実験により,本手法は,比較対象の他の手法による時間的差のごく一部で,少数の特徴セットを生成できることが確認された。
論文 参考訳(メタデータ) (2022-03-03T10:50:33Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - A Supervised Feature Selection Method For Mixed-Type Data using
Density-based Feature Clustering [1.3048920509133808]
本稿では、密度ベース特徴クラスタリング(SFSDFC)を用いた教師付き特徴選択法を提案する。
SFSDFCは、新しい密度に基づくクラスタリング法を用いて、特徴空間を不連続な特徴クラスタの集合に分解する。
そして、これらの特徴クラスタから最小限の冗長性を持つ重要な特徴のサブセットを得るために、効果的な特徴選択戦略を採用する。
論文 参考訳(メタデータ) (2021-11-10T15:05:15Z) - A Feature Selection Method for Multi-Dimension Time-Series Data [2.055949720959582]
モーションキャプチャやアクティビティ認識などのアプリケーション領域の時系列データは、しばしば多次元である。
これらのデータストリームには多くの冗長性があり、優れた分類精度は少数の機能で達成できることが多い。
相互情報に基づく多次元時系列データにおける特徴部分選択法を提案する。
論文 参考訳(メタデータ) (2021-04-22T14:49:00Z) - Supervised Feature Subset Selection and Feature Ranking for Multivariate
Time Series without Feature Extraction [78.84356269545157]
MTS分類のための教師付き特徴ランキングと特徴サブセット選択アルゴリズムを導入する。
MTSの既存の教師なし特徴選択アルゴリズムとは異なり、我々の手法は時系列から一次元特徴ベクトルを生成するために特徴抽出ステップを必要としない。
論文 参考訳(メタデータ) (2020-05-01T07:46:29Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。