論文の概要: Feature Selection for Functional Data Classification
- arxiv url: http://arxiv.org/abs/2401.05765v1
- Date: Thu, 11 Jan 2024 09:17:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-12 15:26:01.892351
- Title: Feature Selection for Functional Data Classification
- Title(参考訳): 機能データ分類のための特徴選択
- Authors: Tobia Boschi, Francesca Bonin, Jonathan Epperlein, Rodrigo
Ordonez-Hurtado, and Alessandra Pascale
- Abstract要約: 本稿では,機能データの選択と分類を共同で行うという課題に対処するFSFC(Feature Selection for Functional Classification)を提案する。
提案手法は,ロジスティックな損失と機能的特徴を統合した新たな最適化問題に取り組み,分類において最も重要な特徴を特定する。
FSFCの計算効率は、特徴数が統計単位数よりかなり多いような高次元シナリオを処理できる。
- 参考スコア(独自算出の注目度): 41.79972837288401
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Functional data analysis has emerged as a crucial tool in many contemporary
scientific domains that require the integration and interpretation of complex
data. Moreover, the advent of new technologies has facilitated the collection
of a large number of longitudinal variables, making feature selection pivotal
for avoiding overfitting and improving prediction performance. This paper
introduces a novel methodology called FSFC (Feature Selection for Functional
Classification), that addresses the challenge of jointly performing feature
selection and classification of functional data in scenarios with categorical
responses and longitudinal features. Our approach tackles a newly defined
optimization problem that integrates logistic loss and functional features to
identify the most crucial features for classification. To address the
minimization procedure, we employ functional principal components and develop a
new adaptive version of the Dual Augmented Lagrangian algorithm that leverages
the sparsity structure of the problem for dimensionality reduction. The
computational efficiency of FSFC enables handling high-dimensional scenarios
where the number of features may considerably exceed the number of statistical
units. Simulation experiments demonstrate that FSFC outperforms other machine
learning and deep learning methods in computational time and classification
accuracy. Furthermore, the FSFC feature selection capability can be leveraged
to significantly reduce the problem's dimensionality and enhance the
performances of other classification algorithms. The efficacy of FSFC is also
demonstrated through a real data application, analyzing relationships between
four chronic diseases and other health and socio-demographic factors.
- Abstract(参考訳): 関数型データ分析は、複雑なデータの統合と解釈を必要とする多くの現代の科学領域において重要なツールとして登場した。
さらに、新しい技術の出現により、多数の長手変数の収集が容易になり、過剰な適合を避け、予測性能を向上させるための特徴選択が重要になった。
本稿では,FSFC (Feature Selection for Functional Classification) と呼ばれる新しい手法を提案する。
本手法では,ロジスティック損失と機能的特徴を統合し,分類の最も重要な特徴を識別する最適化問題に取り組む。
最小化処理に対処するために,機能的主成分を用い,次元減少のための問題の空間構造を利用するDual Augmented Lagrangianアルゴリズムの適応版を開発する。
FSFCの計算効率は、特徴数が統計単位数よりかなり多いような高次元シナリオを扱うことができる。
シミュレーション実験により、FSFCは計算時間と分類精度において、他の機械学習およびディープラーニング手法よりも優れていることが示された。
さらに、FSFCの特徴選択能力を利用して、問題の次元を大幅に削減し、他の分類アルゴリズムの性能を高めることができる。
また, fsfcの有効性は, 4つの慢性疾患と他の健康因子, 社会疫学因子の関係を解析し, 実データを用いて実証した。
関連論文リスト
- A Contrast Based Feature Selection Algorithm for High-dimensional Data
set in Machine Learning [9.596923373834093]
本稿では,異なるクラス間で示される相違点に基づいて識別的特徴を抽出する新しいフィルタ特徴選択手法であるContrastFSを提案する。
提案手法の有効性と有効性について検証し,提案手法が無視可能な計算で良好に動作することを示す。
論文 参考訳(メタデータ) (2024-01-15T05:32:35Z) - Analysis and Optimization of Wireless Federated Learning with Data
Heterogeneity [72.85248553787538]
本稿では、データの不均一性を考慮した無線FLの性能解析と最適化と、無線リソース割り当てについて述べる。
ロス関数の最小化問題を、長期エネルギー消費と遅延の制約の下で定式化し、クライアントスケジューリング、リソース割り当て、ローカルトレーニングエポック数(CRE)を共同で最適化する。
実世界のデータセットの実験により、提案アルゴリズムは学習精度とエネルギー消費の点で他のベンチマークよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-04T04:18:01Z) - FAStEN: An Efficient Adaptive Method for Feature Selection and Estimation in High-Dimensional Functional Regressions [7.674715791336311]
本稿では,スパース関数オン・ファンクション回帰問題において特徴選択を行うための,新しい,柔軟な,超効率的なアプローチを提案する。
我々はそれをスカラー・オン・ファンクション・フレームワークに拡張する方法を示す。
AOMIC PIOP1による脳MRIデータへの応用について述べる。
論文 参考訳(メタデータ) (2023-03-26T19:41:17Z) - Offline Reinforcement Learning with Differentiable Function
Approximation is Provably Efficient [65.08966446962845]
歴史的データを用いて意思決定戦略を最適化することを目的としたオフライン強化学習は、現実の応用に広く適用されている。
微分関数クラス近似(DFA)を用いたオフライン強化学習の検討から一歩踏み出した。
最も重要なことは、悲観的な適合Q-ラーニングアルゴリズムを解析することにより、オフライン微分関数近似が有効であることを示すことである。
論文 参考訳(メタデータ) (2022-10-03T07:59:42Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - On the utility of power spectral techniques with feature selection
techniques for effective mental task classification in noninvasive BCI [19.19039983741124]
本稿では,メンタルタスク分類において,関連性および非関連性のあるスペクトル特徴を選択する手法を提案する。
その結果,メンタルタスク分類のための学習モデルの性能は大幅に向上した。
論文 参考訳(メタデータ) (2021-11-16T00:27:53Z) - RFCBF: enhance the performance and stability of Fast Correlation-Based
Filter [6.781877756322586]
分類精度を向上させるために再サンプリング技術を組み合わせた新しいFCBF拡張RFCBFを提案する。
実験結果から,RFCBFアルゴリズムは従来の最先端手法よりも,分類精度と実行時間で有意に優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-05-30T12:36:32Z) - Feature Selection for Imbalanced Data with Deep Sparse Autoencoders
Ensemble [0.5352699766206808]
クラスの不均衡は、学習アルゴリズムの多くのドメインアプリケーションで一般的な問題です。
本稿では,Deep Sparse AutoEncoders Ensembleの再構成誤差に基づいて,フィルタFSアルゴリズムのランク付け機能を提案する。
サンプルサイズの異なる高次元データセットに対する実験において,本アルゴリズムの有効性を実証的に実証した。
論文 参考訳(メタデータ) (2021-03-22T09:17:08Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。