論文の概要: Deep Feature Screening: Feature Selection for Ultra High-Dimensional
Data via Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2204.01682v3
- Date: Sat, 16 Dec 2023 11:17:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 21:43:38.107236
- Title: Deep Feature Screening: Feature Selection for Ultra High-Dimensional
Data via Deep Neural Networks
- Title(参考訳): ディープ・フィーチャー・スクリーニング:ディープ・ニューラルネットワークによる超高次元データの特徴選択
- Authors: Kexuan Li, Fangfang Wang, Lingli Yang, Ruiqi Liu
- Abstract要約: 本稿では,Deep Feature Screening (DeepFS) と呼ばれる2段階の非パラメトリック手法を提案する。
DeepFSは、超高次元の低サンプルサイズのデータに対して、高精度で重要な特徴を識別することができる。
DeepFSの優位性は、広範囲なシミュレーション研究と実データ分析によって実証されている。
- 参考スコア(独自算出の注目度): 4.212520096619388
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The applications of traditional statistical feature selection methods to
high-dimension, low sample-size data often struggle and encounter challenging
problems, such as overfitting, curse of dimensionality, computational
infeasibility, and strong model assumption. In this paper, we propose a novel
two-step nonparametric approach called Deep Feature Screening (DeepFS) that can
overcome these problems and identify significant features with high precision
for ultra high-dimensional, low-sample-size data. This approach first extracts
a low-dimensional representation of input data and then applies feature
screening based on multivariate rank distance correlation recently developed by
Deb and Sen (2021). This approach combines the strengths of both deep neural
networks and feature screening, and thereby has the following appealing
features in addition to its ability of handling ultra high-dimensional data
with small number of samples: (1) it is model free and distribution free; (2)
it can be used for both supervised and unsupervised feature selection; and (3)
it is capable of recovering the original input data. The superiority of DeepFS
is demonstrated via extensive simulation studies and real data analyses.
- Abstract(参考訳): 従来の統計特徴選択法の高次元・低サンプルサイズデータへの応用は、しばしば過剰フィッティング、次元の呪い、計算不可能性、強いモデル仮定といった困難な問題に直面する。
本稿では,これらの問題を克服し,超高次元・低サンプルサイズのデータに対して高精度で重要な特徴を識別可能な,深層特徴スクリーニング(deep feature screening, deepfs)と呼ばれる新しい2段階非パラメトリック手法を提案する。
このアプローチはまず入力データの低次元表現を抽出し,Deb と Sen (2021) によって最近開発された多変量階差相関に基づく特徴スクリーニングを適用する。
本手法はディープニューラルネットワークと特徴スクリーニングの長所を併せ持つものであり,(1)モデルフリーで分布自由な,(2)教師なしと教師なしの両方の特徴選択に使用できる,(3)元の入力データを復元できるといった,超高次元データを少数のサンプルで処理する能力に加えて,次のような魅力的な特徴を有する。
DeepFSの優位性は、広範なシミュレーション研究と実データ分析によって実証される。
関連論文リスト
- Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Deep Learning for Efficient GWAS Feature Selection [0.0]
本稿では,Mirzaeiらによって提案された特徴選択手法の拡張について紹介する。
拡張されたアプローチは、学生ネットワークにフロベニウスのノルムペナルティを導入することによって、元の手法を強化する。
教師なしと教師なしの両方で シームレスに動作します 2つの重要なニューラルネットワークを使っています
論文 参考訳(メタデータ) (2023-12-22T20:35:47Z) - Learning in latent spaces improves the predictive accuracy of deep
neural operators [0.0]
L-DeepONetは標準のDeepONetの拡張であり、高次元PDE入力の潜在表現と適切なオートエンコーダで識別される出力関数を利用する。
L-DeepONetは時間依存PDEの精度と計算効率の両面で標準手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-04-15T17:13:09Z) - Bayesian Interpolation with Deep Linear Networks [92.1721532941863]
ニューラルネットワークの深さ、幅、データセットサイズがモデル品質にどう影響するかを特徴付けることは、ディープラーニング理論における中心的な問題である。
線形ネットワークが無限深度で証明可能な最適予測を行うことを示す。
また、データに依存しない先行法により、広い線形ネットワークにおけるベイズ模型の証拠は無限の深さで最大化されることを示す。
論文 参考訳(メタデータ) (2022-12-29T20:57:46Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - The Imaginative Generative Adversarial Network: Automatic Data
Augmentation for Dynamic Skeleton-Based Hand Gesture and Human Action
Recognition [27.795763107984286]
本稿では、入力データの分布を近似し、この分布から新しいデータをサンプリングする新しい自動データ拡張モデルを提案する。
以上の結果から,拡張戦略は訓練が高速であり,ニューラルネットワークと最先端手法の両方の分類精度を向上させることが可能であることが示唆された。
論文 参考訳(メタデータ) (2021-05-27T11:07:09Z) - Feature Selection Based on Sparse Neural Network Layer with Normalizing
Constraints [0.0]
本論文では,2つの制約を導入したニューラルネットワークに基づく特徴選択手法を提案する。
その結果,Sparse Neural Network Layer with Normalizing Constraints (SNEL-FS) に基づく特徴選択は,従来の FS 方式に比べて重要な特徴の選択が可能であり,優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2020-12-11T14:14:33Z) - Image-based Automated Species Identification: Can Virtual Data
Augmentation Overcome Problems of Insufficient Sampling? [0.0]
視覚的種自動識別のための2段階データ拡張手法を提案する。
データ拡張の第1段階は、データ拡張と偽画像の生成という古典的なアプローチを適用している。
第2レベルのデータ拡張では、ベクトル空間におけるオーバーサンプリングアルゴリズムによって、特徴空間における合成的な追加サンプリングが採用されている。
論文 参考訳(メタデータ) (2020-10-18T15:44:45Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Beyond Dropout: Feature Map Distortion to Regularize Deep Neural
Networks [107.77595511218429]
本稿では,ディープニューラルネットワークの中間層に関連する実験的なRademacher複雑性について検討する。
上記の問題に対処するための特徴歪み法(Disout)を提案する。
より高い試験性能を有するディープニューラルネットワークを作製するための特徴写像歪みの優位性を解析し、実証した。
論文 参考訳(メタデータ) (2020-02-23T13:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。