論文の概要: Deep Learning for Efficient GWAS Feature Selection
- arxiv url: http://arxiv.org/abs/2312.15055v1
- Date: Fri, 22 Dec 2023 20:35:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 19:58:15.335479
- Title: Deep Learning for Efficient GWAS Feature Selection
- Title(参考訳): 効率的なGWAS特徴選択のための深層学習
- Authors: Kexuan Li
- Abstract要約: 本稿では,Mirzaeiらによって提案された特徴選択手法の拡張について紹介する。
拡張されたアプローチは、学生ネットワークにフロベニウスのノルムペナルティを導入することによって、元の手法を強化する。
教師なしと教師なしの両方で シームレスに動作します 2つの重要なニューラルネットワークを使っています
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Genome-Wide Association Studies (GWAS) face unique challenges in the era of
big genomics data, particularly when dealing with ultra-high-dimensional
datasets where the number of genetic features significantly exceeds the
available samples. This paper introduces an extension to the feature selection
methodology proposed by Mirzaei et al. (2020), specifically tailored to tackle
the intricacies associated with ultra-high-dimensional GWAS data. Our extended
approach enhances the original method by introducing a Frobenius norm penalty
into the student network, augmenting its capacity to adapt to scenarios
characterized by a multitude of features and limited samples. Operating
seamlessly in both supervised and unsupervised settings, our method employs two
key neural networks. The first leverages an autoencoder or supervised
autoencoder for dimension reduction, extracting salient features from the
ultra-high-dimensional genomic data. The second network, a regularized
feed-forward model with a single hidden layer, is designed for precise feature
selection. The introduction of the Frobenius norm penalty in the student
network significantly boosts the method's resilience to the challenges posed by
ultra-high-dimensional GWAS datasets. Experimental results showcase the
efficacy of our approach in feature selection for GWAS data. The method not
only handles the inherent complexities of ultra-high-dimensional settings but
also demonstrates superior adaptability to the nuanced structures present in
genomics data. The flexibility and versatility of our proposed methodology are
underscored by its successful performance across a spectrum of experiments.
- Abstract(参考訳): ゲノムワイド・アソシエーション研究(gwas)は、大きなゲノムデータの時代において、特に遺伝学的特徴の数が利用可能なサンプルを大幅に超える超高次元データセットを扱う際に、ユニークな課題に直面している。
本稿では,超高次元gwasデータに関連する複雑な問題に対処するために,mirzaeiら(2020)によって提案された特徴選択手法の拡張を提案する。
拡張アプローチは,学生ネットワークにフロベニウス規範のペナルティを導入し,多数の特徴と限られたサンプルで特徴付けられるシナリオに適応する能力を高めることで,元の手法を強化する。
教師なし設定と教師なし設定の両方でシームレスに動作し、2つの重要なニューラルネットワークを用いる。
1つ目は、次元減少のためにオートエンコーダまたは教師付きオートエンコーダを利用し、超高次元ゲノムデータから顕著な特徴を抽出する。
第2のネットワークは、単一の隠蔽層を持つ正規化フィードフォワードモデルであり、正確な特徴選択のために設計されている。
学生ネットワークにおけるフロベニウスのノルムペナルティの導入は、超高次元GWASデータセットがもたらす課題に対する方法のレジリエンスを著しく向上させる。
GWASデータの特徴選択における提案手法の有効性を実験的に検証した。
この手法は超高次元設定の複雑さを扱うだけでなく、ゲノムデータに存在するニュアンス構造に優れた適応性を示す。
提案手法の柔軟性と汎用性は,提案手法が様々な実験で成功していることに起因している。
関連論文リスト
- Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - Diffusion-Based Neural Network Weights Generation [80.89706112736353]
D2NWGは拡散に基づくニューラルネットワーク重み生成技術であり、転送学習のために高性能な重みを効率よく生成する。
本稿では,ニューラルネットワーク重み生成のための遅延拡散パラダイムを再放送するために,生成的ハイパー表現学習を拡張した。
我々のアプローチは大規模言語モデル(LLM)のような大規模アーキテクチャにスケーラブルであり、現在のパラメータ生成技術の限界を克服しています。
論文 参考訳(メタデータ) (2024-02-28T08:34:23Z) - A Performance-Driven Benchmark for Feature Selection in Tabular Deep
Learning [131.2910403490434]
データサイエンティストは通常、データセットにできるだけ多くの機能を集め、既存の機能から新しい機能を設計する。
既存のタブ形式の特徴選択のためのベンチマークでは、古典的な下流モデル、おもちゃの合成データセット、あるいは下流のパフォーマンスに基づいて特徴セレクタを評価していない。
変換器を含む下流ニューラルネットワーク上で評価された課題のある特徴選択ベンチマークを構築した。
また,従来の特徴選択法よりも高い性能を有するニューラルネットワークのための,Lassoのインプット・グラディエント・ベース・アナログも提案する。
論文 参考訳(メタデータ) (2023-11-10T05:26:10Z) - FedSDG-FS: Efficient and Secure Feature Selection for Vertical Federated
Learning [21.79965380400454]
Vertical Learning(VFL)は、複数のデータオーナに対して、大きな重複するデータサンプルセットに関する機能のサブセットをそれぞれ保持して、有用なグローバルモデルを共同でトレーニングすることを可能にする。
VFLのために設計された既存のFSは、ノイズの多い特徴の数について事前知識を仮定するか、有用な特徴の訓練後のしきい値について事前知識を仮定する。
本稿では,FedSDG-FS(Federated Dual-Gate Based Feature Selection)アプローチを提案する。
論文 参考訳(メタデータ) (2023-02-21T03:09:45Z) - Graph Convolutional Network-based Feature Selection for High-dimensional
and Low-sample Size Data [4.266990593059533]
本稿では,GRAph Convolutional nEtwork feature Selector (GRACES) という深層学習に基づく手法を提案する。
GRACESは、合成データセットと実世界のデータセットの両方において、他の特徴選択方法よりも優れているという実証的な証拠を実証する。
論文 参考訳(メタデータ) (2022-11-25T14:46:36Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Deep Feature Screening: Feature Selection for Ultra High-Dimensional
Data via Deep Neural Networks [4.212520096619388]
本稿では,Deep Feature Screening (DeepFS) と呼ばれる2段階の非パラメトリック手法を提案する。
DeepFSは、超高次元の低サンプルサイズのデータに対して、高精度で重要な特徴を識別することができる。
DeepFSの優位性は、広範囲なシミュレーション研究と実データ分析によって実証されている。
論文 参考訳(メタデータ) (2022-04-04T17:51:49Z) - Adaptive Memory Networks with Self-supervised Learning for Unsupervised
Anomaly Detection [54.76993389109327]
教師なし異常検出は、通常のデータのみをトレーニングすることで、目に見えない異常を検出するモデルを構築することを目的としている。
本稿では,これらの課題に対処するために,自己教師付き学習(AMSL)を用いた適応記憶ネットワーク(Adaptive Memory Network)を提案する。
AMSLには、一般的な正規パターンを学ぶための自己教師付き学習モジュールと、リッチな特徴表現を学ぶための適応型メモリ融合モジュールが組み込まれている。
論文 参考訳(メタデータ) (2022-01-03T03:40:21Z) - Pure Exploration in Kernel and Neural Bandits [90.23165420559664]
我々は、特徴表現の次元が腕の数よりもはるかに大きい帯域における純粋な探索について研究する。
そこで本研究では,各アームの特徴表現を低次元空間に適応的に埋め込む手法を提案する。
論文 参考訳(メタデータ) (2021-06-22T19:51:59Z) - Feature Selection Based on Sparse Neural Network Layer with Normalizing
Constraints [0.0]
本論文では,2つの制約を導入したニューラルネットワークに基づく特徴選択手法を提案する。
その結果,Sparse Neural Network Layer with Normalizing Constraints (SNEL-FS) に基づく特徴選択は,従来の FS 方式に比べて重要な特徴の選択が可能であり,優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2020-12-11T14:14:33Z) - Image-based Automated Species Identification: Can Virtual Data
Augmentation Overcome Problems of Insufficient Sampling? [0.0]
視覚的種自動識別のための2段階データ拡張手法を提案する。
データ拡張の第1段階は、データ拡張と偽画像の生成という古典的なアプローチを適用している。
第2レベルのデータ拡張では、ベクトル空間におけるオーバーサンプリングアルゴリズムによって、特徴空間における合成的な追加サンプリングが採用されている。
論文 参考訳(メタデータ) (2020-10-18T15:44:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。