論文の概要: Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome
- arxiv url: http://arxiv.org/abs/2008.00235v1
- Date: Sat, 1 Aug 2020 10:36:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 01:15:06.445814
- Title: Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome
- Title(参考訳): 心メタボリックシンドロームを応用したマルチオムリックデータに対する2段階のペナルドロジスティック回帰法
- Authors: Alessandra Cabassi, Denis Seyres, Mattia Frontini, Paul D. W. Kirk
- Abstract要約: 我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building classification models that predict a binary class label on the basis
of high dimensional multi-omics datasets poses several challenges, due to the
typically widely differing characteristics of the data layers in terms of
number of predictors, type of data, and levels of noise. Previous research has
shown that applying classical logistic regression with elastic-net penalty to
these datasets can lead to poor results (Liu et al., 2018). We implement a
two-step approach to multi-omic logistic regression in which variable selection
is performed on each layer separately and a predictive model is then built
using the variables selected in the first step. Here, our approach is compared
to other methods that have been developed for the same purpose, and we adapt
existing software for multi-omic linear regression (Zhao and Zucknick, 2020) to
the logistic regression setting. Extensive simulation studies show that our
approach should be preferred if the goal is to select as many relevant
predictors as possible, as well as achieving prediction performances comparable
to those of the best competitors. Our motivating example is a cardiometabolic
syndrome dataset comprising eight 'omic data types for 2 extreme phenotype
groups (10 obese and 10 lipodystrophy individuals) and 185 blood donors. Our
proposed approach allows us to identify features that characterise
cardiometabolic syndrome at the molecular level. R code is available at
https://github.com/acabassi/logistic-regression-for-multi-omic-data.
- Abstract(参考訳): 高次元マルチオミクスデータセットに基づいてバイナリクラスラベルを予測する分類モデルを構築することは、予測器の数、データの種類、ノイズレベルといった点において、データ層の特徴が広く異なるため、いくつかの課題を提起する。
これまでの研究では、これらのデータセットに弾性ネットペナルティを用いた古典的ロジスティック回帰を適用すると、結果が低くなることが示されている(Liu et al., 2018)。
本稿では,各層で変数選択を行い,第1ステップで選択した変数を用いて予測モデルを構築する,多段階ロジスティック回帰に対する2段階のアプローチを提案する。
そこで本手法は, 同一目的に開発された他の手法と比較し, 既存のソフトウェアを多相線形回帰(Zhao and Zucknick, 2020)にロジスティック回帰設定に適用する。
広範なシミュレーション研究により,提案手法は,最善の競争相手と同等の予測性能を実現するだけでなく,関連する予測要因を可能な限り多数選択することを望む場合に望ましいことが示された。
モチベーション例は,2つの極端な表現型グループ(肥満10名,リポジストトロフィー10名)と185名の献血者を対象に,8種類の「異常データ型」からなる心メタボリックシンドロームデータセットである。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
Rコードはhttps://github.com/acabassi/logistic-regression-for-multi-omic-dataで入手できる。
関連論文リスト
- Comparative Analysis of Data Preprocessing Methods, Feature Selection
Techniques and Machine Learning Models for Improved Classification and
Regression Performance on Imbalanced Genetic Data [0.0]
本研究では,データ前処理,特徴選択,モデル選択が遺伝的データセット上で訓練されたモデルの性能に及ぼす影響について検討した。
予測変数や対象変数のアウトラヤ/スキューが回帰モデルに挑戦しないことがわかった。
また,クラス不均衡なターゲット変数とスキュード予測器が分類性能にほとんど影響を与えていないことも見出した。
論文 参考訳(メタデータ) (2024-02-22T21:41:27Z) - A Novel Approach in Solving Stochastic Generalized Linear Regression via
Nonconvex Programming [1.6874375111244329]
本稿では,一般化線形回帰モデルについて,確率制約問題として考察する。
提案アルゴリズムの結果は,通常のロジスティック回帰モデルよりも1~2%以上よい結果を得た。
論文 参考訳(メタデータ) (2024-01-16T16:45:51Z) - Bayesian predictive modeling of multi-source multi-way data [0.0]
初期鉄欠乏症 (ID) の予測因子として, 複数のオミクス源から得られた分子データについて検討した。
係数に低ランク構造を持つ線形モデルを用いて多方向依存を捕捉する。
本モデルでは, 誤分類率と推定係数と真の係数との相関から, 期待通りの性能を示すことを示す。
論文 参考訳(メタデータ) (2022-08-05T21:58:23Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Dynamically-Scaled Deep Canonical Correlation Analysis [77.34726150561087]
カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T12:52:49Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - The MELODIC family for simultaneous binary logistic regression in a
reduced space [0.5330240017302619]
同時バイナリロジスティック回帰モデリングのためのMELODICファミリーを提案する。
モデルは、ロジスティック回帰係数または双極子の観点から解釈することができる。
薬物摂取プロファイルに関連する性格特性と、うつ病や不安障害に関連する性格特性の2つの応用が詳細に示されている。
論文 参考訳(メタデータ) (2021-02-16T15:47:20Z) - User-Dependent Neural Sequence Models for Continuous-Time Event Data [27.45413274751265]
継続的イベントデータは、個々の行動データ、金融取引、医療健康記録などのアプリケーションで一般的である。
時間変化強度関数をパラメータ化するリカレントニューラルネットワークは、そのようなデータを用いた予測モデリングの最先端技術である。
本稿では,ニューラルマーク点過程モデルの幅広いクラスを,潜伏埋め込みの混合に拡張する。
論文 参考訳(メタデータ) (2020-11-06T08:32:57Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。