論文の概要: Time-to-event prediction for grouped variables using Exclusive Lasso
- arxiv url: http://arxiv.org/abs/2504.01520v1
- Date: Wed, 02 Apr 2025 09:07:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:19:59.617283
- Title: Time-to-event prediction for grouped variables using Exclusive Lasso
- Title(参考訳): 排他ラッソを用いた群変数の時間-時間予測
- Authors: Dayasri Ravi, Andreas Groll,
- Abstract要約: 本稿では,標準のラッソ法典に代えて排他的ラッソ正則化(Exclusive Lasso regularization)を提案する。
本手法を実生がんデータセットに適用し,従来のCox回帰モデルと比較して生存予測性能が向上したことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The integration of high-dimensional genomic data and clinical data into time-to-event prediction models has gained significant attention due to the growing availability of these datasets. Traditionally, a Cox regression model is employed, concatenating various covariate types linearly. Given that much of the data may be redundant or irrelevant, feature selection through penalization is often desirable. A notable characteristic of these datasets is their organization into blocks of distinct data types, such as methylation and clinical predictors, which requires selecting a subset of covariates from each group due to high intra-group correlations. For this reason, we propose utilizing Exclusive Lasso regularization in place of standard Lasso penalization. We apply our methodology to a real-life cancer dataset, demonstrating enhanced survival prediction performance compared to the conventional Cox regression model.
- Abstract(参考訳): 高次元ゲノムデータと臨床データの時系列予測モデルへの統合は、これらのデータセットが利用可能になるにつれて、大きな注目を集めている。
伝統的に、コックス回帰モデルを使用し、様々な共変量型を線形に連結する。
データの大部分が冗長あるいは無関係である場合を考えると、ペナル化による特徴の選択が望ましい場合が多い。
これらのデータセットの顕著な特徴は、メチル化や臨床予測のような異なるタイプのデータに分類することであり、高いグループ内相関のため、各グループから共変量のサブセットを選択する必要がある。
そこで本研究では,標準ラッソ法則の代わりに排他的ラッソ正則化(Exclusive Lasso regularization)を提案する。
本手法を実生がんデータセットに適用し,従来のCox回帰モデルと比較して生存予測性能が向上したことを示す。
関連論文リスト
- Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Robust self-healing prediction model for high dimensional data [0.685316573653194]
本研究は、ロバスト自己治癒(RSH)ハイブリッド予測モデルを提案する。
それは、データを捨てるのではなく、エラーや不整合を取り除くことによって、データ全体を活用することによって機能する。
提案手法は,既存のハイパフォーマンスモデルと比較し,解析を行った。
論文 参考訳(メタデータ) (2022-10-04T17:55:50Z) - ecpc: An R-package for generic co-data models for high-dimensional
prediction [0.0]
R-package ecpcはもともと、様々な、おそらく複数のコデータソースに対応していた。
本稿では,汎用コデータモデルのための手法とソフトウェアの拡張について述べる。
R-package squeezyにより,リッジのペナルティが弾性ネットペナルティにどのように変換されるかを示す。
論文 参考訳(メタデータ) (2022-05-16T12:55:19Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Fast marginal likelihood estimation of penalties for group-adaptive
elastic net [0.0]
グループ適応弾性ネットペナライゼーションは、予測を改善するためにコデータから学習する。
本論文では,一般化線形モデルに対する群適応弾性ネットペナルティの限界確率推定法を提案する。
この手法をモデルに基づくシミュレーション研究と癌ゲノムへの応用で実証する。
論文 参考訳(メタデータ) (2021-01-11T13:30:24Z) - Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文 参考訳(メタデータ) (2020-08-01T10:36:27Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - Flexible co-data learning for high-dimensional prediction [0.0]
データが高次元である場合、臨床予測は難しいが、ドメイン知識のような追加情報は、予測を改善するのに役立つかもしれない。
提案手法は,複数データソースを多種多様なデータソースに利用して予測を改善する。
がんゲノム学の2つの応用でこれを実証し、他の高密度および同相の予後モデルの性能を向上させる可能性があることを示す。
論文 参考訳(メタデータ) (2020-05-08T13:04:31Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Large-scale benchmark study of survival prediction methods using
multi-omics data [2.204918347869259]
生存時間などの疾患結果の予測には,マルチオミクスデータの有用性が疑問視されている。
我々は,実データを用いた大規模ベンチマーク研究により,いくつかの回答を提供することを目指している。
論文 参考訳(メタデータ) (2020-03-07T18:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。