論文の概要: Flexible co-data learning for high-dimensional prediction
- arxiv url: http://arxiv.org/abs/2005.04010v1
- Date: Fri, 8 May 2020 13:04:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 13:01:26.786923
- Title: Flexible co-data learning for high-dimensional prediction
- Title(参考訳): 高次元予測のためのフレキシブルコデータ学習
- Authors: Mirrelijn M. van Nee, Lodewyk F.A. Wessels and Mark A. van de Wiel
- Abstract要約: データが高次元である場合、臨床予測は難しいが、ドメイン知識のような追加情報は、予測を改善するのに役立つかもしれない。
提案手法は,複数データソースを多種多様なデータソースに利用して予測を改善する。
がんゲノム学の2つの応用でこれを実証し、他の高密度および同相の予後モデルの性能を向上させる可能性があることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical research often focuses on complex traits in which many variables
play a role in mechanisms driving, or curing, diseases. Clinical prediction is
hard when data is high-dimensional, but additional information, like domain
knowledge and previously published studies, may be helpful to improve
predictions. Such complementary data, or co-data, provide information on the
covariates, such as genomic location or p-values from external studies. Our
method enables exploiting multiple and various co-data sources to improve
predictions. We use discrete or continuous co-data to define possibly
overlapping or hierarchically structured groups of covariates. These are then
used to estimate adaptive multi-group ridge penalties for generalised linear
and Cox models. We combine empirical Bayes estimation of group penalty
hyperparameters with an extra level of shrinkage. This renders a uniquely
flexible framework as any type of shrinkage can be used on the group level. The
hyperparameter shrinkage learns how relevant a specific co-data source is,
counters overfitting of hyperparameters for many groups, and accounts for
structured co-data. We describe various types of co-data and propose suitable
forms of hypershrinkage. The method is very versatile, as it allows for
integration and weighting of multiple co-data sets, inclusion of unpenalised
covariates and posterior variable selection. We demonstrate it on two cancer
genomics applications and show that it may improve the performance of other
dense and parsimonious prognostic models substantially, and stabilises variable
selection.
- Abstract(参考訳): 臨床研究は、多くの変数が疾患の進行、または治癒のメカニズムに関与する複雑な特徴にしばしば焦点をあてる。
データが高次元である場合、臨床予測は難しいが、ドメイン知識や以前に公開された研究のような追加情報は、予測を改善するのに役立つかもしれない。
このような補足データ(co-data)は、外部研究からのゲノム位置やp値などの共変量に関する情報を提供する。
提案手法は,複数のデータソースを活用して予測を改善する。
離散的あるいは連続的なコデータを用いて、共変量の重複または階層的構成群を定義する。
これらは、一般化線形およびcoxモデルに対する適応的多群リッジペナルティの推定に使用される。
我々はグループペナルティハイパーパラメータの経験的ベイズ推定と余分な縮小レベルを組み合わせる。
これは、任意の種類の縮小がグループレベルで使用できるため、ユニークなフレキシブルなフレームワークをレンダリングする。
ハイパーパラメータの縮小は、特定のコデータソースがどの程度関連しているかを学習し、多くのグループでハイパーパラメータの過剰フィッティングをカウンターし、構造化コデータを説明する。
各種のコデータについて記述し, 最適な過収縮形式を提案する。
この方法は、複数のコデータ集合の統合と重み付け、無加法共変量の包含、後続変数の選択を可能にするため、非常に多様である。
2つのがんゲノミクスへの応用を実証し,他の高密度・同時進行型予後モデルの性能を実質的に向上させ,スタビリス変数の選択を改善できることを示した。
関連論文リスト
- Guiding adaptive shrinkage by co-data to improve regression-based prediction and feature selection [0.3867363075280544]
特徴の相補的データである「コデータ」が結果を改善することは広く認識されている。
このようなコデータは、公開リポジトリが利用できるため、ゲノム設定においてユビキタスである。
本稿では,コデータを用いた回帰学習者のクラスである適応縮小法について概説する。
論文 参考訳(メタデータ) (2024-05-08T09:38:11Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - ecpc: An R-package for generic co-data models for high-dimensional
prediction [0.0]
R-package ecpcはもともと、様々な、おそらく複数のコデータソースに対応していた。
本稿では,汎用コデータモデルのための手法とソフトウェアの拡張について述べる。
R-package squeezyにより,リッジのペナルティが弾性ネットペナルティにどのように変換されるかを示す。
論文 参考訳(メタデータ) (2022-05-16T12:55:19Z) - Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。
我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。
このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文 参考訳(メタデータ) (2022-05-03T13:38:58Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-27T21:18:01Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Meta-analysis of heterogeneous data: integrative sparse regression in
high-dimensions [21.162280861396205]
本稿では,データソースが類似しているが識別できない高次元環境におけるメタ分析の課題について考察する。
異質性の存在下での解釈可能性と統計的効率を重視したグローバルパラメータを導入する。
いくつかの異なる癌細胞株を含む大規模薬物治療データセットに対するアプローチの利点を実証する。
論文 参考訳(メタデータ) (2019-12-26T20:30:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。