論文の概要: ecpc: An R-package for generic co-data models for high-dimensional
prediction
- arxiv url: http://arxiv.org/abs/2205.07640v1
- Date: Mon, 16 May 2022 12:55:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-05-17 16:45:49.034496
- Title: ecpc: An R-package for generic co-data models for high-dimensional
prediction
- Title(参考訳): ecpc:高次元予測のための汎用コデータモデルのためのRパッケージ
- Authors: Mirrelijn M. van Nee, Lodewyk F.A. Wessels and Mark A. van de Wiel
- Abstract要約: R-package ecpcはもともと、様々な、おそらく複数のコデータソースに対応していた。
本稿では,汎用コデータモデルのための手法とソフトウェアの拡張について述べる。
R-package squeezyにより,リッジのペナルティが弾性ネットペナルティにどのように変換されるかを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-dimensional prediction considers data with more variables than samples.
Generic research goals are to find the best predictor or to select variables.
Results may be improved by exploiting prior information in the form of co-data,
providing complementary data not on the samples, but on the variables. We
consider adaptive ridge penalised generalised linear and Cox models, in which
the variable specific ridge penalties are adapted to the co-data to give a
priori more weight to more important variables. The R-package ecpc originally
accommodated various and possibly multiple co-data sources, including
categorical co-data, i.e. groups of variables, and continuous co-data.
Continuous co-data, however, was handled by adaptive discretisation,
potentially inefficiently modelling and losing information. Here, we present an
extension to the method and software for generic co-data models, particularly
for continuous co-data. At the basis lies a classical linear regression model,
regressing prior variance weights on the co-data. Co-data variables are then
estimated with empirical Bayes moment estimation. After placing the estimation
procedure in the classical regression framework, extension to generalised
additive and shape constrained co-data models is straightforward. Besides, we
show how ridge penalties may be transformed to elastic net penalties with the
R-package squeezy. In simulation studies we first compare various co-data
models for continuous co-data from the extension to the original method.
Secondly, we compare variable selection performance to other variable selection
methods. Moreover, we demonstrate use of the package in several examples
throughout the paper.
- Abstract(参考訳): 高次元予測はサンプルよりも多くの変数を持つデータを考える。
一般的な研究目標は、最良の予測器を見つけるか、変数を選択することである。
先行情報をコデータ形式で活用し、サンプルではなく変数に補完的なデータを提供することで、結果を改善することができる。
我々は,適応リッジペナルティを一般化した線形およびcoxモデルについて検討し,変数固有のリッジペナルティをコデータに適用することにより,より重要な変数に対してより重み付けを行う。
R-package ecpcはもともと、分類的コデータ、すなわち変数のグループ、連続コデータを含む、様々な、おそらくは複数のコデータソースを収容していた。
しかし、連続的なコデータは適応的離散化によって処理され、潜在的に非効率なモデリングと情報の喪失が引き起こされた。
本稿では、一般的なコデータモデル、特に連続コデータのためのメソッドとソフトウェアの拡張について述べる。
基礎は古典的な線形回帰モデルであり、コデータ上の事前分散重みを回帰する。
コデータ変数は経験的ベイズモーメント推定によって推定される。
古典回帰フレームワークに推定手順を配置した後、一般化された加法および形状制約付きコデータモデルの拡張は簡単である。
さらに,R-package squeezyを用いて,リッジのペナルティを弾性ネットのペナルティに変換する方法を示した。
シミュレーション研究において、まず、拡張から元の方法への連続コデータに対する様々なコデータモデルを比較する。
次に,変数選択性能を他の変数選択法と比較する。
さらに,本論文では,本パッケージの使用例をいくつか紹介する。
関連論文リスト
- Time-to-event prediction for grouped variables using Exclusive Lasso [0.0]
本稿では,標準のラッソ法典に代えて排他的ラッソ正則化(Exclusive Lasso regularization)を提案する。
本手法を実生がんデータセットに適用し,従来のCox回帰モデルと比較して生存予測性能が向上したことを示す。
論文 参考訳(メタデータ) (2025-04-02T09:07:05Z) - Co-data Learning for Bayesian Additive Regression Trees [0.0]
本稿では,コデータから木間関係の予測モデルを構築することを提案する。
提案手法は複数のデータ型を同時に扱うことができる。
Co-dataは、大きなB細胞リンパ腫の予後を拡散させる用途における予測を強化する。
論文 参考訳(メタデータ) (2023-11-16T16:14:39Z) - Conformal inference for regression on Riemannian Manifolds [49.7719149179179]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、Xで表される共変数がユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - A Graphical Model for Fusing Diverse Microbiome Data [2.385985842958366]
本稿では,このような数値データを共同でモデル化するフレキシブルな多項ガウス生成モデルを提案する。
本稿では、潜在変数とモデルのパラメータを推定するための、計算にスケーラブルな変動予測-最大化(EM)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-21T17:54:39Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - Conjugate priors for count and rounded data regression [0.0]
閉形式後部推論を可能にする共役前部を導入する。
主要な後続関数と予測関数は計算可能であり、直接モンテカルロシミュレーションによって計算可能である。
これらのツールは、線形回帰、基底展開による非線形モデル、モデルと変数選択に広く有用である。
論文 参考訳(メタデータ) (2021-10-23T23:26:01Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - High-dimensional regression with potential prior information on variable
importance [0.0]
順序付けによって示されるモデルの列に適合する簡単なスキームを提案する。
リッジ回帰を用いた場合の全てのモデルの適合に対する計算コストは、リッジ回帰の1つの適合に留まらないことを示す。
モデル全体の整合性を大幅に高速化するために,従来の整合性を利用したラッソ回帰の戦略を述べる。
論文 参考訳(メタデータ) (2021-09-23T10:34:37Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z) - Flexible co-data learning for high-dimensional prediction [0.0]
データが高次元である場合、臨床予測は難しいが、ドメイン知識のような追加情報は、予測を改善するのに役立つかもしれない。
提案手法は,複数データソースを多種多様なデータソースに利用して予測を改善する。
がんゲノム学の2つの応用でこれを実証し、他の高密度および同相の予後モデルの性能を向上させる可能性があることを示す。
論文 参考訳(メタデータ) (2020-05-08T13:04:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。