論文の概要: Semi-Parametric Bayesian Additive Regression Trees for Risk Prediction with High-Dimensional Epigenetic Signatures and Low-Dimensional Covariates
- arxiv url: http://arxiv.org/abs/2605.20143v2
- Date: Fri, 22 May 2026 17:26:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 14:44:53.701039
- Title: Semi-Parametric Bayesian Additive Regression Trees for Risk Prediction with High-Dimensional Epigenetic Signatures and Low-Dimensional Covariates
- Title(参考訳): 高次元エピジェネティックシグナルと低次元共変量を用いたリスク予測のための半パラメトリックベイズ付加回帰木
- Authors: Saurabh Bhandari, Parveen Bhatti, Brian C. -H. Chiu, Yuan Ji,
- Abstract要約: ゲノム全体のエピジェネティックな修正は、リスク予測を知らせる豊富なデータを提供する。
これらのデータは高次元であり、複雑な依存構造を示す。
この制限に対処する半パラメトリックBARTモデル(spBART)を提案する。
- 参考スコア(独自算出の注目度): 3.3590614024901195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the era of precision medicine, genome-wide epigenetic modifications offer rich data that could inform risk prediction. However, these data are high-dimensional and exhibit complex dependence structures, which makes it difficult to jointly model them with low-dimensional covariates when the goal is to obtain interpretable effect estimates for covariate adjustment. Standard Bayesian additive regression trees (BART) provide strong predictive performance but treat all predictors uniformly within the tree ensemble, obscuring the contributions of significant covariates and complicating variable selection in high-dimensional settings. We propose a semi-parametric BART model (spBART) that addresses this limitation by modeling low-dimensional covariates through a parametric component with interpretable coefficients, while capturing complex nonlinear associations among high-dimensional predictors through the tree ensemble. To perform stable variable selection, we develop a cross-validation-based procedure that aggregates posterior inclusion probabilities across folds and applies Bayesian false discovery rate control. We apply the proposed method to a pooled case--control analysis of high-dimensional genome-wide 5-hydroxymethylcytosine profiles derived from circulating cell-free DNA in two multiple myeloma studies ($N = 869$). The approach identifies a parsimonious set of candidate loci and achieves strong out-of-sample discrimination (AUC $= 0.96$) in a held-out validation set. Overall, spBART provides a unified framework for combining interpretable covariate inference with flexible modeling and variable selection in high-dimensional biomedical studies.
- Abstract(参考訳): 精密医療の時代、ゲノム全体のエピジェネティックな改変は、リスク予測を知らせる豊富なデータを提供する。
しかし、これらのデータは高次元であり、複雑な依存構造を示すため、共変量調整のための解釈可能な効果推定値を得るためには、それらを低次元の共変量と共同でモデル化することは困難である。
標準ベイズ加法回帰木(BART)は、強い予測性能を提供するが、木アンサンブル内の全ての予測木を均一に扱い、重要な共変量の寄与を排除し、高次元設定における変数選択を複雑にする。
本研究では,高次元予測器間の複雑な非線形関係をツリーアンサンブルを通じて捉えながら,パラメトリック成分を解釈可能な係数でモデル化することにより,この制限に対処する半パラメトリックBARTモデルを提案する。
安定な変数選択を実現するため, 後方包摂確率を折り畳みに集約するクロスバリデーションに基づく手法を開発し, ベイズ的偽発見率制御を適用した。
本手法は,2つの多発性骨髄腫研究(N = 869$)において,循環型無細胞DNAから誘導される高次元ゲノムワイド5-ヒドロキシメチルシトシンプロファイルの制御解析に適用する。
このアプローチは、擬似的な候補ロシの集合を特定し、ホールドアウト検証セットにおいて強い外見差別(AUC $= 0.96$)を達成する。
全体として、spBARTは、高次元生医学研究において、解釈可能な共変量推論とフレキシブルモデリングと可変選択を組み合わせた統一的なフレームワークを提供する。
関連論文リスト
- A novel hybrid approach for positive-valued DAG learning [60.917028769172795]
正値データから有向非巡回グラフ(DAG)を学習するためのHybrid Moment-Ratio Scoring (H-MRS)アルゴリズムを提案する。
H-MRSは、モーメント比推定のためのログスケールリッジ回帰と、生のスケールモーメント比に基づくグレディオーダー処理を統合する。
合成対数線形データの実験は、競合精度とリコールを示す。
論文 参考訳(メタデータ) (2026-04-10T04:04:26Z) - Mixture-of-experts Wishart model for covariance matrices with an application to Cancer drug screening [0.8594140167290097]
古典的混合モデルと新しい混合実験ウィッシュアートモデルの両方を通して異種共分散データを解析するための包括的ベイズフレームワークを提案する。
We developed a efficient Gibbs-within-Metropolis-Hastings sample algorithm to the geometry of the Wishart chance and the gating network。
本稿では,がん薬剤感受性プロファイル(がん薬剤感受性プロファイル)という,我々の方法論の革新的な応用を挑戦的データセットに提示する。
論文 参考訳(メタデータ) (2026-02-14T21:07:14Z) - Covariate-assisted Grade of Membership Models via Shared Latent Geometry [0.7939348535496568]
メンバーシップモデルのグレードは、個人レベルの混合メンバーシップスコアを通して多変量カテゴリデータを解析するための柔軟な潜在変数モデルである。
補助共変量体を組み込む従来のアプローチは、一般に完全に指定された関節の確率に依存しており、計算的に集中しており、誤特定に敏感である。
我々は,共変量支援型メンバシップモデルを導入し,共変量情報を統合する。
論文 参考訳(メタデータ) (2026-01-24T02:30:36Z) - Dendrograms of Mixing Measures for Softmax-Gated Gaussian Mixture of Experts: Consistency without Model Sweeps [41.371172458797524]
ゲーティングパラメータの共通翻訳、固有のゲート-エキスパート相互作用、およびタイトな数値-デノミネータ結合までの不特定性に対処する。
モデル選択には, 最適なパラメータ率を得る専門家の数を一貫したスイープフリーセレクタとして, デンドログラム誘導SGMoEを適応させる。
干ばつを識別できるトウモロコシの形質のデータセット上で、私たちのデンドログラム誘導SGMoEは2人の専門家を選別し、明確な混合階層を公開し、確率を早期に安定化し、解釈可能な遺伝子型フェノタイプマップを生成する。
論文 参考訳(メタデータ) (2025-10-14T17:23:44Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - Semiparametric conformal prediction [79.6147286161434]
ベクトル値の非整合性スコアの結合相関構造を考慮した共形予測セットを構築する。
スコアの累積分布関数(CDF)を柔軟に推定する。
提案手法は,現実の回帰問題に対して,所望のカバレッジと競争効率をもたらす。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Co-data Learning for Bayesian Additive Regression Trees [0.0]
本稿では,コデータから木間関係の予測モデルを構築することを提案する。
提案手法は複数のデータ型を同時に扱うことができる。
Co-dataは、大きなB細胞リンパ腫の予後を拡散させる用途における予測を強化する。
論文 参考訳(メタデータ) (2023-11-16T16:14:39Z) - Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。