論文の概要: A U-Statistic-based random forest approach for genetic interaction study
- arxiv url: http://arxiv.org/abs/2508.14924v1
- Date: Tue, 19 Aug 2025 06:22:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.023006
- Title: A U-Statistic-based random forest approach for genetic interaction study
- Title(参考訳): U-Statistic-based random forest approach for genetic interaction study
- Authors: Ming Li, Ruo-Sin Peng, Changshuai Wei, Qing Lu,
- Abstract要約: 本稿では,U-Statistic-based random forest approach(フォレストU-Test)を提案する。
シミュレーション実験により,フォレストUテストは既存手法よりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 5.418369213731247
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variations in complex traits are influenced by multiple genetic variants, environmental risk factors, and their interactions. Though substantial progress has been made in identifying single genetic variants associated with complex traits, detecting the gene-gene and gene-environment interactions remains a great challenge. When a large number of genetic variants and environmental risk factors are involved, searching for interactions is limited to pair-wise interactions due to the exponentially increased feature space and computational intensity. Alternatively, recursive partitioning approaches, such as random forests, have gained popularity in high-dimensional genetic association studies. In this article, we propose a U-Statistic-based random forest approach, referred to as Forest U-Test, for genetic association studies with quantitative traits. Through simulation studies, we showed that the Forest U-Test outperformed existing methods. The proposed method was also applied to study Cannabis Dependence CD, using three independent datasets from the Study of Addiction: Genetics and Environment. A significant joint association was detected with an empirical p-value less than 0.001. The finding was also replicated in two independent datasets with p-values of 5.93e-19 and 4.70e-17, respectively.
- Abstract(参考訳): 複雑な形質の変異は、複数の遺伝的変異、環境リスク因子、およびそれらの相互作用に影響される。
複雑な形質に関連する単一の遺伝的変異を同定する分野では大きな進歩があったが、遺伝子と遺伝子と環境の相互作用を検出することは大きな課題である。
多数の遺伝的変異と環境リスク要因が関与する場合、指数関数的に増加する特徴空間と計算強度により、相互作用の探索はペアワイズな相互作用に限られる。
あるいは、ランダム森林のような再帰的分割アプローチは、高次元遺伝関連研究で人気を博している。
本稿では,U-Statistic-based random forest approach(フォレストU-Test)を提案する。
シミュレーション実験により,フォレストUテストは既存手法よりも優れた性能を示した。
The Study of Addiction: Genetics and Environment, using three independent datasets from the Study of Addiction: Genetics and Environment。
有意な結合が0.001未満の経験的p値で検出された。
この発見は、それぞれ5.93e-19と4.70e-17のp値を持つ2つの独立したデータセットでも再現された。
関連論文リスト
- Functional Analysis of Variance for Association Studies [0.624151172311885]
本研究では,ゲノム領域の配列変異と定性特性の関連性をテストするための分散法(FANOVA)の関数解析を提案する。
FANOVAには、(1)一般と稀の両方を含む遺伝子変異のジョイント効果を検査し、(2)リンケージ不均衡と遺伝的位置情報を完全に活用し、(3)保護的またはリスク増進的な因果変異を許容する、という多くの利点がある。
論文 参考訳(メタデータ) (2025-08-14T21:02:45Z) - Nonparametric independence tests in high-dimensional settings, with applications to the genetics of complex disease [55.2480439325792]
遺伝子データの支持空間における適切な事前測定構造の定義が,このような検査に新たなアプローチをもたらすことを示す。
各問題に対して、数学的結果、シミュレーションおよび実データへの適用を提供する。
論文 参考訳(メタデータ) (2024-07-29T01:00:53Z) - Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0]
我々は人工ニューラルネットワークを訓練し、シミュレーションと実際のジェノタイプフェノタイプデータセットの両方を用いて複雑な特徴を予測する。
統合失調症に合併した多発性座位を指摘された。
論文 参考訳(メタデータ) (2024-07-26T15:20:42Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - PhyloGFN: Phylogenetic inference with generative flow networks [57.104166650526416]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。
GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。
我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文 参考訳(メタデータ) (2023-10-12T23:46:08Z) - Genetic heterogeneity analysis using genetic algorithm and network
science [2.6166087473624318]
ゲノムワイド・アソシエーション(GWAS)は、疾患に感受性のある遺伝的変数を同定することができる。
遺伝的効果に絡み合った遺伝的変数は、しばしば低い効果サイズを示す。
本稿では,FCSNet(Feature Co-Selection Network)という,GWASのための新しい特徴選択機構を提案する。
論文 参考訳(メタデータ) (2023-08-12T01:28:26Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Expectile Neural Networks for Genetic Data Analysis of Complex Diseases [3.0088453915399747]
本研究では、複雑な疾患の遺伝子データ解析のための予測型ニューラルネットワーク(ENN)法を開発した。
期待回帰と同様に、ERNは遺伝子変異と疾患の表現型との関係を包括的に把握する。
提案手法は,遺伝子変異と疾患表現型との間に複雑な関係がある場合,既存の予測回帰よりも優れていた。
論文 参考訳(メタデータ) (2020-10-26T21:07:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。