論文の概要: Graph Based Link Prediction between Human Phenotypes and Genes
- arxiv url: http://arxiv.org/abs/2105.11989v1
- Date: Tue, 25 May 2021 14:47:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-26 14:22:29.464502
- Title: Graph Based Link Prediction between Human Phenotypes and Genes
- Title(参考訳): グラフに基づくヒトフェノタイプと遺伝子間のリンク予測
- Authors: Rushabh Patel, Yanhui Guo
- Abstract要約: 機械学習の分野での最近の進歩は、異常なヒトの表現型と遺伝子間の相互作用を予測するのに効果的である。
本研究では,ヒトの表現型オントロジー(HPO)と遺伝子との関係を予測する枠組みを開発した。
他の4つの方法と比較して、LightGBMはヒトの表現型と遺伝子ペア間のより正確な相互作用やリンクを見つけることができる。
- 参考スコア(独自算出の注目度): 5.1398743023989555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background The learning of genotype-phenotype associations and history of
human disease by doing detailed and precise analysis of phenotypic
abnormalities can be defined as deep phenotyping. To understand and detect this
interaction between phenotype and genotype is a fundamental step when
translating precision medicine to clinical practice. The recent advances in the
field of machine learning is efficient to predict these interactions between
abnormal human phenotypes and genes.
Methods In this study, we developed a framework to predict links between
human phenotype ontology (HPO) and genes. The annotation data from the
heterogeneous knowledge resources i.e., orphanet, is used to parse human
phenotype-gene associations. To generate the embeddings for the nodes (HPO &
genes), an algorithm called node2vec was used. It performs node sampling on
this graph based on random walks, then learns features over these sampled nodes
to generate embeddings. These embeddings were used to perform the downstream
task to predict the presence of the link between these nodes using 5 different
supervised machine learning algorithms.
Results: The downstream link prediction task shows that the Gradient Boosting
Decision Tree based model (LightGBM) achieved an optimal AUROC 0.904 and AUCPR
0.784. In addition, LightGBM achieved an optimal weighted F1 score of 0.87.
Compared to the other 4 methods LightGBM is able to find more accurate
interaction/link between human phenotype & gene pairs.
- Abstract(参考訳): 背景 ヒト疾患の遺伝子型・表現型関連および病歴の詳細な解析による学習は, 深部表現型と定義できる。
この表現型と遺伝子型との相互作用を理解することは、精密医療を臨床に翻訳する際の基本的なステップである。
機械学習の分野での最近の進歩は、異常なヒトの表現型と遺伝子間の相互作用を予測するのに効果的である。
本研究では,ヒト表現型オントロジー(hpo)と遺伝子との関係を予測する枠組みを開発した。
異種知識資源、すなわちオルファントからのアノテーションデータは、ヒトの表現型-遺伝子関連を解析するために用いられる。
ノード(HPOと遺伝子)の埋め込みを生成するために node2vec と呼ばれるアルゴリズムが使われた。
ランダムウォークに基づいてこのグラフでノードサンプリングを実行し、これらのサンプルノード上の特徴を学習して埋め込みを生成する。
これらの埋め込みは、5つの異なる教師付き機械学習アルゴリズムを使用して、これらのノード間のリンクの存在を予測するために下流タスクを実行するために使用された。
結果: 下流リンク予測タスクでは, 勾配ブースティング決定木ベースモデル (lightgbm) が最適auroc 0.904 と aucpr 0.784 を達成した。
さらに、lightgbmは最適重み付きf1スコア 0.87 を達成した。
他の4つの方法と比較して、LightGBMはヒトの表現型と遺伝子ペア間のより正確な相互作用やリンクを見つけることができる。
関連論文リスト
- GeSubNet: Gene Interaction Inference for Disease Subtype Network Generation [29.93863082158739]
知識データベースから遺伝子機能ネットワークを取得することは、疾患ネットワークとサブタイプ固有のバリエーションのミスマッチによる課題である。
本稿では、異なる疾患サブタイプを区別しながら、遺伝子相互作用を予測できる統一表現を学習するGeSubNetを提案する。
論文 参考訳(メタデータ) (2024-10-17T02:58:57Z) - CSGDN: Contrastive Signed Graph Diffusion Network for Predicting Crop Gene-phenotype Associations [6.5678927417916455]
我々は、より少ないトレーニングサンプルでロバストなノード表現を学習し、より高いリンク予測精度を実現するために、コントラスト符号付きグラフ拡散ネットワーク(CSGDN)を提案する。
Gossypium hirsutum, Brassica napus, Triticum turgidumの3つの作物データセット上でCSGDNの有効性を検証する実験を行った。
論文 参考訳(メタデータ) (2024-10-10T01:01:10Z) - Generation is better than Modification: Combating High Class Homophily Variance in Graph Anomaly Detection [51.11833609431406]
異なるクラス間のホモフィリー分布の差は、ホモフィリックグラフやヘテロフィリックグラフよりも著しく大きい。
我々は、この現象を定量的に記述した、クラスホモフィリーバリアンスと呼ばれる新しい計量を導入する。
その影響を軽減するために,ホモフィリーエッジ生成グラフニューラルネットワーク(HedGe)と呼ばれる新しいGNNモデルを提案する。
論文 参考訳(メタデータ) (2024-03-15T14:26:53Z) - PhenoLinker: Phenotype-Gene Link Prediction and Explanation using
Heterogeneous Graph Neural Networks [38.216545389032234]
本稿では、異種情報ネットワークと畳み込みニューラルネットワークに基づくグラフモデルを用いて、スコアを表現型-遺伝子関係に関連付けることができるPhenoLinkerを提案する。
このシステムは、新しい関連の発見や、ヒトの遺伝的変異の結果の理解に役立てることができる。
論文 参考訳(メタデータ) (2024-02-02T11:35:21Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - Graph-in-Graph (GiG): Learning interpretable latent graphs in
non-Euclidean domain for biological and healthcare applications [52.65389473899139]
グラフは、医療領域において、非ユークリッドな非ユークリッドデータをユビキタスに表現し、分析するための強力なツールである。
近年の研究では、入力データサンプル間の関係を考慮すると、下流タスクに正の正の正則化効果があることが示されている。
タンパク質分類と脳イメージングのためのニューラルネットワークアーキテクチャであるGraph-in-Graph(GiG)を提案する。
論文 参考訳(メタデータ) (2022-04-01T10:01:37Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z) - Heterogeneous Graph Neural Networks for Malicious Account Detection [64.0046412312209]
GEMは、悪意のあるアカウントを検出するための、最初の異種グラフニューラルネットワークである。
我々は、デバイス集約とアクティビティ集約という2つの基本的な弱点に基づいて、異種アカウントデバイスグラフから差別的埋め込みを学習する。
実験により、我々のアプローチは、時間とともに競合する手法と比較して、常に有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2020-02-27T18:26:44Z) - A Sparse Graph-Structured Lasso Mixed Model for Genetic Association with
Confounding Correction [28.364820868064893]
本稿では,特徴量からの関連性情報をデータセットに組み込んだグラフ構造化線形混合モデル(sGLMM)を提案する。
提案モデルは他の既存手法よりも優れており,人口構造と共有信号の両方から相関関係をモデル化できることを示す。
また、本モデルで発見されたヒトアルツハイマー病の因果遺伝子変異について検討し、最も重要な遺伝子座のいくつかを正当化する。
論文 参考訳(メタデータ) (2017-11-11T16:01:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。