論文の概要: Evaluation of network-guided random forest for disease gene discovery
- arxiv url: http://arxiv.org/abs/2308.01323v1
- Date: Wed, 2 Aug 2023 09:34:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 16:28:58.451428
- Title: Evaluation of network-guided random forest for disease gene discovery
- Title(参考訳): 病気遺伝子発見のためのネットワーク誘導ランダム森林の評価
- Authors: Jianchang Hu, Silke Szymczak
- Abstract要約: 遺伝子ネットワーク情報は病原体や経路同定に有用であると考えられている。
本稿では,ネットワーク情報をサンプリング確率予測変数に要約したネットワーク誘導RFの性能について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gene network information is believed to be beneficial for disease module and
pathway identification, but has not been explicitly utilized in the standard
random forest (RF) algorithm for gene expression data analysis. We investigate
the performance of a network-guided RF where the network information is
summarized into a sampling probability of predictor variables which is further
used in the construction of the RF. Our results suggest that network-guided RF
does not provide better disease prediction than the standard RF. In terms of
disease gene discovery, if disease genes form module(s), network-guided RF
identifies them more accurately. In addition, when disease status is
independent from genes in the given network, spurious gene selection results
can occur when using network information, especially on hub genes. Our
empirical analysis on two balanced microarray and RNA-Seq breast cancer
datasets from The Cancer Genome Atlas (TCGA) for classification of progesterone
receptor (PR) status also demonstrates that network-guided RF can identify
genes from PGR-related pathways, which leads to a better connected module of
identified genes.
- Abstract(参考訳): 遺伝子ネットワーク情報は病気モジュールや経路同定に有用であると考えられているが、遺伝子発現データ解析の標準ランダムフォレスト(RF)アルゴリズムでは明確に利用されていない。
本研究では、ネットワーク情報を要約したネットワーク誘導型RFの性能を予測変数のサンプリング確率として検討し、RFの構築にさらに活用する。
以上の結果から,ネットワーク誘導RFは標準RFよりも疾患予測に優れていないことが示唆された。
疾患遺伝子発見の観点では、病気遺伝子がモジュールを形成する場合、ネットワーク誘導RFはそれらをより正確に識別する。
また、病状が所定のネットワーク内の遺伝子から独立している場合、ネットワーク情報、特にハブ遺伝子を用いて、急激な遺伝子選択結果が生じる可能性がある。
The Cancer Genome Atlas (TCGA) の2つのバランスしたマイクロアレイとRNA-Seq乳がんデータセットを用いた実証分析により、プロゲステロン受容体 (PR) の分類が可能であり、ネットワーク誘導RFがPGR関連経路から遺伝子を同定できることが示され、同定された遺伝子のより優れた連結モジュールが得られた。
関連論文リスト
- An Evolutional Neural Network Framework for Classification of Microarray Data [0.0]
本研究の目的は,遺伝的アルゴリズムとニューラルネットワークのハイブリッドモデルを用いて,情報的遺伝子のサブセット選択において問題を克服することである。
実験の結果,提案手法は,他の機械学習アルゴリズムと比較して,高い精度と最小数の選択遺伝子が示唆された。
論文 参考訳(メタデータ) (2024-11-20T13:48:40Z) - Recovering Time-Varying Networks From Single-Cell Data [11.04189396013616]
時系列単細胞遺伝子発現データから動的グラフを推論するディープニューラルネットワークであるMarleneを開発した。
Marleneは、新型コロナウイルスの免疫反応、線維化、老化など、特定の生物学的反応に関連する遺伝子相互作用を同定することができる。
論文 参考訳(メタデータ) (2024-10-01T19:18:51Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - DynGFN: Towards Bayesian Inference of Gene Regulatory Networks with
GFlowNets [81.75973217676986]
遺伝子調節ネットワーク(GRN)は、遺伝子発現と細胞機能を制御する遺伝子とその産物間の相互作用を記述する。
既存の方法は、チャレンジ(1)、ダイナミックスから循環構造を識別すること、あるいはチャレンジ(2)、DAGよりも複雑なベイズ後部を学習することに焦点を当てるが、両方ではない。
本稿では、RNAベロシティ技術を用いて遺伝子発現の「速度」を推定できるという事実を活用し、両方の課題に対処するアプローチを開発する。
論文 参考訳(メタデータ) (2023-02-08T16:36:40Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - ARISE: Graph Anomaly Detection on Attributed Networks via Substructure
Awareness [70.60721571429784]
サブ構造認識(ARISE)による属性付きネットワーク上の新しいグラフ異常検出フレームワークを提案する。
ARISEは、異常を識別するグラフのサブ構造に焦点を当てている。
実験により、ARISEは最先端の属性付きネットワーク異常検出(ANAD)アルゴリズムと比較して、検出性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2022-11-28T12:17:40Z) - SGC: A semi-supervised pipeline for gene clustering using self-training
approach in gene co-expression networks [3.8073142980733]
本稿では,スペクトルネットワーク理論の数学に基づく遺伝子クラスタリングのための新しいパイプラインを提案する。
SGCは、教師なしの方法で高度に強化されたモジュールの計算を可能にする複数の新しいステップで構成されている。
実データにおいて,SGCが高密度化をもたらすことを示す。
論文 参考訳(メタデータ) (2022-09-21T14:51:08Z) - Efficient Inference of Spatially-varying Gaussian Markov Random Fields
with Applications in Gene Regulatory Networks [6.007044214910084]
SV-GMRFの重要な応用は、転写学データセットからの遺伝子制御ネットワークの推測である。
本稿では,統計的および計算的保証の強い正規化最大推定(MLE)の代わりに,単純で効率的な最適化問題を提案する。
2分以内で200万以上の変数を持つSV-GMRFのインスタンスを解くことができる。
論文 参考訳(メタデータ) (2022-06-21T08:15:24Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - A Semi-Supervised Generative Adversarial Network for Prediction of
Genetic Disease Outcomes [0.0]
本稿では, 遺伝的な遺伝的データセットを作成するために, gGAN (Generative Adversarial Networks) を導入する。
我々のゴールは、遺伝子プロファイルだけで病気の重篤な形態を発達させる新しい個人の正当性を決定することである。
提案モデルは自己認識型であり、ネットワークがトレーニングされたデータと十分に互換性のある新しい遺伝子プロファイルを決定することができる。
論文 参考訳(メタデータ) (2020-07-02T15:35:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。