論文の概要: Evaluation of network-guided random forest for disease gene discovery
- arxiv url: http://arxiv.org/abs/2308.01323v1
- Date: Wed, 2 Aug 2023 09:34:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 16:28:58.451428
- Title: Evaluation of network-guided random forest for disease gene discovery
- Title(参考訳): 病気遺伝子発見のためのネットワーク誘導ランダム森林の評価
- Authors: Jianchang Hu, Silke Szymczak
- Abstract要約: 遺伝子ネットワーク情報は病原体や経路同定に有用であると考えられている。
本稿では,ネットワーク情報をサンプリング確率予測変数に要約したネットワーク誘導RFの性能について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gene network information is believed to be beneficial for disease module and
pathway identification, but has not been explicitly utilized in the standard
random forest (RF) algorithm for gene expression data analysis. We investigate
the performance of a network-guided RF where the network information is
summarized into a sampling probability of predictor variables which is further
used in the construction of the RF. Our results suggest that network-guided RF
does not provide better disease prediction than the standard RF. In terms of
disease gene discovery, if disease genes form module(s), network-guided RF
identifies them more accurately. In addition, when disease status is
independent from genes in the given network, spurious gene selection results
can occur when using network information, especially on hub genes. Our
empirical analysis on two balanced microarray and RNA-Seq breast cancer
datasets from The Cancer Genome Atlas (TCGA) for classification of progesterone
receptor (PR) status also demonstrates that network-guided RF can identify
genes from PGR-related pathways, which leads to a better connected module of
identified genes.
- Abstract(参考訳): 遺伝子ネットワーク情報は病気モジュールや経路同定に有用であると考えられているが、遺伝子発現データ解析の標準ランダムフォレスト(RF)アルゴリズムでは明確に利用されていない。
本研究では、ネットワーク情報を要約したネットワーク誘導型RFの性能を予測変数のサンプリング確率として検討し、RFの構築にさらに活用する。
以上の結果から,ネットワーク誘導RFは標準RFよりも疾患予測に優れていないことが示唆された。
疾患遺伝子発見の観点では、病気遺伝子がモジュールを形成する場合、ネットワーク誘導RFはそれらをより正確に識別する。
また、病状が所定のネットワーク内の遺伝子から独立している場合、ネットワーク情報、特にハブ遺伝子を用いて、急激な遺伝子選択結果が生じる可能性がある。
The Cancer Genome Atlas (TCGA) の2つのバランスしたマイクロアレイとRNA-Seq乳がんデータセットを用いた実証分析により、プロゲステロン受容体 (PR) の分類が可能であり、ネットワーク誘導RFがPGR関連経路から遺伝子を同定できることが示され、同定された遺伝子のより優れた連結モジュールが得られた。
関連論文リスト
- Learning to Discover Regulatory Elements for Gene Expression Prediction [59.470991831978516]
Seq2Expは、ターゲット遺伝子発現を駆動する制御要素を発見し、抽出するために設計されたSequence to Expressionネットワークである。
本手法は, エピジェノミックシグナル, DNA 配列とその関連因子の因果関係を捉える。
論文 参考訳(メタデータ) (2025-02-19T03:25:49Z) - Gene Regulatory Network Inference in the Presence of Selection Bias and Latent Confounders [14.626706466908386]
Gene Regulatory Network Inference (GRNI) は遺伝子発現データを用いて遺伝子間の因果関係を同定することを目的としている。
遺伝子発現は非コーディングRNAのような潜伏した共同設立者の影響を受けており、GRNIに複雑さを増す。
本稿では,選択バイアスと潜在的共同設立者の存在下でのGISL(Gene Regulatory Network Inference in the presence of Selection bias and Latent Confounders)を提案する。
論文 参考訳(メタデータ) (2025-01-17T11:27:58Z) - An Evolutional Neural Network Framework for Classification of Microarray Data [0.0]
本研究の目的は,遺伝的アルゴリズムとニューラルネットワークのハイブリッドモデルを用いて,情報的遺伝子のサブセット選択において問題を克服することである。
実験の結果,提案手法は,他の機械学習アルゴリズムと比較して,高い精度と最小数の選択遺伝子が示唆された。
論文 参考訳(メタデータ) (2024-11-20T13:48:40Z) - Recovering Time-Varying Networks From Single-Cell Data [11.04189396013616]
時系列単細胞遺伝子発現データから動的グラフを推論するディープニューラルネットワークであるMarleneを開発した。
Marleneは、新型コロナウイルスの免疫反応、線維化、老化など、特定の生物学的反応に関連する遺伝子相互作用を同定することができる。
論文 参考訳(メタデータ) (2024-10-01T19:18:51Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - DynGFN: Towards Bayesian Inference of Gene Regulatory Networks with
GFlowNets [81.75973217676986]
遺伝子調節ネットワーク(GRN)は、遺伝子発現と細胞機能を制御する遺伝子とその産物間の相互作用を記述する。
既存の方法は、チャレンジ(1)、ダイナミックスから循環構造を識別すること、あるいはチャレンジ(2)、DAGよりも複雑なベイズ後部を学習することに焦点を当てるが、両方ではない。
本稿では、RNAベロシティ技術を用いて遺伝子発現の「速度」を推定できるという事実を活用し、両方の課題に対処するアプローチを開発する。
論文 参考訳(メタデータ) (2023-02-08T16:36:40Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - ARISE: Graph Anomaly Detection on Attributed Networks via Substructure
Awareness [70.60721571429784]
サブ構造認識(ARISE)による属性付きネットワーク上の新しいグラフ異常検出フレームワークを提案する。
ARISEは、異常を識別するグラフのサブ構造に焦点を当てている。
実験により、ARISEは最先端の属性付きネットワーク異常検出(ANAD)アルゴリズムと比較して、検出性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2022-11-28T12:17:40Z) - Efficient Inference of Spatially-varying Gaussian Markov Random Fields
with Applications in Gene Regulatory Networks [6.007044214910084]
SV-GMRFの重要な応用は、転写学データセットからの遺伝子制御ネットワークの推測である。
本稿では,統計的および計算的保証の強い正規化最大推定(MLE)の代わりに,単純で効率的な最適化問題を提案する。
2分以内で200万以上の変数を持つSV-GMRFのインスタンスを解くことができる。
論文 参考訳(メタデータ) (2022-06-21T08:15:24Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - A Semi-Supervised Generative Adversarial Network for Prediction of
Genetic Disease Outcomes [0.0]
本稿では, 遺伝的な遺伝的データセットを作成するために, gGAN (Generative Adversarial Networks) を導入する。
我々のゴールは、遺伝子プロファイルだけで病気の重篤な形態を発達させる新しい個人の正当性を決定することである。
提案モデルは自己認識型であり、ネットワークがトレーニングされたデータと十分に互換性のある新しい遺伝子プロファイルを決定することができる。
論文 参考訳(メタデータ) (2020-07-02T15:35:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。