論文の概要: Isoform Function Prediction Using a Deep Neural Network
- arxiv url: http://arxiv.org/abs/2208.03325v3
- Date: Tue, 25 Apr 2023 17:04:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 00:11:30.601537
- Title: Isoform Function Prediction Using a Deep Neural Network
- Title(参考訳): ディープニューラルネットワークを用いた等方関数予測
- Authors: Sara Ghazanfari, Ali Rasteh, Seyed Abolfazl Motahari, Mahdieh
Soleymani Baghshah
- Abstract要約: 研究によると、ヒトのマルチエクソン遺伝子のうち95%以上が代替スプライシングを受けている。
代替スプライシングは、ヒトの健康と病気において重要な役割を果たす。
このプロジェクトは条件付きデータとmRNA配列、発現プロファイル、遺伝子グラフなどの貴重な情報を使用する。
- 参考スコア(独自算出の注目度): 9.507435239304591
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Isoforms are mRNAs produced from the same gene site in the phenomenon called
Alternative Splicing. Studies have shown that more than 95% of human multi-exon
genes have undergone alternative splicing. Although there are few changes in
mRNA sequence, They may have a systematic effect on cell function and
regulation. It is widely reported that isoforms of a gene have distinct or even
contrasting functions. Most studies have shown that alternative splicing plays
a significant role in human health and disease. Despite the wide range of gene
function studies, there is little information about isoforms' functionalities.
Recently, some computational methods based on Multiple Instance Learning have
been proposed to predict isoform function using gene function and gene
expression profile. However, their performance is not desirable due to the lack
of labeled training data. In addition, probabilistic models such as Conditional
Random Field (CRF) have been used to model the relation between isoforms. This
project uses all the data and valuable information such as isoform sequences,
expression profiles, and gene ontology graphs and proposes a comprehensive
model based on Deep Neural Networks. The UniProt Gene Ontology (GO) database is
used as a standard reference for gene functions. The NCBI RefSeq database is
used for extracting gene and isoform sequences, and the NCBI SRA database is
used for expression profile data. Metrics such as Receiver Operating
Characteristic Area Under the Curve (ROC AUC) and Precision-Recall Under the
Curve (PR AUC) are used to measure the prediction accuracy.
- Abstract(参考訳): アイソフォームは、オルタナティブスプライシングと呼ばれる現象において同じ遺伝子部位から生成されるmRNAである。
ヒトマルチエクソン遺伝子の95%以上が代替スプライシングを受けていることが研究で示されている。
mRNA配列にはほとんど変化はないが、細胞機能や調節に系統的な影響を及ぼす可能性がある。
遺伝子のアイソフォームは異なる、あるいは対照的な機能を持っていると広く報告されている。
多くの研究は、代替スプライシングが人間の健康と病気に重要な役割を果たすことを示した。
幅広い遺伝子機能研究にもかかわらず、アイソフォームの機能についてはほとんど情報がない。
近年,遺伝子機能と遺伝子発現プロファイルを用いてアイソフォーム関数を予測するために,複数インスタンス学習に基づく計算手法が提案されている。
しかし、ラベル付きトレーニングデータがないため、それらのパフォーマンスは望ましいものではない。
さらに、条件ランダム場(CRF)のような確率モデルを用いてアイソフォームの関係をモデル化している。
本研究は, アイソフォーム配列, 発現プロファイル, 遺伝子オントロジーグラフなどのデータと貴重な情報を全て利用し, ディープニューラルネットワークに基づく包括的モデルを提案する。
UniProt Gene Ontology (GO)データベースは、遺伝子機能の標準参照として使用される。
NCBI RefSeqデータベースは遺伝子およびアイソフォーム配列の抽出に使用され、NCBI SRAデータベースは発現プロファイルデータに使用される。
予測精度の測定には、曲線下の受信機動作特性領域(roc auc)や曲線下の精度リコール(pr auc)などの指標を用いる。
関連論文リスト
- Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Genetic heterogeneity analysis using genetic algorithm and network
science [2.6166087473624318]
ゲノムワイド・アソシエーション(GWAS)は、疾患に感受性のある遺伝的変数を同定することができる。
遺伝的効果に絡み合った遺伝的変数は、しばしば低い効果サイズを示す。
本稿では,FCSNet(Feature Co-Selection Network)という,GWASのための新しい特徴選択機構を提案する。
論文 参考訳(メタデータ) (2023-08-12T01:28:26Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Optirank: classification for RNA-Seq data with optimal ranking reference
genes [0.0]
そこで我々は,ロジスティック回帰モデルであるOptiicrankを提案し,モデルと遺伝子のパラメータを同時に学習し,ランキングの基準セットとして使用する。
また、列車データと試験データの間に異なる種類の分散シフトを示す実際の分類タスクについても検討する。
論文 参考訳(メタデータ) (2023-01-11T10:49:06Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Neural network facilitated ab initio derivation of linear formula: A
case study on formulating the relationship between DNA motifs and gene
expression [8.794181445664243]
本稿では、解釈可能なニューラルネットワークモデルに基づく新しいアプローチを用いて、シーケンスモチーフと線形式を導出するためのフレームワークを提案する。
この線形モデルは、深いニューラルネットワークモデルに匹敵する性能を持つプロモーター配列を用いて遺伝子発現レベルを予測することができることを示した。
論文 参考訳(メタデータ) (2022-08-19T22:29:30Z) - SemanticCAP: Chromatin Accessibility Prediction Enhanced by Features
Learning from a Language Model [3.0643865202019698]
本稿では、ゲノムのアクセス可能な領域を特定するためのSemanticCAPという新しいソリューションを提案する。
遺伝子配列のコンテキストをモデル化する遺伝子モデルを導入し、遺伝子配列の効果的な表現を提供する。
公開ベンチマークによる他のシステムと比較すると,我々のモデルは性能が向上することが判明した。
論文 参考訳(メタデータ) (2022-04-05T11:47:58Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A Semi-Supervised Generative Adversarial Network for Prediction of
Genetic Disease Outcomes [0.0]
本稿では, 遺伝的な遺伝的データセットを作成するために, gGAN (Generative Adversarial Networks) を導入する。
我々のゴールは、遺伝子プロファイルだけで病気の重篤な形態を発達させる新しい個人の正当性を決定することである。
提案モデルは自己認識型であり、ネットワークがトレーニングされたデータと十分に互換性のある新しい遺伝子プロファイルを決定することができる。
論文 参考訳(メタデータ) (2020-07-02T15:35:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。