論文の概要: SimpleChrome: Encoding of Combinatorial Effects for Predicting Gene
Expression
- arxiv url: http://arxiv.org/abs/2012.08671v2
- Date: Thu, 17 Dec 2020 05:58:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 06:50:20.800753
- Title: SimpleChrome: Encoding of Combinatorial Effects for Predicting Gene
Expression
- Title(参考訳): SimpleChrome: 遺伝子発現予測のためのコンビネーションエフェクトのエンコード
- Authors: Wei Cheng, Ghulam Murtaza, Aaron Wang
- Abstract要約: 遺伝子のヒストン修飾表現を学習するディープラーニングモデルであるSimpleChromeを紹介します。
このモデルから得られた特徴により、遺伝子間相互作用の潜在効果と標的遺伝子の発現に対する直接遺伝子調節をよりよく理解することができます。
- 参考スコア(独自算出の注目度): 8.326669256957352
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to recent breakthroughs in state-of-the-art DNA sequencing technology,
genomics data sets have become ubiquitous. The emergence of large-scale data
sets provides great opportunities for better understanding of genomics,
especially gene regulation. Although each cell in the human body contains the
same set of DNA information, gene expression controls the functions of these
cells by either turning genes on or off, known as gene expression levels. There
are two important factors that control the expression level of each gene: (1)
Gene regulation such as histone modifications can directly regulate gene
expression. (2) Neighboring genes that are functionally related to or interact
with each other that can also affect gene expression level. Previous efforts
have tried to address the former using Attention-based model. However,
addressing the second problem requires the incorporation of all potentially
related gene information into the model. Though modern machine learning and
deep learning models have been able to capture gene expression signals when
applied to moderately sized data, they have struggled to recover the underlying
signals of the data due to the nature of the data's higher dimensionality. To
remedy this issue, we present SimpleChrome, a deep learning model that learns
the latent histone modification representations of genes. The features learned
from the model allow us to better understand the combinatorial effects of
cross-gene interactions and direct gene regulation on the target gene
expression. The results of this paper show outstanding improvements on the
predictive capabilities of downstream models and greatly relaxes the need for a
large data set to learn a robust, generalized neural network. These results
have immediate downstream effects in epigenomics research and drug development.
- Abstract(参考訳): 最先端のDNAシークエンシング技術の進歩により、ゲノムデータセットはユビキタスになった。
大規模データセットの出現はゲノム学、特に遺伝子制御の理解を深める大きな機会となる。
人体の各細胞は同じDNA情報を含んでいるが、遺伝子発現は遺伝子発現レベルとして知られる遺伝子をオンまたはオフすることでこれらの細胞の機能を制御する。
それぞれの遺伝子の発現レベルを制御する重要な因子は2つあり、(1)ヒストン修飾などの遺伝子制御は遺伝子発現を直接制御することができる。
2) 隣り合う遺伝子は機能的に関連し, 相互に相互作用し, 遺伝子発現のレベルにも影響を及ぼす。
前者は注意に基づくモデルを用いて対処しようと試みてきた。
しかし、第二の問題に対処するには、モデルに潜在的なすべての遺伝子情報を組み込む必要がある。
現代の機械学習とディープラーニングモデルは、中程度のサイズのデータに適用すると遺伝子発現信号をキャプチャできるが、データの高次元性によってデータの基盤となるシグナルを回復するのに苦労している。
この問題を解決するために,遺伝子に潜伏したヒストン修飾表現を学習する深層学習モデルSimpleChromeを提案する。
このモデルから得られた特徴は、遺伝子間相互作用と直接的遺伝子発現制御の組合せ効果をよりよく理解することを可能にする。
本論文は,下流モデルの予測能力を大幅に改善し,頑健で汎用的なニューラルネットワークを学習するための大規模データセットの必要性を大幅に緩和することを示す。
これらの結果はエピゲノミクス研究と薬物開発に直ちに下流効果をもたらす。
関連論文リスト
- Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Efficient and Scalable Fine-Tune of Language Models for Genome
Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。
DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。
textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文 参考訳(メタデータ) (2024-02-12T21:40:45Z) - A Comparative Analysis of Gene Expression Profiling by Statistical and
Machine Learning Approaches [1.8954222800767324]
がん検体を分類する機械学習モデルの生物学的および方法論的限界について論じる。
遺伝子ランキングはこれらのモデルに適応した説明可能性法から得られる。
ブラックボックスニューラルネットワークによって学習された情報は、微分表現の概念と関連している。
論文 参考訳(メタデータ) (2024-02-01T18:17:36Z) - MuSe-GNN: Learning Unified Gene Representation From Multimodal
Biological Graph Data [22.938437500266847]
マルチモーダル類似性学習グラフニューラルネットワークという新しいモデルを提案する。
マルチモーダル機械学習とディープグラフニューラルネットワークを組み合わせて、単一セルシークエンシングと空間転写データから遺伝子発現を学習する。
本モデルでは, 遺伝子機能, 組織機能, 疾患, 種進化の解析のために, 統合された遺伝子表現を効率よく生成する。
論文 参考訳(メタデータ) (2023-09-29T13:33:53Z) - HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide
Resolution [76.97231739317259]
本稿では,ヒト参照ゲノム上に,最大100万個のトークンを単一ヌクレオチドレベルで有するゲノム基盤モデルであるHyenaDNAについて紹介する。
Nucleotide Transformerの微調整されたベンチマークでは、HyenaDNAが18のデータセットのうち12の最先端(SotA)に到達した。
論文 参考訳(メタデータ) (2023-06-27T20:46:34Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - SemanticCAP: Chromatin Accessibility Prediction Enhanced by Features
Learning from a Language Model [3.0643865202019698]
本稿では、ゲノムのアクセス可能な領域を特定するためのSemanticCAPという新しいソリューションを提案する。
遺伝子配列のコンテキストをモデル化する遺伝子モデルを導入し、遺伝子配列の効果的な表現を提供する。
公開ベンチマークによる他のシステムと比較すると,我々のモデルは性能が向上することが判明した。
論文 参考訳(メタデータ) (2022-04-05T11:47:58Z) - VEGN: Variant Effect Prediction with Graph Neural Networks [19.59965282985234]
本稿では,遺伝子と変異を持つ異種グラフ上で動作するグラフニューラルネットワーク(GNN)を用いて,変異効果予測をモデル化したVEGNを提案する。
このグラフは、変異体を遺伝子に割り当て、遺伝子-遺伝子相互作用ネットワークに遺伝子を接続することによって作成される。
VeGNは既存の最先端モデルの性能を改善する。
論文 参考訳(メタデータ) (2021-06-25T13:51:46Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。