論文の概要: G4-Attention: Deep Learning Model with Attention for predicting DNA
G-Quadruplexes
- arxiv url: http://arxiv.org/abs/2403.02765v1
- Date: Tue, 5 Mar 2024 08:34:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 15:26:36.829800
- Title: G4-Attention: Deep Learning Model with Attention for predicting DNA
G-Quadruplexes
- Title(参考訳): G4-Attention: DNA G-Quadruplexs 予測のための深層学習モデル
- Authors: Shrimon Mukherjee, Pulakesh Pramanik, Partha Basuchowdhuri, Santanu
Bhattacharya
- Abstract要約: 本稿では,G4生成シーケンスを予測するために,Bi-LSTMとG4アテンションと呼ばれるアテンション層を用いた新しい畳み込みニューラルネットワークを提案する。
G4アテンションは精度が高く、G4予測タスクにおいて最先端の結果が得られる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: G-Quadruplexes are the four-stranded non-canonical nucleic acid secondary
structures, formed by the stacking arrangement of the guanine tetramers. They
are involved in a wide range of biological roles because of their exceptionally
unique and distinct structural characteristics. After the completion of the
human genome sequencing project, a lot of bioinformatic algorithms were
introduced to predict the active G4s regions \textit{in vitro} based on the
canonical G4 sequence elements, G-\textit{richness}, and G-\textit{skewness},
as well as the non-canonical sequence features. Recently, sequencing techniques
like G4-seq and G4-ChIP-seq were developed to map the G4s \textit{in vitro},
and \textit{in vivo} respectively at a few hundred base resolution.
Subsequently, several machine learning approaches were developed for predicting
the G4 regions using the existing databases. However, their prediction models
were simplistic, and the prediction accuracy was notably poor. In response,
here, we propose a novel convolutional neural network with Bi-LSTM and
attention layers, named G4-attention, to predict the G4 forming sequences with
improved accuracy. G4-attention achieves high accuracy and attains
state-of-the-art results in the G4 prediction task. Our model also predicts the
G4 regions accurately in the highly class-imbalanced datasets. In addition, the
developed model trained on the human genome dataset can be applied to any
non-human genome DNA sequences to predict the G4 formation propensities.
- Abstract(参考訳): g-クアドルプレックス(g-quadruplexes)は4本鎖の非カノニカル核酸二次構造であり、グアニンテトラマーの積み重ね配列によって形成される。
それらは、その特異な特異な構造的特徴から、幅広い生物学的役割に関与している。
ヒトゲノムシークエンシングプロジェクトの完了後、標準G4配列要素、G-\textit{richness}、G-\textit{skewness}、および非標準配列特徴に基づいて、活性G4s領域 \textit{in vitro} を予測するために多くのバイオインフォマティクスアルゴリズムが導入された。
近年、G4s \textit{in vitro} と \textit{in vivo} のそれぞれを数百塩基分解能でマッピングするために、G4-seq と G4-ChIP-seq のようなシークエンシング技術が開発された。
その後,既存のデータベースを用いたg4領域の予測のために,いくつかの機械学習手法が開発された。
しかし、それらの予測モデルは単純であり、予測精度は顕著に低かった。
そこで本研究では,G4生成シーケンスを精度良く予測するために,Bi-LSTMとG4アテンションと呼ばれるアテンション層を用いた新しい畳み込みニューラルネットワークを提案する。
g4-attentionは高い精度を達成し、g4予測タスクで最先端の結果を得る。
また,本モデルでは,高度にクラス不均衡なデータセットにおいて,g4領域を正確に予測する。
さらに、ヒトゲノムデータセットに基づいてトレーニングされた開発モデルは、非ヒトゲノムDNA配列に適用でき、G4形成確率を予測することができる。
関連論文リスト
- CGRclust: Chaos Game Representation for Twin Contrastive Clustering of Unlabelled DNA Sequences [0.0]
CGRclustは、DNA配列のChaos Game Representations(CGR)と畳み込みニューラルネットワーク(CNN)を組み合わせた、教師なし双対のコントラストクラスタリングの新規な組み合わせである
CGRclustは、DNA配列のクラスタリングデータセットのイメージ分類に教師なし学習を使用する最初の方法である。
CGRclustは、魚類のミトコンドリアDNAゲノムで検査された4つの分類レベル全てで81.70%を超える唯一の方法である。
論文 参考訳(メタデータ) (2024-07-01T23:24:05Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - Heterogeneous Graph Neural Architecture Search with GPT-4 [24.753296919178407]
不均一グラフニューラルネットワーク(HGNAS)は、有効な異種グラフニューラルネットワークを自動設計するための強力なツールである。
既存のHGNASアルゴリズムは、非効率な探索と不安定な結果に悩まされている。
我々は,HGNASの探索効率と探索精度を向上させるため,新しいGPT-4ベースのHGNASモデルを提案する。
論文 参考訳(メタデータ) (2023-12-14T06:31:52Z) - A Survey on Graph Neural Networks for Time Series: Forecasting, Classification, Imputation, and Anomaly Detection [98.41798478488101]
時系列分析は、利用可能なデータに暗黙的な情報の富を解放するために不可欠である。
グラフニューラルネットワーク(GNN)の最近の進歩は、時系列解析のためのGNNベースのアプローチの急増につながっている。
この調査は、GNNベースの時系列研究に関する膨大な知識をまとめ、基礎、実践的応用、時系列分析のためのグラフニューラルネットワークの機会を強調します。
論文 参考訳(メタデータ) (2023-07-07T08:05:03Z) - Granger causal inference on DAGs identifies genomic loci regulating
transcription [77.58911272503771]
GrID-Netは、DBG構造化システムにおけるGranger因果推論のためのラタグメッセージパッシングを備えたグラフニューラルネットワークに基づくフレームワークである。
我々の応用は、特定の遺伝子の調節を仲介するゲノム座を同定する単一セルマルチモーダルデータの解析である。
論文 参考訳(メタデータ) (2022-10-18T21:15:10Z) - Are we really making much progress? Revisiting, benchmarking, and
refining heterogeneous graph neural networks [38.15094159495419]
異種グラフニューラルネットワーク(HGNN)の系統的再生について述べる。
単純な同種GNN(例えばGCNとGAT)は、不適切な設定のため、大半が過小評価されている。
頑健で再現可能なHGNN研究を容易にするため、異種グラフベンチマーク(HGB)を構築した。
論文 参考訳(メタデータ) (2021-12-30T06:29:21Z) - GIPA: General Information Propagation Algorithm for Graph Learning [3.228614352581043]
属性付きグラフデータ学習のための新しいグラフ注目ニューラルネットワーク、すなわちGIPAを紹介します。
GIPAは3つの重要なコンポーネントで構成されている。
Open Graph Benchmark protein データセットを用いてGIPAの性能を評価する。
論文 参考訳(メタデータ) (2021-05-13T01:50:43Z) - Permutation-equivariant and Proximity-aware Graph Neural Networks with
Stochastic Message Passing [88.30867628592112]
グラフニューラルネットワーク(GNN)は、グラフ上の新たな機械学習モデルである。
置換等価性と近接認識性は、GNNにとって非常に望ましい2つの重要な特性である。
既存のGNNは、主にメッセージパッシング機構に基づいており、同時に2つの特性を保存できないことを示す。
ノードの近さを保つため,既存のGNNをノード表現で拡張する。
論文 参考訳(メタデータ) (2020-09-05T16:46:56Z) - Infinitely Wide Graph Convolutional Networks: Semi-supervised Learning
via Gaussian Processes [144.6048446370369]
グラフ畳み込みニューラルネットワーク(GCN)は近年,グラフに基づく半教師付き半教師付き分類において有望な結果を示した。
グラフに基づく半教師付き学習のためのGCN(GPGC)を用いたGP回帰モデルを提案する。
GPGCを評価するための広範囲な実験を行い、他の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-02-26T10:02:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。