論文の概要: Identifying DNA Sequence Motifs Using Deep Learning
- arxiv url: http://arxiv.org/abs/2311.12884v1
- Date: Mon, 20 Nov 2023 23:14:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 17:34:10.118211
- Title: Identifying DNA Sequence Motifs Using Deep Learning
- Title(参考訳): ディープラーニングによるDNA配列の同定
- Authors: Asmita Poddar, Vladimir Uzun, Elizabeth Tunbridge, Wilfried Haerty,
Alejo Nevado-Holgado
- Abstract要約: 我々は,DNAシークエンス内のヌクレオチドの長期依存性をキャプチャする,注目に基づくディープラーニングシーケンスモデルであるDeepDeCodeを紹介した。
本稿では,DeepDeCodeの解釈可能性と信頼性を高めるために,シーケンスモチーフの正確な識別に可視化技術を用いることを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Splice sites play a crucial role in gene expression, and accurate prediction
of these sites in DNA sequences is essential for diagnosing and treating
genetic disorders. We address the challenge of splice site prediction by
introducing DeepDeCode, an attention-based deep learning sequence model to
capture the long-term dependencies in the nucleotides in DNA sequences. We
further propose using visualization techniques for accurate identification of
sequence motifs, which enhance the interpretability and trustworthiness of
DeepDeCode. We compare DeepDeCode to other state-of-the-art methods for splice
site prediction and demonstrate its accuracy, explainability and efficiency.
Given the results of our methodology, we expect that it can used for healthcare
applications to reason about genomic processes and be extended to discover new
splice sites and genomic regulatory elements.
- Abstract(参考訳): スプライス部位は遺伝子発現において重要な役割を担い、DNA配列におけるこれらの部位の正確な予測は遺伝子疾患の診断と治療に不可欠である。
我々は,DNAシークエンス内のヌクレオチドの長期依存性をキャプチャする注目ベースのディープラーニングシーケンスモデルであるDeepDeCodeを導入することで,スプライスサイト予測の課題に対処する。
さらに,deepdecodeの解釈性と信頼性を高めるために,シーケンスモチーフの正確な識別のための可視化手法を提案する。
我々はDeepDeCodeと他の最先端のサイト予測手法を比較し、その精度、説明可能性、効率を実証する。
本手法の結果から, 医療応用においてゲノム過程を解明し, 新たなスプライス部位やゲノム調節要素の発見に応用できることが期待される。
関連論文リスト
- Dy-mer: An Explainable DNA Sequence Representation Scheme using Sparse Recovery [6.733319363951907]
textbfDy-merはスパースリカバリに基づく説明可能で堅牢な表現スキームである。
DNAプロモーターの分類における最先端のパフォーマンスを達成し、textbf13%の精度向上をもたらす。
論文 参考訳(メタデータ) (2024-07-06T15:08:31Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Horizon-wise Learning Paradigm Promotes Gene Splicing Identification [6.225959701339916]
本稿では,Horizon-wise Gene Splicing Identification (H-GSI) という遺伝子スプライシング識別作業のための新しいフレームワークを提案する。
提案するH-GSIは,文字列データをテンソルに変換する前処理手順,長いシーケンスを扱うスライディングウインドウ手法,SeqLabモデル,予測器の4つのコンポーネントから構成される。
切断された固定長配列で遺伝子情報を処理している既存の研究とは対照的に、H-GSIは1つの前方計算でシーケンス内の全ての位置を予測する水平方向同定パラダイムを採用している。
論文 参考訳(メタデータ) (2024-06-15T08:18:09Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - BEND: Benchmarking DNA Language Models on biologically meaningful tasks [7.005668635562045]
DNA言語モデルのベンチマークであるBENDを紹介し、現実的で生物学的に意味のある下流タスクのコレクションを特徴とする。
現在のDNA LMからの埋め込みは、一部のタスクにおいて専門家メソッドのパフォーマンスにアプローチできるが、長距離機能に関する限られた情報しか取得できない。
論文 参考訳(メタデータ) (2023-11-21T12:34:00Z) - Embed-Search-Align: DNA Sequence Alignment using Transformer Models [2.48439258515764]
我々はTransformerモデルのシーケンスアライメントタスクを"Embed-Search-Align"タスクとしてフレーミングすることでギャップを埋める。
新規なレファレンスフリーDNA埋め込みモデルは、共有ベクトル空間に投影される読み取りおよび参照フラグメントの埋め込みを生成する。
DNA-ESAは、BowtieやBWA-Memといった従来の手法に匹敵する、ヒトゲノム(3gb)に250長の読み書きを合わせると99%正確である。
論文 参考訳(メタデータ) (2023-09-20T06:30:39Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。