論文の概要: Identifying DNA Sequence Motifs Using Deep Learning
- arxiv url: http://arxiv.org/abs/2311.12884v1
- Date: Mon, 20 Nov 2023 23:14:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 17:34:10.118211
- Title: Identifying DNA Sequence Motifs Using Deep Learning
- Title(参考訳): ディープラーニングによるDNA配列の同定
- Authors: Asmita Poddar, Vladimir Uzun, Elizabeth Tunbridge, Wilfried Haerty,
Alejo Nevado-Holgado
- Abstract要約: 我々は,DNAシークエンス内のヌクレオチドの長期依存性をキャプチャする,注目に基づくディープラーニングシーケンスモデルであるDeepDeCodeを紹介した。
本稿では,DeepDeCodeの解釈可能性と信頼性を高めるために,シーケンスモチーフの正確な識別に可視化技術を用いることを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Splice sites play a crucial role in gene expression, and accurate prediction
of these sites in DNA sequences is essential for diagnosing and treating
genetic disorders. We address the challenge of splice site prediction by
introducing DeepDeCode, an attention-based deep learning sequence model to
capture the long-term dependencies in the nucleotides in DNA sequences. We
further propose using visualization techniques for accurate identification of
sequence motifs, which enhance the interpretability and trustworthiness of
DeepDeCode. We compare DeepDeCode to other state-of-the-art methods for splice
site prediction and demonstrate its accuracy, explainability and efficiency.
Given the results of our methodology, we expect that it can used for healthcare
applications to reason about genomic processes and be extended to discover new
splice sites and genomic regulatory elements.
- Abstract(参考訳): スプライス部位は遺伝子発現において重要な役割を担い、DNA配列におけるこれらの部位の正確な予測は遺伝子疾患の診断と治療に不可欠である。
我々は,DNAシークエンス内のヌクレオチドの長期依存性をキャプチャする注目ベースのディープラーニングシーケンスモデルであるDeepDeCodeを導入することで,スプライスサイト予測の課題に対処する。
さらに,deepdecodeの解釈性と信頼性を高めるために,シーケンスモチーフの正確な識別のための可視化手法を提案する。
我々はDeepDeCodeと他の最先端のサイト予測手法を比較し、その精度、説明可能性、効率を実証する。
本手法の結果から, 医療応用においてゲノム過程を解明し, 新たなスプライス部位やゲノム調節要素の発見に応用できることが期待される。
関連論文リスト
- DNA Sequence Classification with Compressors [0.0]
本研究は,DNA配列解析に適した圧縮機を用いたパラメータフリー分類法を新たに導入する。
この手法は、精度の観点から現在の最先端と整合するだけでなく、従来の機械学習手法よりもリソース効率の良い代替手段を提供する。
論文 参考訳(メタデータ) (2024-01-25T09:17:19Z) - ContraNovo: A Contrastive Learning Approach to Enhance De Novo Peptide
Sequencing [70.12220342151113]
ContraNovoは、コントラスト学習を利用してスペクトルとペプチドの関係を抽出する先駆的アルゴリズムである。
ContraNovoは、現代最先端のソリューションを一貫して誇張している。
論文 参考訳(メタデータ) (2023-12-18T12:49:46Z) - BEND: Benchmarking DNA Language Models on biologically meaningful tasks [7.005668635562045]
DNA言語モデルのベンチマークであるBENDを紹介し、現実的で生物学的に意味のある下流タスクのコレクションを特徴とする。
現在のDNA LMからの埋め込みは、一部のタスクにおいて専門家メソッドのパフォーマンスにアプローチできるが、長距離機能に関する限られた情報しか取得できない。
論文 参考訳(メタデータ) (2023-11-21T12:34:00Z) - Embed-Search-Align: DNA Sequence Alignment using Transformer Models [2.48439258515764]
3ギガ塩基(単一ハプロイド)のヒト基準ゲノム上にDNA読取を調整するための組込み検索タスクを提案する。
DNA-ESAは、250長の読みを3ギガ塩基(単倍体)のヒト基準ゲノムに合わせると97%正確である
論文 参考訳(メタデータ) (2023-09-20T06:30:39Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - DNAGPT: A Generalized Pre-trained Tool for Versatile DNA Sequence
Analysis Tasks [14.931476374660944]
DNAGPTは、全哺乳類から200億以上の塩基対をトレーニングした、一般的なDNA事前学習モデルである。
古典的なGPTモデルをバイナリ分類タスク、数値回帰タスク、包括的トークン言語で拡張することにより、DNAGPTは汎用的なDNA解析タスクを処理できる。
論文 参考訳(メタデータ) (2023-07-11T06:30:43Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - SNP2Vec: Scalable Self-Supervised Pre-Training for Genome-Wide
Association Study [48.75445626157713]
SNP2Vecは、SNPを理解するためのスケーラブルな自己教師付き事前学習手法である。
本研究では,SNP2Vecを用いて時系列ゲノミクスモデリングを行う。
中国コホートにおけるアルツハイマー病のリスク予測におけるアプローチの有効性について検討した。
論文 参考訳(メタデータ) (2022-04-14T01:53:58Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - DeepGS: Deep Representation Learning of Graphs and Sequences for
Drug-Target Binding Affinity Prediction [8.292330541203647]
本稿では、ディープニューラルネットワークを用いて、アミノ酸やSMILES配列から局所的な化学コンテキストを抽出する、DeepGSと呼ばれる新しいエンドツーエンド学習フレームワークを提案する。
我々は提案手法を,KronRLS,Sim,DeepDTA,DeepCPIといった最先端モデルと比較するための広範な実験を行った。
論文 参考訳(メタデータ) (2020-03-31T01:35:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。