論文の概要: i6mA-CNN: a convolution based computational approach towards
identification of DNA N6-methyladenine sites in rice genome
- arxiv url: http://arxiv.org/abs/2007.10458v2
- Date: Tue, 11 Aug 2020 11:05:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 14:43:12.788435
- Title: i6mA-CNN: a convolution based computational approach towards
identification of DNA N6-methyladenine sites in rice genome
- Title(参考訳): i6mA-CNN:イネゲノム中のDNAN6-メチルアデニン部位の同定のための畳み込みに基づく計算手法
- Authors: Ruhul Amin, Chowdhury Rafeed Rahman, Md. Sadrul Islam Toaha and
Swakkhar Shatabda
- Abstract要約: イネゲノム中の6mA部位を同定できる畳み込みニューラルネットワークツールi6mA-CNNを開発した。
以上の結果から,本手法は植物種に関係なく,植物ゲノム上の6mA部位の同定能力を一般化できることが示唆された。
- 参考スコア(独自算出の注目度): 1.9723060056911002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: DNA N6-methylation (6mA) in Adenine nucleotide is a post replication
modification and is responsible for many biological functions. Experimental
methods for genome wide 6mA site detection is an expensive and manual labour
intensive process. Automated and accurate computational methods can help to
identify 6mA sites in long genomes saving significant time and money. Our study
develops a convolutional neural network based tool i6mA-CNN capable of
identifying 6mA sites in the rice genome. Our model coordinates among multiple
types of features such as PseAAC inspired customized feature vector, multiple
one hot representations and dinucleotide physicochemical properties. It
achieves area under the receiver operating characteristic curve of 0.98 with an
overall accuracy of 0.94 using 5 fold cross validation on benchmark dataset.
Finally, we evaluate our model on two other plant genome 6mA site
identification datasets besides rice. Results suggest that our proposed tool is
able to generalize its ability of 6mA site identification on plant genomes
irrespective of plant species. Web tool for this research can be found at:
https://cutt.ly/Co6KuWG. Supplementary data (benchmark dataset, independent
test dataset, comparison purpose dataset, trained model, physicochemical
property values, attention mechanism details for motif finding) are available
at https://cutt.ly/PpDdeDH.
- Abstract(参考訳): アデニンヌクレオチドのDNA N6-メチル化(6mA)は複製後の修飾であり、多くの生物学的機能に関与している。
ゲノムワイド6mAサイト検出のための実験的手法は、高価で手作業による集中的なプロセスである。
自動化された正確な計算手法は、長いゲノム中の6mA部位を同定し、かなりの時間と費用を節約する。
本研究では,イネゲノム中の6mA部位を同定できる畳み込みニューラルネットワークツールi6mA-CNNを開発した。
pseaac にインスパイアされた特徴ベクトル,マルチ・ワン・ホット表現,ジヌクレオチドの物理化学的性質などの多種類の特徴のコーディネートを行う。
ベンチマークデータセットの5倍のクロスバリデーションを用いて、0.98の受信機動作特性曲線の領域を全体の精度0.94で達成する。
最後に,イネ以外の2種類の植物ゲノム6mA部位同定データセットについて検討した。
以上の結果から,本ツールが植物ゲノム上に存在する6mA部位を同定できる可能性が示唆された。
この研究のためのWebツールは、以下のとおりである。
補足データ(ベンチマークデータセット、独立テストデータセット、比較目的データセット、トレーニングモデル、物理化学的特性値、モチーフ発見のための注意メカニズムの詳細)は、https://cutt.ly/ppddedhで利用可能である。
関連論文リスト
- Stacked ensemble\-based mutagenicity prediction model using multiple modalities with graph attention network [0.9736758288065405]
変異原性は、様々なネガティブな結果をもたらす遺伝子変異と関連しているため、懸念される。
本研究では,新しいアンサンブルに基づく変異原性予測モデルを提案する。
論文 参考訳(メタデータ) (2024-09-03T09:14:21Z) - A Benchmark Dataset for Multimodal Prediction of Enzymatic Function Coupling DNA Sequences and Natural Language [3.384797724820242]
DNA配列から遺伝子機能を予測することは、生物学における根本的な課題である。
深層学習モデルは、DNA配列を埋め込み、その酵素機能を予測するために提案されている。
科学界の生物学的機能に関する知識の多くは分類学的なラベルで表されていない。
論文 参考訳(メタデータ) (2024-07-21T19:27:43Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - RoseNet: Predicting Energy Metrics of Double InDel Mutants Using Deep
Learning [0.7776497736451751]
ロボット工学にインスパイアされた逆運動学のアプローチをRosettaで利用可能なロボットを用いて計算的に生成した3つのタンパク質に対して、徹底的な二重InDel変異のデータセットを利用する。
我々は,ミュータント生成プロセス中にRosettaが出力するいくつかの構造的およびエネルギー的指標に基づいて,ニューラルネットワークであるRoseNetを開発し,訓練する。
モデルは最小限のデータ(50%)でトレーニングでき、高いレベルの精度を維持することができる。
論文 参考訳(メタデータ) (2023-10-20T20:36:13Z) - HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide
Resolution [76.97231739317259]
本稿では,ヒト参照ゲノム上に,最大100万個のトークンを単一ヌクレオチドレベルで有するゲノム基盤モデルであるHyenaDNAについて紹介する。
Nucleotide Transformerの微調整されたベンチマークでは、HyenaDNAが18のデータセットのうち12の最先端(SotA)に到達した。
論文 参考訳(メタデータ) (2023-06-27T20:46:34Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - MuCoMiD: A Multitask Convolutional Learning Framework for miRNA-Disease
Association Prediction [0.4061135251278187]
本稿では, MuCoMiD と呼ぶ新しいマルチタスク畳み込み方式を提案する。
MuCoMiDは、4つの異種生物情報ソースからの知識を取り入れつつ、自動特徴抽出を可能にする。
我々は、標準ベンチマークデータセットに関する大規模な実験と、より大規模な独立したテストセットとケーススタディを構築した。
MuCoMiDは、HMDDv2.0とHMDDv3.0データセットで5倍のCV評価を少なくとも5%改善し、最先端のアプローチよりも、目に見えない病気や目に見えない病気を持つ大規模独立テストセットで少なくとも49%改善した。
論文 参考訳(メタデータ) (2021-08-08T10:01:46Z) - Efficient approximation of DNA hybridisation using deep learning [0.0]
本研究は,DNAハイブリダイゼーションの予測に応用された機械学習手法の総合的研究である。
機械学習アルゴリズムの広い範囲の使用を可能にする2.5百万以上のデータポイントの合成ハイブリッド化データセットを紹介します。
論文 参考訳(メタデータ) (2021-02-19T19:23:49Z) - A Novel Approach to Radiometric Identification [68.8204255655161]
本稿では,CAPoNeFの特徴工学的手法を用いて,高精度なラジオメトリック同定が可能であることを実証する。
SDRで収集した実験データに基づいて,基本的なML分類アルゴリズムを検証した。
論文 参考訳(メタデータ) (2020-12-02T10:54:44Z) - A deep learning classifier for local ancestry inference [63.8376359764052]
局所祖先推論は、個人のゲノムの各セグメントの祖先を特定する。
我々は,エンコーダ・デコーダアーキテクチャを備えた深層畳み込みニューラルネットワークを用いた新しいLAIツールを開発した。
我々は,既存のゴールド標準ツール RFMix とほぼ同等の精度で,ゼロショットタスクとしてアドミキシングを学習できることを実証した。
論文 参考訳(メタデータ) (2020-11-04T00:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。