論文の概要: Predicting Hydroxyl Mediated Nucleophilic Degradation and Molecular
Stability of RNA Sequences through the Application of Deep Learning Methods
- arxiv url: http://arxiv.org/abs/2011.05136v3
- Date: Sun, 26 Sep 2021 16:42:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 02:30:22.187058
- Title: Predicting Hydroxyl Mediated Nucleophilic Degradation and Molecular
Stability of RNA Sequences through the Application of Deep Learning Methods
- Title(参考訳): 深層学習法によるハイドロキシルによる核酸分解の予測とrna配列の分子安定性
- Authors: Ankit Singhal
- Abstract要約: 本稿では,mRNA配列の反応性と劣化リスクを予測する手法として,3つのディープラーニングモデルを提案し,評価する。
本研究では,6034mRNA配列のStanford Open Vaccineデータセットを用いた。
その結果, これらのモデルを用いてmRNAの化学的安定性を近い将来に解明し, 予測できることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthesis and efficient implementation mRNA strands has been shown to have
wide utility, especially recently in the development of COVID vaccines.
However, the intrinsic chemical stability of mRNA poses a challenge due to the
presence of 2'-hydroxyl groups in ribose sugars. The -OH group in the backbone
structure enables a base-catalyzed nucleophilic attack by the deprotonated
hydroxyl on the adjacent phosphorous and consequent self-hydrolysis of the
phosphodiester bond. As expected for in-line hydrolytic cleavage reactions, the
chemical stability of mRNA strands is highly dependent on external
environmental factors, e.g. pH, temperature, oxidizers, etc. Predicting this
chemical instability using a computational model will reduce the number of
sequences synthesized and tested through identifying the most promising
candidates, aiding the development of mRNA related therapies. This paper
proposes and evaluates three deep learning models (Long Short Term Memory,
Gated Recurrent Unit, and Graph Convolutional Networks) as methods to predict
the reactivity and risk of degradation of mRNA sequences. The Stanford Open
Vaccine dataset of 6034 mRNA sequences was used in this study. The training set
consisted of 3029 of these sequences (length of 107 nucleotide bases) while the
testing dataset consisted of 3005 sequences (length of 130 nucleotide bases),
in structured (Lowest Entropy Base Pair Probability Matrix) and unstructured
(Nodes and Edges) forms. The stability of mRNA strands was accurately
generated, with the Graph Convolutional Network being the best predictor of
reactivity ($RMSE = 0.249$) while the Gated Recurrent Unit Network was the best
at predicting risks of degradation ($RMSE = 0.266$). Combining all target
variables, the GRU performed the best with 76% accuracy. Results suggest these
models can be applied to understand and predict the chemical stability of mRNA
in the near future.
- Abstract(参考訳): 合成および効率的なmRNA鎖の実装は、特に最近の新型コロナウイルスワクチン開発において幅広い有用性があることが示されている。
しかし、mRNAの内在的な化学的安定性は、リボース糖中に2'-ヒドロキシル基が存在することに起因する。
背骨構造の-OH基は、隣り合うリンの脱プロトン化ヒドロキシルによる塩基触媒による求核攻撃と、ホスホジエステル結合の自己加水分解を可能にする。
インライン加水分解反応で期待されるように、mrna鎖の化学的安定性は、ph、温度、酸化剤など外部の環境因子に大きく依存する。
計算モデルを用いた化学不安定性の予測は、最も有望な候補を同定し、合成およびテストされた配列の数を減少させ、mrna関連治療法の開発を支援する。
本稿では,mRNA配列の反応性と劣化リスクを予測する手法として,3つのディープラーニングモデル(Long Short Term Memory, Gated Recurrent Unit, Graph Convolutional Networks)を提案し,評価する。
本研究では,6034mRNA配列のStanford Open Vaccineデータセットを用いた。
トレーニングセットはこれらの配列(107ヌクレオチド塩基の長さ)の3029からなり、テストデータセットは3005配列(130ヌクレオチド塩基の長さ)、構造化された(最も低いエントロピー塩基対確率行列)、非構造化型(ノードとエッジ)からなる。
mrna鎖の安定性は正確に生成され、グラフ畳み込みネットワークは反応性の最良の予測者(rmse = 0.249$)であり、ゲートリカレントユニットネットワークは劣化のリスクを予測するのに最適(rmse = 0.266$)であった。
全ての変数を組み合わせ、GRUは76%の精度で最善を尽くした。
結果はこれらのモデルを用いてmRNAの化学的安定性を近い将来理解し予測できることを示唆している。
関連論文リスト
- A novel RNA pseudouridine site prediction model using Utility Kernel and
data-driven parameters [0.7373617024876725]
PseudouridineはRNAの最も頻繁に起こる修飾である。
特定のRNA配列における疑似ウリジン部位を予測する既存のモデルは、主にユーザ定義の機能に依存する。
本稿では,経済のユーティリティ理論に基づく支援ベクトルマシン(SVM)カーネルを提案する。
論文 参考訳(メタデータ) (2023-11-02T08:32:10Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - A QUBO model of the RNA folding problem optimized by variational hybrid
quantum annealing [0.0]
本稿では, 量子アニールと回路モデル量子コンピュータの両方に有効なRNA折り畳み問題のモデルを提案する。
この定式化を、既知のRNA構造に対して全てのパラメータを調整した後、現在のRNA折り畳みQUBOと比較する。
論文 参考訳(メタデータ) (2022-08-08T19:04:28Z) - E2Efold-3D: End-to-End Deep Learning Method for accurate de novo RNA 3D
Structure Prediction [46.38735421190187]
E2Efold-3Dというエンド・ツー・エンドの深層学習手法を開発し,テクスタイド・ノボRNA構造予測を精度良く行う。
完全微分可能なエンドツーエンドパイプライン、二次構造による自己蒸留、パラメータ効率のよいバックボーンの定式化など、データ不足を克服するために、いくつかの新しいコンポーネントが提案されている。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z) - Predictive models of RNA degradation through dual crowdsourcing [2.003083111563343]
クラウドソーシングされた機械学習コンペ("Stanford OpenVaccine")についてKaggleで説明する。
勝者モデルは、以前の最先端のDegScoreモデルよりも50%良いテストセットエラーを示した。
論文 参考訳(メタデータ) (2021-10-14T16:50:37Z) - Classification of Long Noncoding RNA Elements Using Deep Convolutional
Neural Networks and Siamese Networks [17.8181080354116]
この論文は、cRNA配列を分類するために、ディープ畳み込みニューラルネットワーク(CNN)の新たな手法を提案する。
その結果、CNNベースの分類モデルにより効率よく解ける画像分類プロブレムに、クラスサイズRNA配列を変換する。
論文 参考訳(メタデータ) (2021-02-10T17:26:38Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - CogMol: Target-Specific and Selective Drug Design for COVID-19 Using
Deep Generative Models [74.58583689523999]
新規なウイルスタンパク質を標的とした新規な薬物様小分子を設計するためのエンド・ツー・エンドのフレームワークであるCogMolを提案する。
CogMolは、分子SMILES変分オートエンコーダ(VAE)の適応事前学習と、効率的なマルチ属性制御サンプリングスキームを組み合わせる。
CogMolは、高目標特異性と選択性を有する合成可能で低毒性な薬物様分子の多制約設計を扱う。
論文 参考訳(メタデータ) (2020-04-02T18:17:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。