論文の概要: Predicting Hydroxyl Mediated Nucleophilic Degradation and Molecular
Stability of RNA Sequences through the Application of Deep Learning Methods
- arxiv url: http://arxiv.org/abs/2011.05136v3
- Date: Sun, 26 Sep 2021 16:42:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 02:30:22.187058
- Title: Predicting Hydroxyl Mediated Nucleophilic Degradation and Molecular
Stability of RNA Sequences through the Application of Deep Learning Methods
- Title(参考訳): 深層学習法によるハイドロキシルによる核酸分解の予測とrna配列の分子安定性
- Authors: Ankit Singhal
- Abstract要約: 本稿では,mRNA配列の反応性と劣化リスクを予測する手法として,3つのディープラーニングモデルを提案し,評価する。
本研究では,6034mRNA配列のStanford Open Vaccineデータセットを用いた。
その結果, これらのモデルを用いてmRNAの化学的安定性を近い将来に解明し, 予測できることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthesis and efficient implementation mRNA strands has been shown to have
wide utility, especially recently in the development of COVID vaccines.
However, the intrinsic chemical stability of mRNA poses a challenge due to the
presence of 2'-hydroxyl groups in ribose sugars. The -OH group in the backbone
structure enables a base-catalyzed nucleophilic attack by the deprotonated
hydroxyl on the adjacent phosphorous and consequent self-hydrolysis of the
phosphodiester bond. As expected for in-line hydrolytic cleavage reactions, the
chemical stability of mRNA strands is highly dependent on external
environmental factors, e.g. pH, temperature, oxidizers, etc. Predicting this
chemical instability using a computational model will reduce the number of
sequences synthesized and tested through identifying the most promising
candidates, aiding the development of mRNA related therapies. This paper
proposes and evaluates three deep learning models (Long Short Term Memory,
Gated Recurrent Unit, and Graph Convolutional Networks) as methods to predict
the reactivity and risk of degradation of mRNA sequences. The Stanford Open
Vaccine dataset of 6034 mRNA sequences was used in this study. The training set
consisted of 3029 of these sequences (length of 107 nucleotide bases) while the
testing dataset consisted of 3005 sequences (length of 130 nucleotide bases),
in structured (Lowest Entropy Base Pair Probability Matrix) and unstructured
(Nodes and Edges) forms. The stability of mRNA strands was accurately
generated, with the Graph Convolutional Network being the best predictor of
reactivity ($RMSE = 0.249$) while the Gated Recurrent Unit Network was the best
at predicting risks of degradation ($RMSE = 0.266$). Combining all target
variables, the GRU performed the best with 76% accuracy. Results suggest these
models can be applied to understand and predict the chemical stability of mRNA
in the near future.
- Abstract(参考訳): 合成および効率的なmRNA鎖の実装は、特に最近の新型コロナウイルスワクチン開発において幅広い有用性があることが示されている。
しかし、mRNAの内在的な化学的安定性は、リボース糖中に2'-ヒドロキシル基が存在することに起因する。
背骨構造の-OH基は、隣り合うリンの脱プロトン化ヒドロキシルによる塩基触媒による求核攻撃と、ホスホジエステル結合の自己加水分解を可能にする。
インライン加水分解反応で期待されるように、mrna鎖の化学的安定性は、ph、温度、酸化剤など外部の環境因子に大きく依存する。
計算モデルを用いた化学不安定性の予測は、最も有望な候補を同定し、合成およびテストされた配列の数を減少させ、mrna関連治療法の開発を支援する。
本稿では,mRNA配列の反応性と劣化リスクを予測する手法として,3つのディープラーニングモデル(Long Short Term Memory, Gated Recurrent Unit, Graph Convolutional Networks)を提案し,評価する。
本研究では,6034mRNA配列のStanford Open Vaccineデータセットを用いた。
トレーニングセットはこれらの配列(107ヌクレオチド塩基の長さ)の3029からなり、テストデータセットは3005配列(130ヌクレオチド塩基の長さ)、構造化された(最も低いエントロピー塩基対確率行列)、非構造化型(ノードとエッジ)からなる。
mrna鎖の安定性は正確に生成され、グラフ畳み込みネットワークは反応性の最良の予測者(rmse = 0.249$)であり、ゲートリカレントユニットネットワークは劣化のリスクを予測するのに最適(rmse = 0.266$)であった。
全ての変数を組み合わせ、GRUは76%の精度で最善を尽くした。
結果はこれらのモデルを用いてmRNAの化学的安定性を近い将来理解し予測できることを示唆している。
関連論文リスト
- Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - RNA-FrameFlow: Flow Matching for de novo 3D RNA Backbone Design [35.66059762160962]
本稿では3次元RNAバックボーン設計のための最初の生成モデルであるRNA-FrameFlowを紹介する。
我々は、剛体フレームと関連する損失関数の集合としてRNA構造を定式化する。
3次元RNAデータセットの多様性の欠如に対処するため、構造的クラスタリングと収穫増強によるトレーニングについて検討する。
論文 参考訳(メタデータ) (2024-06-19T21:06:44Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - Kirigami: large convolutional kernels improve deep learning-based RNA secondary structure prediction [0.0]
我々は,リボ核酸(RNA)分子の二次構造を予測するために,新しい完全畳み込みニューラルネットワーク(FCN)アーキテクチャを導入する。
深層学習を用いてヌクレオチド残基間の塩基対の確率を推定する。
広く採用されている1,305分子からなる標準化されたテストセットにおいて、本手法の精度は現在のSOTA(State-of-the-art)二次構造予測ソフトウェアよりも高い。
論文 参考訳(メタデータ) (2024-06-04T14:58:10Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - A novel RNA pseudouridine site prediction model using Utility Kernel and
data-driven parameters [0.7373617024876725]
PseudouridineはRNAの最も頻繁に起こる修飾である。
特定のRNA配列における疑似ウリジン部位を予測する既存のモデルは、主にユーザ定義の機能に依存する。
本稿では,経済のユーティリティ理論に基づく支援ベクトルマシン(SVM)カーネルを提案する。
論文 参考訳(メタデータ) (2023-11-02T08:32:10Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - A QUBO model of the RNA folding problem optimized by variational hybrid
quantum annealing [0.0]
本稿では, 量子アニールと回路モデル量子コンピュータの両方に有効なRNA折り畳み問題のモデルを提案する。
この定式化を、既知のRNA構造に対して全てのパラメータを調整した後、現在のRNA折り畳みQUBOと比較する。
論文 参考訳(メタデータ) (2022-08-08T19:04:28Z) - E2Efold-3D: End-to-End Deep Learning Method for accurate de novo RNA 3D
Structure Prediction [46.38735421190187]
E2Efold-3Dというエンド・ツー・エンドの深層学習手法を開発し,テクスタイド・ノボRNA構造予測を精度良く行う。
完全微分可能なエンドツーエンドパイプライン、二次構造による自己蒸留、パラメータ効率のよいバックボーンの定式化など、データ不足を克服するために、いくつかの新しいコンポーネントが提案されている。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z) - Predictive models of RNA degradation through dual crowdsourcing [2.003083111563343]
クラウドソーシングされた機械学習コンペ("Stanford OpenVaccine")についてKaggleで説明する。
勝者モデルは、以前の最先端のDegScoreモデルよりも50%良いテストセットエラーを示した。
論文 参考訳(メタデータ) (2021-10-14T16:50:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。