論文の概要: A New Deep-learning-Based Approach For mRNA Optimization: High Fidelity, Computation Efficiency, and Multiple Optimization Factors
- arxiv url: http://arxiv.org/abs/2505.23862v1
- Date: Thu, 29 May 2025 08:21:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.580271
- Title: A New Deep-learning-Based Approach For mRNA Optimization: High Fidelity, Computation Efficiency, and Multiple Optimization Factors
- Title(参考訳): mRNA最適化のための深層学習に基づく新しいアプローチ:高忠実度、計算効率、複数最適化因子
- Authors: Zheng Gong, Ziyi Jiang, Weihao Gao, Deng Zhuo, Lan Ma,
- Abstract要約: 我々は,mRNA最適化のための新しい深層学習手法である textbfRNop を紹介する。
我々は,300万以上のシーケンスを含む大規模データセットを収集し,GPLoss,CAILoss,tAILoss,MFELossという4つの特別な損失関数を設計する。
RNopはハイシークエンスを保証し、47.32シークエンス/秒までの計算スループットを実現し、最適化されたmRNAシークエンスを生成する。
- 参考スコア(独自算出の注目度): 12.26159226306187
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The mRNA optimization is critical for therapeutic and biotechnological applications, since sequence features directly govern protein expression levels and efficacy. However, current methods face significant challenges in simultaneously achieving three key objectives: (1) fidelity (preventing unintended amino acid changes), (2) computational efficiency (speed and scalability), and (3) the scope of optimization variables considered (multi-objective capability). Furthermore, existing methods often fall short of comprehensively incorporating the factors related to the mRNA lifecycle and translation process, including intrinsic mRNA sequence properties, secondary structure, translation elongation kinetics, and tRNA availability. To address these limitations, we introduce \textbf{RNop}, a novel deep learning-based method for mRNA optimization. We collect a large-scale dataset containing over 3 million sequences and design four specialized loss functions, the GPLoss, CAILoss, tAILoss, and MFELoss, which simultaneously enable explicit control over sequence fidelity while optimizing species-specific codon adaptation, tRNA availability, and desirable mRNA secondary structure features. Then, we demonstrate RNop's effectiveness through extensive in silico and in vivo experiments. RNop ensures high sequence fidelity, achieves significant computational throughput up to 47.32 sequences/s, and yields optimized mRNA sequences resulting in a significant increase in protein expression for functional proteins compared to controls. RNop surpasses current methodologies in both quantitative metrics and experimental validation, enlightening a new dawn for efficient and effective mRNA design. Code and models will be available at https://github.com/HudenJear/RPLoss.
- Abstract(参考訳): 配列の特徴がタンパク質の発現レベルと有効性を直接支配するため、mRNAの最適化は治療および生物工学的応用にとって重要である。
しかし,本手法は,(1)忠実度(意図しないアミノ酸変化の防止),(2)計算効率(高速化と拡張性),(3)最適化変数の範囲(多目的能力)という3つの重要な目標を同時に達成する上で,重要な課題に直面している。
さらに、既存の手法は、内在的なmRNA配列の性質、二次構造、翻訳伸長運動学、tRNAの可用性など、mRNAのライフサイクルと翻訳プロセスに関連する因子を包括的に組み込むことができないことが多い。
これらの制約に対処するため,mRNA最適化のための新しいディープラーニング手法である \textbf{RNop} を導入する。
我々は、300万以上の配列を含む大規模データセットを収集し、GPLoss、CAILoss、tAILoss、MFELossの4つの特別な損失関数を設計し、同時に、種特異的コドン適応、tRNA可用性、mRNA二次構造の特徴を最適化しながら、配列の忠実性に対する明示的な制御を可能にする。
次に,サイリコおよびin vivo実験においてRNopの有効性を実証した。
RNopは高い配列の忠実さを保証し、47.32の配列/sまでの計算スループットを達成し、最適化されたmRNA配列を出力し、機能タンパク質のタンパク質発現は制御よりも顕著に増加する。
RNopは、定量測定と実験的検証の両方において現在の方法論を超越し、効率的かつ効果的なmRNA設計のための新しい夜明けを啓蒙している。
コードとモデルはhttps://github.com/HudenJear/RPLoss.comで入手できる。
関連論文リスト
- Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - BAnG: Bidirectional Anchored Generation for Conditional RNA Design [15.92155083519678]
RNA-BAnGは、これらの要求なしにタンパク質相互作用のためのRNA配列を生成するために設計されたディープラーニングベースのモデルである。
まず、RNAに現れるものと類似した局所化モチーフを含む汎用的な合成タスクについて、本手法の有効性を検証した。
次に, 生物配列モデルの評価を行い, 結合タンパク質を付与した条件RNA配列設計の有効性を示した。
論文 参考訳(メタデータ) (2025-02-28T17:51:00Z) - Helix-mRNA: A Hybrid Foundation Model For Full Sequence mRNA Therapeutics [3.2508287756500165]
mRNAベースのワクチンは製薬業界において主要な焦点となっている。
この性質のためにmRNA配列を最適化するのは 難しい課題です
これらの課題に対処するために、構造化された状態空間ベースおよび注目ハイブリッドモデルであるHelix-mRNAを提案する。
論文 参考訳(メタデータ) (2025-02-19T14:51:41Z) - LoRA-BERT: a Natural Language Processing Model for Robust and Accurate Prediction of long non-coding RNAs [11.346750562942345]
長い非コードRNA(lncRNA)は多くの生物学的プロセスにおいて重要な調節因子である。
深層学習に基づくアプローチは、lncRNAを分類するために導入された。
LoRA-BERTは配列分類におけるヌクレオチドレベルの情報の重要性を捉えるように設計されている。
論文 参考訳(メタデータ) (2024-11-11T22:17:01Z) - RNACG: A Universal RNA Sequence Conditional Generation model based on Flow-Matching [0.0]
本稿では,フローマッチングに基づくRNA配列設計のための汎用フレームワークであるRNACG(RNA Generator)を提案する。
1つのフレームワークでシーケンス生成を統一することにより、RNACGは複数のRNA設計パラダイムの統合を可能にする。
論文 参考訳(メタデータ) (2024-07-29T09:46:46Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - Accurate RNA 3D structure prediction using a language model-based deep learning approach [50.193512039121984]
RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。