論文の概要: An Evolutionary Approach for Designing Stable and Highly Expressible Low-Immunogenicity Therapeutic mRNA Sequences
- arxiv url: http://arxiv.org/abs/2605.27986v1
- Date: Wed, 27 May 2026 05:20:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.76698
- Title: An Evolutionary Approach for Designing Stable and Highly Expressible Low-Immunogenicity Therapeutic mRNA Sequences
- Title(参考訳): 安定かつ高発現性低免疫原性mRNA配列設計のための進化的アプローチ
- Authors: Dhawa Sang Dong, Mausam Gurung, Suraj Kandel,
- Abstract要約: 治療薬としてのメッセンジャーRNA(mRNA)配列は、効率的な翻訳、構造安定性、最小限の免疫原性を保証するために最適化された設計を必要とする。
本研究は,mRNA最適化のための深層学習と進化計算を統合した2段階のin-silicoフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Messenger RNA (mRNA) sequences as therapeutics require optimized design to ensure efficient translation, structural stability, and minimal immunogenicity. This study presents a two-stage in-silico framework that integrates deep learning and evolutionary computation for rational mRNA optimization instead of existing state-of-the-art models. In the first stage, a pretrained CodonTransformer (BERT-like Large Language Model) generates biologically coherent mRNA sequences encoding the target antigen. In the second stage, a genetic algorithm (GA) evolves these candidate sequences through codon-aware crossover and synonymous mutation guided by human codon usage preferences. Fitness functions for evaluation combined translation-related metrics (CAI, tAI, codon-pair bias), mRNA structural stability (local and global MFE via RNAfold, GC content), and reduced immunogenicity (CpG/UpA motif frequency). Over successive generations (38th, 40th, and 42nd), the GA improved (achieved CAI values of 0.73 to 0.74 and tAI values of 0.63 to 0.64) CAI and tAI by over 6% and codon-pair bias is high and consistent (0.97 ) and improved ribosomal accessibility at the 5' end, with an unpaired_30 fraction reaching 0.87; Global Minimum Free Energy (MFE) converged to a balanced range of -346 to -356 kcal/mol, achieving approximately 84% base-paired structural stability, and reduced immune-stimulatory motifs - lowering the average immune penalty to 27.3 in the final generation. Linear Design produces hyper-stable transcripts (MFE < - 2000 kcal/mol) that risk translation inefficiency due to extreme rigidity, and BiLSTM-CRF focuses solely on high CAI (0.96 to 0.98) without structural constraints, our framework achieves an optimal translation-stability equilibrium, highlighting the proposed BERT-GA framework as an effective, data-driven approach for the design and optimization of in-silico mRNA sequences.
- Abstract(参考訳): 治療薬としてのメッセンジャーRNA(mRNA)配列は、効率的な翻訳、構造安定性、最小限の免疫原性を保証するために最適化された設計を必要とする。
本研究では,既存の最先端モデルに代えて,有理mRNA最適化のための深層学習と進化計算を統合した2段階のin-silicoフレームワークを提案する。
第1段階では、事前訓練されたコドントランスフォーマー(BERT様大言語モデル)が、標的抗原をコードする生物学的にコヒーレントなmRNA配列を生成する。
第2段階では、遺伝的アルゴリズム(GA)は、コドンを意識したクロスオーバーと、ヒトのコドンの使用嗜好によって誘導される同義突然変異を通じて、これらの候補配列を進化させる。
翻訳関連指標(CAI, tAI, コドンペアバイアス)とmRNA構造安定性(RNAフォールドによる局所的およびグローバルなMFE, GC含量)と免疫原性低下(CpG/UpAモチーフ周波数)を併用して評価した。
CAI値が0.73から0.74、tAI値が0.63から0.64、CAI値が6%以上向上し、コドンペアバイアスが高く(0.97 )、5'末端でリボソームアクセシビリティが向上し、未ペアの_30分画が0.87、Global Minimum Free Energy(MFE)が346から356kcal/molのバランス範囲に収束し、約84%の塩基対構造安定性が達成され、免疫刺激モチーフが減少し、平均免疫力が273に低下した。
線形設計は, 極端剛性による翻訳効率の低下を回避し, BiLSTM-CRFは構造制約のない高CAI(0.96~0.98)にのみ焦点をあて, 提案したBERT-GAフレームワークを, サイリコmRNA配列の設計と最適化のための効果的なデータ駆動アプローチとして, 最適な翻訳安定性均衡を実現する。
関連論文リスト
- Protein-Conditioned Multi-Objective Reinforcement Learning for Full-Length mRNA Design [2.9395143551178333]
本稿では,ターゲット配列から直接mRNA転写物を生成する多目的生成フレームワークProMORNAを提案する。
私たちのアプローチは、600万以上の天然タンパク-mRNAペア上で、BARTスタイルのエンコーダ-デコーダモデルをトレーニングすることから始まります。
ケーススタディとして,広範に使用されているホタルルシフェラーゼターゲットのProMORNAを,教師付きトレーニングデータとプロンプトプールの両方から除外して評価した。
論文 参考訳(メタデータ) (2026-05-02T16:05:51Z) - CoTEvol: Self-Evolving Chain-of-Thoughts for Data Synthesis in Mathematical Reasoning [56.866286835885994]
コテボル(CoTEvol)は、遺伝進化の枠組みであり、個体群に基づく推論の軌跡の探索としてチェイン・オブ・ソート(Chain-of-Thought)の生成を推し進める。
軽量でタスク対応のフィットネス機能は、進化過程を正確で多様な推論へと導くように設計されている。
実証的に、CoTEvolは正しいCoT合成の成功を30%以上改善し、構造的多様性を高め、効率を著しく改善した。
論文 参考訳(メタデータ) (2026-04-16T08:29:22Z) - RiboSphere: Learning Unified and Efficient Representations of RNA Structures [57.40815107640066]
RNAのバックボーンは非常に柔軟で、非カノニカル相互作用が一般的であり、実験的に決定された3D構造は比較的少ない。
本稿では,ベクトル量子化とフローマッチングを組み合わせることで,RNAの固有な幾何学的表現を学習するフレームワークであるemphRiboSphereを紹介する。
論文 参考訳(メタデータ) (2026-03-20T04:36:35Z) - Systematic Evaluation of Single-Cell Foundation Model Interpretability Reveals Attention Captures Co-Expression Rather Than Unique Regulatory Signal [0.0]
単一セル基礎モデルにおける機械的解釈可能性を評価するための枠組みを提案する。
このフレームワークを scGPT と Geneformer に適用すると、注意パターンが構造化された生体情報を層固有の組織にエンコードしていることが分かる。
論文 参考訳(メタデータ) (2026-02-19T16:43:12Z) - Equi-mRNA: Protein Translation Equivariant Encoding for mRNA Language Models [0.0]
2次元特殊直交行列(SO(2))の巡回部分群として同義コドン対称性を明示的に符号化する最初のコドンレベル同変mRNAモデルであるEqui-mRNAを導入する。
発現、安定性、リボスイッチングを含む下流特性予測タスクでは、Equi-mRNAは精度を最大10%向上させる。
Equi-mRNAはmRNAモデリングのための新しい生物学的原理のパラダイムを確立し、次世代治療の設計に重要な意味を持つ。
論文 参考訳(メタデータ) (2025-08-20T22:42:10Z) - A New Deep-learning-Based Approach For mRNA Optimization: High Fidelity, Computation Efficiency, and Multiple Optimization Factors [12.26159226306187]
我々は,mRNA最適化のための新しい深層学習手法である textbfRNop を紹介する。
我々は,300万以上のシーケンスを含む大規模データセットを収集し,GPLoss,CAILoss,tAILoss,MFELossという4つの特別な損失関数を設計する。
RNopはハイシークエンスを保証し、47.32シークエンス/秒までの計算スループットを実現し、最適化されたmRNAシークエンスを生成する。
論文 参考訳(メタデータ) (2025-05-29T08:21:11Z) - Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - xTrimoABFold: De novo Antibody Structure Prediction without MSA [77.47606749555686]
我々は、抗体配列から抗体構造を予測するために、xTrimoABFoldという新しいモデルを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化することにより,PDBの抗体構造をエンドツーエンドにトレーニングした。
論文 参考訳(メタデータ) (2022-11-30T09:26:08Z) - Accurate RNA 3D structure prediction using a language model-based deep learning approach [50.193512039121984]
RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z) - Predicting Hydroxyl Mediated Nucleophilic Degradation and Molecular
Stability of RNA Sequences through the Application of Deep Learning Methods [0.0]
本稿では,mRNA配列の反応性と劣化リスクを予測する手法として,3つのディープラーニングモデルを提案し,評価する。
本研究では,6034mRNA配列のStanford Open Vaccineデータセットを用いた。
その結果, これらのモデルを用いてmRNAの化学的安定性を近い将来に解明し, 予測できることが示唆された。
論文 参考訳(メタデータ) (2020-11-09T10:42:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。