論文の概要: Protein-Conditioned Multi-Objective Reinforcement Learning for Full-Length mRNA Design
- arxiv url: http://arxiv.org/abs/2605.01513v1
- Date: Sat, 02 May 2026 16:05:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.812234
- Title: Protein-Conditioned Multi-Objective Reinforcement Learning for Full-Length mRNA Design
- Title(参考訳): 全長mRNA設計のためのタンパク質合成多目的強化学習
- Authors: Zixi Shao, Tao Wang, Yibei Xiao, Tianyi Huang,
- Abstract要約: 本稿では,ターゲット配列から直接mRNA転写物を生成する多目的生成フレームワークProMORNAを提案する。
私たちのアプローチは、600万以上の天然タンパク-mRNAペア上で、BARTスタイルのエンコーダ-デコーダモデルをトレーニングすることから始まります。
ケーススタディとして,広範に使用されているホタルルシフェラーゼターゲットのProMORNAを,教師付きトレーニングデータとプロンプトプールの両方から除外して評価した。
- 参考スコア(独自算出の注目度): 2.9395143551178333
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Designing therapeutic messenger RNA (mRNA) requires creating full-length transcripts that carefully balance stability, translation efficiency, and immune safety. To address this challenge, we propose ProMORNA, a multi-objective generation framework that produces complete mRNA transcripts \textit{de novo} directly from a target protein sequence. Our approach begins by training a BART-style encoder-decoder model on over 6 million natural protein-mRNA pairs. We then introduce Multi-Objective Group Relative Policy Optimization (MO-GRPO) to simultaneously optimize for various biological objectives in a unified way. As a case study, we evaluated ProMORNA on the widely used firefly luciferase target, excluding it from both our supervised training data and the prompt pool. The results indicate that ProMORNA improves the \textit{in silico} Pareto frontier for predicted half-life and translation efficiency relative to standard supervised baselines. Additionally, it achieves higher predicted functional scores than a state-of-the-art baseline under the same evaluation pipeline. These computational findings demonstrate the feasibility of using multi-objective reinforcement learning for full-length mRNA design on unseen targets.
- Abstract(参考訳): 治療メッセンジャーRNA(mRNA)を設計するには、安定性、翻訳効率、免疫安全を慎重にバランスさせる完全長の転写産物を作成する必要がある。
この課題に対処するため,ターゲットタンパク質配列から直接mRNA転写物を生成する多目的生成フレームワークであるProMORNAを提案する。
私たちのアプローチは、600万以上の天然タンパク-mRNAペア上で、BARTスタイルのエンコーダ-デコーダモデルをトレーニングすることから始まります。
次に,多目的グループ相対政策最適化(MO-GRPO)を導入し,多様な生物学的目的を統一的に最適化する。
ケーススタディとして,広範に使用されているホタルルシフェラーゼターゲットのProMORNAを,教師付きトレーニングデータとプロンプトプールの両方から除外して評価した。
以上の結果から, ProMORNAは標準教師付きベースラインと比較して半減期と翻訳効率の予測のためにParetoフロンティアを改良したことが示唆された。
さらに、同じ評価パイプラインの下で、最先端のベースラインよりも高い予測機能スコアを達成する。
これらの計算結果から,多目的強化学習によるmRNA設計の可能性が示唆された。
関連論文リスト
- A New Deep-learning-Based Approach For mRNA Optimization: High Fidelity, Computation Efficiency, and Multiple Optimization Factors [12.26159226306187]
我々は,mRNA最適化のための新しい深層学習手法である textbfRNop を紹介する。
我々は,300万以上のシーケンスを含む大規模データセットを収集し,GPLoss,CAILoss,tAILoss,MFELossという4つの特別な損失関数を設計する。
RNopはハイシークエンスを保証し、47.32シークエンス/秒までの計算スループットを実現し、最適化されたmRNAシークエンスを生成する。
論文 参考訳(メタデータ) (2025-05-29T08:21:11Z) - BAnG: Bidirectional Anchored Generation for Conditional RNA Design [15.92155083519678]
既存の計算手法では、特定のタンパク質ごとに既知のRNA配列がかなり必要である。
RNA-BAnGは,タンパク質相互作用のためのRNA配列を生成するための深層学習モデルである。
論文 参考訳(メタデータ) (2025-02-28T17:51:00Z) - Helix-mRNA: A Hybrid Foundation Model For Full Sequence mRNA Therapeutics [3.2508287756500165]
mRNAベースのワクチンは製薬業界において主要な焦点となっている。
この性質のためにmRNA配列を最適化するのは 難しい課題です
これらの課題に対処するために、構造化された状態空間ベースおよび注目ハイブリッドモデルであるHelix-mRNAを提案する。
論文 参考訳(メタデータ) (2025-02-19T14:51:41Z) - LoRA-BERT: a Natural Language Processing Model for Robust and Accurate Prediction of long non-coding RNAs [11.346750562942345]
長い非コードRNA(lncRNA)は多くの生物学的プロセスにおいて重要な調節因子である。
深層学習に基づくアプローチは、lncRNAを分類するために導入された。
LoRA-BERTは配列分類におけるヌクレオチドレベルの情報の重要性を捉えるように設計されている。
論文 参考訳(メタデータ) (2024-11-11T22:17:01Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Accurate RNA 3D structure prediction using a language model-based deep learning approach [50.193512039121984]
RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。