論文の概要: Equi-mRNA: Protein Translation Equivariant Encoding for mRNA Language Models
- arxiv url: http://arxiv.org/abs/2508.15103v1
- Date: Wed, 20 Aug 2025 22:42:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.113374
- Title: Equi-mRNA: Protein Translation Equivariant Encoding for mRNA Language Models
- Title(参考訳): Equi-mRNA:mRNA言語モデルのためのタンパク質翻訳同変エンコーディング
- Authors: Mehdi Yazdani-Jahromi, Ali Khodabandeh Yalabadi, Ozlem Ozmen Garibay,
- Abstract要約: 2次元特殊直交行列(SO(2))の巡回部分群として同義コドン対称性を明示的に符号化する最初のコドンレベル同変mRNAモデルであるEqui-mRNAを導入する。
発現、安定性、リボスイッチングを含む下流特性予測タスクでは、Equi-mRNAは精度を最大10%向上させる。
Equi-mRNAはmRNAモデリングのための新しい生物学的原理のパラダイムを確立し、次世代治療の設計に重要な意味を持つ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The growing importance of mRNA therapeutics and synthetic biology highlights the need for models that capture the latent structure of synonymous codon (different triplets encoding the same amino acid) usage, which subtly modulates translation efficiency and gene expression. While recent efforts incorporate codon-level inductive biases through auxiliary objectives, they often fall short of explicitly modeling the structured relationships that arise from the genetic code's inherent symmetries. We introduce Equi-mRNA, the first codon-level equivariant mRNA language model that explicitly encodes synonymous codon symmetries as cyclic subgroups of 2D Special Orthogonal matrix (SO(2)). By combining group-theoretic priors with an auxiliary equivariance loss and symmetry-aware pooling, Equi-mRNA learns biologically grounded representations that outperform vanilla baselines across multiple axes. On downstream property-prediction tasks including expression, stability, and riboswitch switching Equi-mRNA delivers up to approximately 10% improvements in accuracy. In sequence generation, it produces mRNA constructs that are up to approximately 4x more realistic under Frechet BioDistance metrics and approximately 28% better preserve functional properties compared to vanilla baseline. Interpretability analyses further reveal that learned codon-rotation distributions recapitulate known GC-content biases and tRNA abundance patterns, offering novel insights into codon usage. Equi-mRNA establishes a new biologically principled paradigm for mRNA modeling, with significant implications for the design of next-generation therapeutics.
- Abstract(参考訳): mRNA治療と合成生物学の重要性の高まりは、翻訳効率と遺伝子発現を微調整する同義語コドン(同じアミノ酸をコードする異なる三重項)の使用の潜伏構造を捉えるモデルの必要性を浮き彫りにする。
最近の研究は補助的な目的を通じてコドンレベルの誘導バイアスを取り入れているが、しばしば遺伝コードの固有の対称性から生じる構造的関係を明示的にモデル化することができない。
2次元特殊直交行列(SO(2))の巡回部分群として同義コドン対称性を明示的にエンコードする最初のコドンレベル同変mRNAモデルであるEqui-mRNAを紹介する。
Equi-mRNAは、群理論の先行と準同値損失と対称性を意識したプーリングを組み合わせることで、複数の軸にまたがるバニラ基底線を上回る生物学的に基底化された表現を学習する。
発現、安定性、リボスイッチングを含む下流特性予測タスクでは、Equi-mRNAは最大10%精度が向上する。
配列生成において、Frechet BioDistanceの基準で最大4倍の現実的なmRNA構造を生成し、バニラ塩基よりも約28%優れた機能特性を保っている。
解釈可能性分析により、学習されたコドン回転分布が既知のGC含有バイアスとtRNA量のパターンを再カプセル化し、コドンの使用に関する新たな洞察を提供することが明らかとなった。
Equi-mRNAはmRNAモデリングのための新しい生物学的原理のパラダイムを確立し、次世代治療の設計に重要な意味を持つ。
関連論文リスト
- A New Deep-learning-Based Approach For mRNA Optimization: High Fidelity, Computation Efficiency, and Multiple Optimization Factors [12.26159226306187]
我々は,mRNA最適化のための新しい深層学習手法である textbfRNop を紹介する。
我々は,300万以上のシーケンスを含む大規模データセットを収集し,GPLoss,CAILoss,tAILoss,MFELossという4つの特別な損失関数を設計する。
RNopはハイシークエンスを保証し、47.32シークエンス/秒までの計算スループットを実現し、最適化されたmRNAシークエンスを生成する。
論文 参考訳(メタデータ) (2025-05-29T08:21:11Z) - Helix-mRNA: A Hybrid Foundation Model For Full Sequence mRNA Therapeutics [3.2508287756500165]
mRNAベースのワクチンは製薬業界において主要な焦点となっている。
この性質のためにmRNA配列を最適化するのは 難しい課題です
これらの課題に対処するために、構造化された状態空間ベースおよび注目ハイブリッドモデルであるHelix-mRNAを提案する。
論文 参考訳(メタデータ) (2025-02-19T14:51:41Z) - Life-Code: Central Dogma Modeling with Multi-Omics Sequence Unification [55.98854157265578]
Life-Codeは、様々な生物学的機能にまたがる包括的なフレームワークである。
本稿では、RNAを逆転写し、アミノ酸をヌクレオチド配列に変換することで、マルチオミクスデータを統合する統一パイプラインを提案する。
Life-Codeは3つのオミクスにまたがる様々なタスクの最先端の結果を達成し、マルチオミクス分析と解釈の進歩の可能性を強調している。
論文 参考訳(メタデータ) (2025-02-11T06:53:59Z) - HELM: Hierarchical Encoding for mRNA Language Modeling [4.990962434274757]
我々は、mRNA言語モデリング(HELM)のための階層的生成アプローチを紹介する。
HELMはコドンの同義性に基づいて損失関数を調節し、モデルの学習過程とmRNA配列の生物学的現実を一致させる。
我々は,多様なmRNAデータセットとタスク上でHELMを評価し,HELMが標準言語モデルの事前学習より優れていることを示す。
論文 参考訳(メタデータ) (2024-10-16T11:16:47Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - Accurate RNA 3D structure prediction using a language model-based deep learning approach [50.193512039121984]
RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。