論文の概要: Deep Learning Framework for RNA Inverse Folding with Geometric Structure Potentials
- arxiv url: http://arxiv.org/abs/2601.00895v1
- Date: Wed, 31 Dec 2025 15:43:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.833912
- Title: Deep Learning Framework for RNA Inverse Folding with Geometric Structure Potentials
- Title(参考訳): 幾何学的構造ポテンシャルを持つRNA逆Foldingのためのディープラーニングフレームワーク
- Authors: Annabelle Yao,
- Abstract要約: エンド・ツー・エンドのRNA設計を可能にするために、Geometric Vector PerceptronレイヤとTransformerアーキテクチャを統合したディープラーニングフレームワークを紹介します。
本研究では,BGSU RNAリストから抽出・分解したRNA3D構造からなるデータセットを構築し,配列回復率とTMスコアの両方を用いて性能評価を行った。
私のモデルは最先端のパフォーマンスを達成し、リカバリとTMスコアは0.481と0.332で、RNAファミリーや長さスケールにまたがる既存の手法を上回ります。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: RNA's diverse biological functions stem from its structural versatility, yet accurately predicting and designing RNA sequences given a 3D conformation (inverse folding) remains a challenge. Here, I introduce a deep learning framework that integrates Geometric Vector Perceptron (GVP) layers with a Transformer architecture to enable end-to-end RNA design. I construct a dataset consisting of experimentally solved RNA 3D structures, filtered and deduplicated from the BGSU RNA list, and evaluate performance using both sequence recovery rate and TM-score to assess sequence and structural fidelity, respectively. On standard benchmarks and RNA-Puzzles, my model achieves state-of-the-art performance, with recovery and TM-scores of 0.481 and 0.332, surpassing existing methods across diverse RNA families and length scales. Masked family-level validation using Rfam annotations confirms strong generalization beyond seen families. Furthermore, inverse-folded sequences, when refolded using AlphaFold3, closely resemble native structures, highlighting the critical role of geometric features captured by GVP layers in enhancing Transformer-based RNA design.
- Abstract(参考訳): RNAの多様な生物学的機能は構造的汎用性に由来するが、3Dコンフォメーション(逆フォールディング)を前提としたRNA配列の正確な予測と設計は依然として困難である。
本稿では,Geometric Vector Perceptron(GVP)層とTransformerアーキテクチャを統合し,エンド・ツー・エンドのRNA設計を可能にするディープラーニングフレームワークを紹介する。
そこで本研究では,BGSU RNAリストから抽出されたRNA3D構造からなるデータセットを構築し,配列回復率とTMスコアの両方を用いて,配列と構造忠実度をそれぞれ評価した。
標準的なベンチマークとRNA-Puzzlesでは、リカバリとTMスコアが0.481と0.332で、さまざまなRNAファミリーと長さスケールで既存の方法を上回る、最先端のパフォーマンスを実現しています。
Rfamアノテーションを用いたマスケ家族レベルの検証は、目に見えない家族を超えた強力な一般化を裏付ける。
さらに、AlphaFold3を用いてリフォールディングされた逆フォールディング配列は、ネイティブ構造によく似ており、トランスフォーマーベースのRNA設計の強化において、GVP層が捉えた幾何学的特徴の重要な役割を強調している。
関連論文リスト
- RIDER: 3D RNA Inverse Design with Reinforcement Learning-Guided Diffusion [19.386628516684695]
RIDERはRNA Inverse Designフレームワークであり、Reinforcement Learningは3D構造的類似性を直接最適化する。
まず,対象3次元構造に条件付きGNNに基づく生成拡散モデルの開発と事前学習を行う。
そして,3次元自己整合性指標に基づく4つのタスク固有報酬関数を用いて,改良されたポリシー勾配アルゴリズムを用いてモデルを微調整する。
論文 参考訳(メタデータ) (2026-02-18T15:52:26Z) - Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - RNACG: A Universal RNA Sequence Conditional Generation model based on Flow-Matching [0.0]
本稿では,フローマッチングに基づくRNA配列設計のための汎用フレームワークであるRNACG(RNA Generator)を提案する。
1つのフレームワークでシーケンス生成を統一することにより、RNACGは複数のRNA設計パラダイムの統合を可能にする。
論文 参考訳(メタデータ) (2024-07-29T09:46:46Z) - Bridging Sequence-Structure Alignment in RNA Foundation Models [7.068604225076706]
基礎モデル(FM)におけるRNA配列と構造との整合性についてはまだ研究されていない。
既存のFMは配列構造アライメントを確立するのに苦労しており、ゲノム情報の自由な流れを妨げる。
OmniGenomeはRNA配列を構造コンテクスト化されたモデリングに基づく二次構造に整合させる訓練されたRNA FMである。
論文 参考訳(メタデータ) (2024-07-15T21:10:40Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - gRNAde: Geometric Deep Learning for 3D RNA inverse design [14.729049204432027]
gRNAdeは3次元RNAバックボーンで動作する幾何学的RNA設計パイプラインである。
構造と力学を明示的に考慮したシーケンスを生成する。
論文 参考訳(メタデータ) (2023-05-24T05:46:56Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Accurate RNA 3D structure prediction using a language model-based deep learning approach [50.193512039121984]
RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z) - Improving RNA Secondary Structure Design using Deep Reinforcement
Learning [69.63971634605797]
本稿では,RNA配列設計に強化学習を適用した新しいベンチマークを提案する。このベンチマークでは,目的関数を配列の二次構造における自由エネルギーとして定義する。
本稿では,これらのアルゴリズムに対して行うアブレーション解析の結果と,バッチ間でのアルゴリズムの性能を示すグラフを示す。
論文 参考訳(メタデータ) (2021-11-05T02:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。