論文の概要: Accurate RNA 3D structure prediction using a language model-based deep learning approach
- arxiv url: http://arxiv.org/abs/2207.01586v3
- Date: Thu, 02 Jan 2025 18:03:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-03 14:33:05.771554
- Title: Accurate RNA 3D structure prediction using a language model-based deep learning approach
- Title(参考訳): 言語モデルに基づくディープラーニングによるRNAの正確な構造予測
- Authors: Tao Shen, Zhihang Hu, Siqi Sun, Di Liu, Felix Wong, Jiuming Wang, Jiayang Chen, Yixuan Wang, Liang Hong, Jin Xiao, Liangzhen Zheng, Tejas Krishnamoorthi, Irwin King, Sheng Wang, Peng Yin, James J. Collins, Yu Li,
- Abstract要約: RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
- 参考スコア(独自算出の注目度): 50.193512039121984
- License:
- Abstract: Accurate prediction of RNA three-dimensional (3D) structure remains an unsolved challenge. Determining RNA 3D structures is crucial for understanding their functions and informing RNA-targeting drug development and synthetic biology design. The structural flexibility of RNA, which leads to scarcity of experimentally determined data, complicates computational prediction efforts. Here, we present RhoFold+, an RNA language model-based deep learning method that accurately predicts 3D structures of single-chain RNAs from sequences. By integrating an RNA language model pre-trained on ~23.7 million RNA sequences and leveraging techniques to address data scarcity, RhoFold+ offers a fully automated end-to-end pipeline for RNA 3D structure prediction. Retrospective evaluations on RNA-Puzzles and CASP15 natural RNA targets demonstrate RhoFold+'s superiority over existing methods, including human expert groups. Its efficacy and generalizability are further validated through cross-family and cross-type assessments, as well as time-censored benchmarks. Additionally, RhoFold+ predicts RNA secondary structures and inter-helical angles, providing empirically verifiable features that broaden its applicability to RNA structure and function studies.
- Abstract(参考訳): RNAの3次元構造(3D)の正確な予測は未解決の課題である。
RNA3D構造の決定は、その機能を理解し、RNAを標的とした薬物開発と合成生物学設計を誘導するために重要である。
実験的に決定されたデータの不足につながるRNAの構造的柔軟性は、計算予測を複雑にする。
本稿では,RNA言語モデルに基づく深層学習手法であるRhoFold+について述べる。
約2370万のRNA配列で事前訓練されたRNA言語モデルを統合し、データの不足に対処する技術を活用することで、RhoFold+はRNA3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
RNA-Puzzles と CASP15 の天然 RNA ターゲットに対する反省的な評価は、RhoFold+ がヒトの専門家グループを含む既存の方法よりも優れていることを示している。
その有効性と一般化性は、クロスファミリーおよびクロスタイプ評価、およびタイムセンセードベンチマークによってさらに検証される。
さらにRhoFold+はRNA二次構造とヘリカルアングルを予測し、RNA構造や機能研究への適用性を実証的に検証可能な特徴を提供する。
関連論文リスト
- Comprehensive benchmarking of large language models for RNA secondary structure prediction [0.0]
RNA-LLMはRNA配列の大規模なデータセットを使用して、自己教師付き方法で、意味的に豊かな数値ベクトルで各RNA塩基をどう表現するかを学ぶ。
その中で、二次構造を予測することは、RNAの機能的機構を明らかにするための基本的な課題である。
本稿では,いくつかの事前学習されたRNA-LLMの総合的な実験解析を行い,それらを統合されたディープラーニングフレームワークにおけるRNA二次構造予測タスクと比較する。
論文 参考訳(メタデータ) (2024-10-21T17:12:06Z) - Beyond Sequence: Impact of Geometric Context for RNA Property Prediction [6.559586725997741]
RNA構造は1D配列、2Dトポロジカルグラフ、3Dオール原子モデルとして表現できる。
既存の作品は、主に2次元と3次元の幾何学的文脈を見渡す1次元シーケンスベースのモデルに焦点を当てている。
本研究では,RNA特性予測に明示的な2次元および3次元幾何情報を取り入れた最初の体系的評価を行った。
論文 参考訳(メタデータ) (2024-10-15T17:09:34Z) - Predicting Distance matrix with large language models [1.8855270809505869]
データ制限のため、RNA構造予測は依然として重要な課題である。
核磁気共鳴分光法、X線結晶学、電子顕微鏡などの従来の手法は高価で時間を要する。
距離マップはヌクレオチド間の空間的制約を単純化し、完全な3Dモデルを必要としない本質的な関係を捉える。
論文 参考訳(メタデータ) (2024-09-24T10:28:55Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Deciphering RNA Secondary Structure Prediction: A Probabilistic K-Rook Matching Perspective [63.3632827588974]
RFoldは、与えられたシーケンスから最もよく一致するK-Rook解を予測する方法である。
RFoldは、最先端のアプローチよりも競争性能とおよそ8倍の推論効率を達成する。
論文 参考訳(メタデータ) (2022-12-02T16:34:56Z) - Review of Machine-Learning Methods for RNA Secondary Structure
Prediction [21.3539253580504]
機械学習技術に基づくRNA二次構造予測手法の概要について概説する。
RNA二次構造予測の分野で現在進行中の課題と今後の動向についても論じる。
論文 参考訳(メタデータ) (2020-09-01T03:17:15Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - RNA Secondary Structure Prediction By Learning Unrolled Algorithms [70.09461537906319]
本稿では,RNA二次構造予測のためのエンド・ツー・エンドのディープラーニングモデルであるE2Efoldを提案する。
E2Efoldの鍵となる考え方は、RNA塩基対行列を直接予測し、制約のないプログラミングを、制約を強制するための深いアーキテクチャのテンプレートとして使うことである。
ベンチマークデータセットに関する包括的な実験により、E2Efoldの優れた性能を実証する。
論文 参考訳(メタデータ) (2020-02-13T23:21:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。