論文の概要: Protein-RNA interaction prediction with deep learning: Structure matters
- arxiv url: http://arxiv.org/abs/2107.12243v1
- Date: Mon, 26 Jul 2021 14:43:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-27 15:43:44.294589
- Title: Protein-RNA interaction prediction with deep learning: Structure matters
- Title(参考訳): 深層学習によるタンパク質-RNA相互作用予測:構造的問題
- Authors: Junkang Wei, Siyuan Chen, Licheng Zong, Xin Gao, Yu Li
- Abstract要約: タンパク質とRNAの相互作用は、様々な細胞活動において極めて重要であり、その相互作用を研究するために実験的および計算的手法が開発されている。
最近、AlphaFoldは、タンパク質と生物学の分野全体に革命をもたらした。今後数年で、タンパク質とRNAの相互作用の予測も大幅に促進されるだろう。
本調査は,過去におけるRBP-RNA相互作用場の発展を概説し,アルファフォールド時代以降の今後の発展を予見するものである。
- 参考スコア(独自算出の注目度): 19.541738343743592
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Protein-RNA interactions are of vital importance to a variety of cellular
activities. Both experimental and computational techniques have been developed
to study the interactions. Due to the limitation of the previous database,
especially the lack of protein structure data, most of the existing
computational methods rely heavily on the sequence data, with only a small
portion of the methods utilizing the structural information. Recently,
AlphaFold has revolutionized the entire protein and biology field. Foreseeably,
the protein-RNA interaction prediction will also be promoted significantly in
the upcoming years. In this work, we give a thorough review of this field,
surveying both the binding site and binding preference prediction problems and
covering the commonly used datasets, features, and models. We also point out
the potential challenges and opportunities in this field. This survey
summarizes the development of the RBP-RNA interaction field in the past and
foresees its future development in the post-AlphaFold era.
- Abstract(参考訳): タンパク質とRNAの相互作用は、様々な細胞活動において極めて重要である。
相互作用を研究するために実験技術と計算技術の両方が開発された。
以前のデータベースの制限、特にタンパク質構造データの欠如のため、既存の計算手法のほとんどは配列データに大きく依存しており、構造情報を利用する方法のごく一部しか使用していない。
近年、AlphaFoldはタンパク質と生物学全般に革命をもたらした。
将来、タンパク質とRNAの相互作用の予測も大幅に促進されるだろう。
本稿では,バインディングサイトとバインディング嗜好予測問題の両方を調査し,一般的なデータセットや特徴,モデルをカバーすることにより,この分野の徹底したレビューを行う。
また、この分野の潜在的な課題と機会についても指摘します。
本調査は,過去におけるRBP-RNA相互作用場の発展を概説し,アルファフォールド時代以降の今後の発展を予見するものである。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction [23.1499716310298]
我々は,タンパク質-RNA結合親和性データセットPRA310を構築し,性能評価を行った。
我々は,(1)タンパク質-RNA結合親和性,(2)変異による結合親和性の変化を正確に予測できること,(3)データのスケーリングとモデルサイズによるメリットを広く分析し,検証する。
論文 参考訳(メタデータ) (2024-08-21T09:48:22Z) - ProtT3: Protein-to-Text Generation for Text-based Protein Understanding [88.43323947543996]
言語モデル(LM)は、タンパク質のテキスト記述を理解するのに優れている。
タンパク質言語モデル(PLM)は、タンパク質データを理解し、高品質な表現に変換するが、テキストを処理するのに苦労する。
ProtT3は、テキストベースのタンパク質理解のための、タンパク質からテキストへの生成のためのフレームワークである。
論文 参考訳(メタデータ) (2024-05-21T08:06:13Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias [0.0]
本稿では,対話データセットからユニークなペアを抽出し,非バイアス付き機械学習のための非冗長なペアデータを生成する手法を提案する。
我々は,タンパク質のコード遺伝子のカオスゲーム表現から相互作用を学習し,予測できる畳み込みニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2023-10-23T10:02:23Z) - OpenProteinSet: Training data for structural biology at scale [0.0]
タンパク質の多重配列アライメント(MSA)は、豊富な生物学的情報をコードする。
AlphaFold2のような、トランスフォーマーを使って大量の生のMSAに直接参加する最近のブレークスルーは、その重要性を再確認している。
OpenProteinSetは1600万以上のMSA、関連するタンパク質データバンクの構造ホモログ、AlphaFold2タンパク質構造予測のオープンソースコーパスである。
論文 参考訳(メタデータ) (2023-08-10T04:01:04Z) - Knowledge from Large-Scale Protein Contact Prediction Models Can Be
Transferred to the Data-Scarce RNA Contact Prediction Task [40.051834115537474]
タンパク質共進化トランスフォーマーに基づくディープニューラルネットワークはRNA接触予測タスクに転送可能である。
実験により、転写学習によるRNA接触予測が大幅に改善されることが確認された。
以上の結果から, タンパク質の構造パターンはRNAに転移し, 新たな研究の道を開く可能性が示唆された。
論文 参考訳(メタデータ) (2023-02-13T06:00:56Z) - PSP: Million-level Protein Sequence Dataset for Protein Structure
Prediction [34.11168458572554]
PSPと命名された,高いカバレッジと多様性を持つ最初の100万レベルのタンパク質構造予測データセットを提示する。
このデータセットは570k真構造配列(10TB)と745k相補的蒸留配列(15TB)からなる。
また、このデータセット上でのSOTAタンパク質構造予測モデルのベンチマークトレーニング手順も提供する。
論文 参考訳(メタデータ) (2022-06-24T14:08:44Z) - Deep Learning of High-Order Interactions for Protein Interface
Prediction [58.164371994210406]
本稿では,タンパク質界面の予測を2次元密度予測問題として定式化する。
タンパク質をグラフとして表現し、グラフニューラルネットワークを用いてノードの特徴を学習する。
我々は高次対相互作用を組み込んで、異なる対相互作用を含む3次元テンソルを生成する。
論文 参考訳(メタデータ) (2020-07-18T05:39:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。