論文の概要: DeepPNI: Language- and graph-based model for mutation-driven protein-nucleic acid energetics
- arxiv url: http://arxiv.org/abs/2511.22239v1
- Date: Thu, 27 Nov 2025 09:08:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.470598
- Title: DeepPNI: Language- and graph-based model for mutation-driven protein-nucleic acid energetics
- Title(参考訳): DeepPNI:変異駆動型タンパク質-核酸エネルギー学のための言語モデルとグラフベースモデル
- Authors: Somnath Mondal, Tinkal Mondal, Soumajit Pramanik, Rukmankesh Mehra,
- Abstract要約: 本研究は、タンパク質-DNAとタンパク質-RNA複合体を含む1951年の変異の大規模なデータセットをまとめた。
DeepPNIは、タンパク質-核酸複合体の突然変異誘起自由エネルギー変化を推定するディープラーニングに基づく回帰モデルである。
- 参考スコア(独自算出の注目度): 0.2799896314754614
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The interaction between proteins and nucleic acids is crucial for processes that sustain cellular function, including DNA maintenance and the regulation of gene expression and translation. Amino acid mutations in protein-nucleic acid complexes often lead to vital diseases. Experimental techniques have their own specific limitations in predicting mutational effects in protein-nucleic acid complexes. In this study, we compiled a large dataset of 1951 mutations including both protein-DNA and protein-RNA complexes and integrated structural and sequential features to build a deep learning-based regression model named DeepPNI. This model estimates mutation-induced binding free energy changes in protein-nucleic acid complexes. The structural features are encoded via edge-aware RGCN and the sequential features are extracted using protein language model ESM-2. We have achieved a high average Pearson correlation coefficient (PCC) of 0.76 in the large dataset via five-fold cross-validation. Consistent performance across individual dataset of protein-DNA, protein-RNA complexes, and different experimental temperature split dataset make the model generalizable. Our model showed good performance in complex-based five-fold cross-validation, which proved its robustness. In addition, DeepPNI outperformed in external dataset validation, and comparison with existing tools
- Abstract(参考訳): タンパク質と核酸の相互作用は、DNAの維持や遺伝子発現および翻訳の調節を含む細胞機能を維持する過程において重要である。
タンパク質-核酸複合体のアミノ酸変異は、しばしば致命的な病気を引き起こす。
実験的手法は、タンパク質-核酸複合体の突然変異効果を予測するのに独自の制限がある。
本研究では, タンパク質-DNA, タンパク質-RNA複合体および構造的, シーケンシャルな機能を含む1951年の変異の大規模なデータセットをコンパイルし, DeepPNI というディープラーニングに基づく回帰モデルを構築した。
このモデルは、タンパク質-核酸複合体における突然変異誘起結合自由エネルギー変化を推定する。
構造的特徴はエッジ認識RGCNを介して符号化され、そのシーケンシャル特徴はタンパク質言語モデルESM-2を用いて抽出される。
我々は,5倍のクロスバリデーションによる大規模データセットにおいて,Pearson相関係数0.76の高平均値(PCC)を達成した。
タンパク質-DNA、タンパク質-RNA複合体、実験温度分割データセットの個々のデータセット間での一貫性の性能は、モデルを一般化できる。
本モデルでは, 複合型5次元クロスバリデーションにおいて良好な性能を示し, その堅牢性を示した。
さらに、DeepPNIは、外部データセットバリデーションと既存のツールとの比較において、パフォーマンスに優れています。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Protein binding affinity prediction under multiple substitutions applying eGNNs on Residue and Atomic graphs combined with Language model information: eGRAL [1.840390797252648]
ディープラーニングは、シリコン内予測と生体内観測のギャップを埋めることのできる強力なツールとして、ますます認識されている。
タンパク質複合体中のアミノ酸置換物からの結合親和性変化を予測するための新しいグラフニューラルネットワークアーキテクチャであるeGRALを提案する。
eGralは、タンパク質の大規模言語モデルから抽出された特徴のおかげで、残基、原子スケール、進化スケールを利用する。
論文 参考訳(メタデータ) (2024-05-03T10:33:19Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Functional Geometry Guided Protein Sequence and Backbone Structure
Co-Design [12.585697288315846]
本稿では,自動検出機能部位に基づくタンパク質配列と構造を共同設計するモデルを提案する。
NAEProは、全シーケンスでグローバルな相関を捉えることができる、注目層と同変層のインターリービングネットワークによって駆動される。
実験結果から,本モデルは全競技種の中で,最高アミノ酸回収率,TMスコア,最低RMSDを実現していることがわかった。
論文 参考訳(メタデータ) (2023-10-06T16:08:41Z) - SESNet: sequence-structure feature-integrated deep learning method for
data-efficient protein engineering [6.216757583450049]
タンパク質変異体の適合度を予測するための教師付きディープラーニングモデルであるSESNetを開発した。
SESNetは,シーケンスと関数の関係を予測するための最先端モデルよりも優れていることを示す。
我々のモデルは、タンパク質変異体の適合性の予測において、特に高次変異体に対して驚くほど高い精度を達成することができる。
論文 参考訳(メタデータ) (2022-12-29T01:49:52Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。