論文の概要: Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias
- arxiv url: http://arxiv.org/abs/2310.14764v1
- Date: Mon, 23 Oct 2023 10:02:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 20:57:36.045971
- Title: Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias
- Title(参考訳): k-merに基づくカオスゲーム表現とディープラーニングによるタンパク質-タンパク質相互作用の予測
- Authors: Ruth Veevers and Dan MacLean
- Abstract要約: 本稿では,対話データセットからユニークなペアを抽出し,非バイアス付き機械学習のための非冗長なペアデータを生成する手法を提案する。
我々は,タンパク質のコード遺伝子のカオスゲーム表現から相互作用を学習し,予測できる畳み込みニューラルネットワークモデルを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein-protein interactions drive many biological processes, including the
detection of phytopathogens by plants' R-Proteins and cell surface receptors.
Many machine learning studies have attempted to predict protein-protein
interactions but performance is highly dependent on training data; models have
been shown to accurately predict interactions when the proteins involved are
included in the training data, but achieve consistently poorer results when
applied to previously unseen proteins. In addition, models that are trained
using proteins that take part in multiple interactions can suffer from
representation bias, where predictions are driven not by learned biological
features but by learning of the structure of the interaction dataset.
We present a method for extracting unique pairs from an interaction dataset,
generating non-redundant paired data for unbiased machine learning. After
applying the method to datasets containing _Arabidopsis thaliana_ and pathogen
effector interations, we developed a convolutional neural network model capable
of learning and predicting interactions from Chaos Game Representations of
proteins' coding genes.
- Abstract(参考訳): タンパク質とタンパク質の相互作用は、植物のR-プロテインや細胞表面受容体による植物病原体の検出を含む多くの生物学的過程を誘導する。
多くの機械学習研究は、タンパク質とタンパク質の相互作用を予測しようとしたが、性能はトレーニングデータに大きく依存しており、関連するタンパク質がトレーニングデータに含まれるときの相互作用を正確に予測するモデルが示されている。
さらに、複数の相互作用に関与するタンパク質を用いて訓練されたモデルは、予測が学習された生物学的特徴ではなく、相互作用データセットの構造を学ぶことによって駆動される表現バイアスに悩まされる。
相互作用データセットからユニークなペアを抽出し、非バイアスの機械学習のための非冗長なペアデータを生成する。
本手法を_arabidopsis thaliana_および病原体エフェクターインターレーションを含むデータセットに適用し、タンパク質のコーディング遺伝子のカオスゲーム表現から相互作用を学習し予測する畳み込みニューラルネットワークモデルを開発した。
関連論文リスト
- Protein binding affinity prediction under multiple substitutions applying eGNNs on Residue and Atomic graphs combined with Language model information: eGRAL [1.840390797252648]
ディープラーニングは、シリコン内予測と生体内観測のギャップを埋めることのできる強力なツールとして、ますます認識されている。
タンパク質複合体中のアミノ酸置換物からの結合親和性変化を予測するための新しいグラフニューラルネットワークアーキテクチャであるeGRALを提案する。
eGralは、タンパク質の大規模言語モデルから抽出された特徴のおかげで、残基、原子スケール、進化スケールを利用する。
論文 参考訳(メタデータ) (2024-05-03T10:33:19Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Protein-ligand binding representation learning from fine-grained
interactions [29.965890962846093]
本稿では,タンパク質-リガンド結合表現を自己教師付き学習方式で学習することを提案する。
この自己教師付き学習問題は、決定的結合複素構造の予測として定式化される。
様々なバインディングタスクに対して,本手法の優位性を示す実験を行った。
論文 参考訳(メタデータ) (2023-11-09T01:33:09Z) - Growing ecosystem of deep learning methods for modeling
protein$\unicode{x2013}$protein interactions [0.0]
本稿では,タンパク質相互作用をモデル化する深層学習手法のエコシステムを論じる。
新たな相互作用を発見し、物理的なメカニズムを調節し、エンジニアのバインダーがそれらの機能を解き放つ機会がある。
論文 参考訳(メタデータ) (2023-10-10T15:53:27Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - A Supervised Machine Learning Approach for Sequence Based
Protein-protein Interaction (PPI) Prediction [4.916874464940376]
計算タンパク質間相互作用(PPI)予測技術は、時間、コスト、偽陽性相互作用の低減に大きく貢献する。
提案したソリューションをSeqPIPコンペティションの結果とともに紹介した。
論文 参考訳(メタデータ) (2022-03-23T18:27:25Z) - Learning Unknown from Correlations: Graph Neural Network for
Inter-novel-protein Interaction Prediction [7.860159889216291]
既存のメソッドは、見えないデータセットでテストすると、パフォーマンスが大幅に低下します。
本稿では,タンパク質間相互作用予測のためのグラフニューラルネットワーク(GNN-PPI)を提案する。
論文 参考訳(メタデータ) (2021-05-14T08:42:55Z) - Deep Learning of High-Order Interactions for Protein Interface
Prediction [58.164371994210406]
本稿では,タンパク質界面の予測を2次元密度予測問題として定式化する。
タンパク質をグラフとして表現し、グラフニューラルネットワークを用いてノードの特徴を学習する。
我々は高次対相互作用を組み込んで、異なる対相互作用を含む3次元テンソルを生成する。
論文 参考訳(メタデータ) (2020-07-18T05:39:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。