論文の概要: Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias
- arxiv url: http://arxiv.org/abs/2310.14764v1
- Date: Mon, 23 Oct 2023 10:02:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 20:57:36.045971
- Title: Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias
- Title(参考訳): k-merに基づくカオスゲーム表現とディープラーニングによるタンパク質-タンパク質相互作用の予測
- Authors: Ruth Veevers and Dan MacLean
- Abstract要約: 本稿では,対話データセットからユニークなペアを抽出し,非バイアス付き機械学習のための非冗長なペアデータを生成する手法を提案する。
我々は,タンパク質のコード遺伝子のカオスゲーム表現から相互作用を学習し,予測できる畳み込みニューラルネットワークモデルを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein-protein interactions drive many biological processes, including the
detection of phytopathogens by plants' R-Proteins and cell surface receptors.
Many machine learning studies have attempted to predict protein-protein
interactions but performance is highly dependent on training data; models have
been shown to accurately predict interactions when the proteins involved are
included in the training data, but achieve consistently poorer results when
applied to previously unseen proteins. In addition, models that are trained
using proteins that take part in multiple interactions can suffer from
representation bias, where predictions are driven not by learned biological
features but by learning of the structure of the interaction dataset.
We present a method for extracting unique pairs from an interaction dataset,
generating non-redundant paired data for unbiased machine learning. After
applying the method to datasets containing _Arabidopsis thaliana_ and pathogen
effector interations, we developed a convolutional neural network model capable
of learning and predicting interactions from Chaos Game Representations of
proteins' coding genes.
- Abstract(参考訳): タンパク質とタンパク質の相互作用は、植物のR-プロテインや細胞表面受容体による植物病原体の検出を含む多くの生物学的過程を誘導する。
多くの機械学習研究は、タンパク質とタンパク質の相互作用を予測しようとしたが、性能はトレーニングデータに大きく依存しており、関連するタンパク質がトレーニングデータに含まれるときの相互作用を正確に予測するモデルが示されている。
さらに、複数の相互作用に関与するタンパク質を用いて訓練されたモデルは、予測が学習された生物学的特徴ではなく、相互作用データセットの構造を学ぶことによって駆動される表現バイアスに悩まされる。
相互作用データセットからユニークなペアを抽出し、非バイアスの機械学習のための非冗長なペアデータを生成する。
本手法を_arabidopsis thaliana_および病原体エフェクターインターレーションを含むデータセットに適用し、タンパク質のコーディング遺伝子のカオスゲーム表現から相互作用を学習し予測する畳み込みニューラルネットワークモデルを開発した。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Long-context Protein Language Model [76.95505296417866]
言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで我々は,選択的構造化状態空間モデルから構築した代替のタンパク質LMアーキテクチャであるBiMamba-Sに基づくLC-PLMを提案する。
また、第2段階のトレーニングのために、タンパク質-タンパク質相互作用グラフの文脈化を行うLC-PLM-Gも導入した。
論文 参考訳(メタデータ) (2024-10-29T16:43:28Z) - Protein binding affinity prediction under multiple substitutions applying eGNNs on Residue and Atomic graphs combined with Language model information: eGRAL [1.840390797252648]
ディープラーニングは、シリコン内予測と生体内観測のギャップを埋めることのできる強力なツールとして、ますます認識されている。
タンパク質複合体中のアミノ酸置換物からの結合親和性変化を予測するための新しいグラフニューラルネットワークアーキテクチャであるeGRALを提案する。
eGralは、タンパク質の大規模言語モデルから抽出された特徴のおかげで、残基、原子スケール、進化スケールを利用する。
論文 参考訳(メタデータ) (2024-05-03T10:33:19Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - Protein-ligand binding representation learning from fine-grained
interactions [29.965890962846093]
本稿では,タンパク質-リガンド結合表現を自己教師付き学習方式で学習することを提案する。
この自己教師付き学習問題は、決定的結合複素構造の予測として定式化される。
様々なバインディングタスクに対して,本手法の優位性を示す実験を行った。
論文 参考訳(メタデータ) (2023-11-09T01:33:09Z) - Growing ecosystem of deep learning methods for modeling
protein$\unicode{x2013}$protein interactions [0.0]
本稿では,タンパク質相互作用をモデル化する深層学習手法のエコシステムを論じる。
新たな相互作用を発見し、物理的なメカニズムを調節し、エンジニアのバインダーがそれらの機能を解き放つ機会がある。
論文 参考訳(メタデータ) (2023-10-10T15:53:27Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - A Supervised Machine Learning Approach for Sequence Based
Protein-protein Interaction (PPI) Prediction [4.916874464940376]
計算タンパク質間相互作用(PPI)予測技術は、時間、コスト、偽陽性相互作用の低減に大きく貢献する。
提案したソリューションをSeqPIPコンペティションの結果とともに紹介した。
論文 参考訳(メタデータ) (2022-03-23T18:27:25Z) - Learning Unknown from Correlations: Graph Neural Network for
Inter-novel-protein Interaction Prediction [7.860159889216291]
既存のメソッドは、見えないデータセットでテストすると、パフォーマンスが大幅に低下します。
本稿では,タンパク質間相互作用予測のためのグラフニューラルネットワーク(GNN-PPI)を提案する。
論文 参考訳(メタデータ) (2021-05-14T08:42:55Z) - Deep Learning of High-Order Interactions for Protein Interface
Prediction [58.164371994210406]
本稿では,タンパク質界面の予測を2次元密度予測問題として定式化する。
タンパク質をグラフとして表現し、グラフニューラルネットワークを用いてノードの特徴を学習する。
我々は高次対相互作用を組み込んで、異なる対相互作用を含む3次元テンソルを生成する。
論文 参考訳(メタデータ) (2020-07-18T05:39:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。