論文の概要: PLA-SGCN: Protein-Ligand Binding Affinity Prediction by Integrating Similar Pairs and Semi-supervised Graph Convolutional Network
- arxiv url: http://arxiv.org/abs/2405.07452v2
- Date: Sat, 18 May 2024 08:55:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-21 20:15:46.269103
- Title: PLA-SGCN: Protein-Ligand Binding Affinity Prediction by Integrating Similar Pairs and Semi-supervised Graph Convolutional Network
- Title(参考訳): PLA-SGCN:類似ペアと半教師付きグラフ畳み込みネットワークの統合によるタンパク質-リガンド結合親和性予測
- Authors: Karim Abbasi, Parvin Razzaghi, Amin Ghareyazi, Hamid R. Rabiee,
- Abstract要約: 半教師付きグラフ畳み込みネットワーク(GCN)を用いたPLA予測(タスク予測ステップ)において検索したハードタンパク質-リガンドペアを統合することを目的とする。
その結果,提案手法は同等の手法よりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 6.024776891570197
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The protein-ligand binding affinity (PLA) prediction goal is to predict whether or not the ligand could bind to a protein sequence. Recently, in PLA prediction, deep learning has received much attention. Two steps are involved in deep learning-based approaches: feature extraction and task prediction step. Many deep learning-based approaches concentrate on introducing new feature extraction networks or integrating auxiliary knowledge like protein-protein interaction networks or gene ontology knowledge. Then, a task prediction network is designed simply using some fully connected layers. This paper aims to integrate retrieved similar hard protein-ligand pairs in PLA prediction (i.e., task prediction step) using a semi-supervised graph convolutional network (GCN). Hard protein-ligand pairs are retrieved for each input query sample based on the manifold smoothness constraint. Then, a graph is learned automatically in which each node is a protein-ligand pair, and each edge represents the similarity between pairs. In other words, an end-to-end framework is proposed that simultaneously retrieves hard similar samples, learns protein-ligand descriptor, learns the graph topology of the input sample with retrieved similar hard samples (learn adjacency matrix), and learns a semi-supervised GCN to predict the binding affinity (as task predictor). The training step adjusts the parameter values, and in the inference step, the learned model is fine-tuned for each input sample. To evaluate the proposed approach, it is applied to the four well-known PDBbind, Davis, KIBA, and BindingDB datasets. The results show that the proposed method significantly performs better than the comparable approaches.
- Abstract(参考訳): タンパク質リガンド結合親和性(PLA)予測目標は、リガンドがタンパク質配列に結合するかどうかを予測することである。
近年,PLA予測では,ディープラーニングが注目されている。
深層学習に基づくアプローチには,機能抽出とタスク予測という2つのステップがある。
多くのディープラーニングベースのアプローチは、新機能抽出ネットワークの導入、タンパク質とタンパク質の相互作用ネットワークや遺伝子オントロジーの知識といった補助的な知識の統合に重点を置いている。
すると、タスク予測ネットワークは、完全に接続されたレイヤをシンプルに設計する。
本稿では,検索した類似のタンパク質-リガンドペアを,半教師付きグラフ畳み込みネットワーク(GCN)を用いてPLA予測(タスク予測ステップ)に統合することを目的とする。
多様体の滑らか度制約に基づいて、入力クエリサンプル毎にハードタンパク質-リガンドペアを検索する。
そして、各ノードがタンパク質-リガンド対であるグラフを自動的に学習し、各エッジがペア間の類似性を表す。
言い換えれば、ハードな類似のサンプルを同時に検索し、タンパク質リガンド記述子を学習し、検索した類似のハードなサンプル(学習隣接行列)で入力されたサンプルのグラフトポロジーを学習し、半教師付きGCNを学習して、結合親和性(タスク予測子)を予測するエンド・ツー・エンドのフレームワークが提案される。
トレーニングステップはパラメータ値を調整し、推論ステップでは、各入力サンプルに対して学習されたモデルを微調整する。
提案手法を評価するために、有名な4つのPDBbind、Davis、KIBA、BindingDBデータセットに適用する。
その結果,提案手法は同等の手法よりも優れた性能を示した。
関連論文リスト
- FABind: Fast and Accurate Protein-Ligand Binding [127.7790493202716]
$mathbfFABind$はポケット予測とドッキングを組み合わせたエンドツーエンドモデルで、正確で高速なタンパク質-リガンド結合を実現する。
提案モデルでは,既存手法と比較して有効性と効率性に強い利点が示される。
論文 参考訳(メタデータ) (2023-10-10T16:39:47Z) - On the Equivalence of Graph Convolution and Mixup [71.8932383179048]
本稿では,グラフ畳み込みと混合手法の関係について検討する。
2つの穏やかな条件の下では、グラフの畳み込みはMixupの特別な形式と見なすことができる。
グラフ畳み込みネットワーク(GCN)と単純化グラフ畳み込み(SGC)をミックスアップの形で表現できることを証明し、数学的にこの等価性を確立する。
論文 参考訳(メタデータ) (2023-09-29T23:09:54Z) - Geometric Graph Learning with Extended Atom-Types Features for
Protein-Ligand Binding Affinity Prediction [0.17132914341329847]
我々は、SYBYLのような広範囲な原子タイプを統合することにより、タンパク質-リガンド相互作用の研究のためにグラフベースの学習者をアップグレードする。
我々のアプローチでは、$textsybyltextGGL$-Scoreと$texteciftextGGL$-Scoreの2つの異なるメソッドが生成される。
SYBYL atom-type model $textsybyltextGGL$-Score はすべてのベンチマークで他の手法よりも優れています。
論文 参考訳(メタデータ) (2023-01-15T21:30:21Z) - HAC-Net: A Hybrid Attention-Based Convolutional Neural Network for
Highly Accurate Protein-Ligand Binding Affinity Prediction [0.0]
本稿では,3次元畳み込みニューラルネットワークと2つのグラフ畳み込みニューラルネットワークからなる新しいディープラーニングアーキテクチャを提案する。
HAC-NetはPDBbind v.2016コアセットの最先端結果を取得する。
我々は,このモデルを,構造に基づく生体分子特性予測に関連する幅広い教師付き学習問題に拡張できると考えている。
論文 参考訳(メタデータ) (2022-12-23T16:14:53Z) - Line Graph Contrastive Learning for Link Prediction [4.876567687745239]
多視点情報を得るために,Line Graph Contrastive Learning (LGCL)法を提案する。
6つの公開データセットの実験により、LGCLはリンク予測タスクの現在のベンチマークを上回っている。
論文 参考訳(メタデータ) (2022-10-25T06:57:00Z) - Dense FixMatch: a simple semi-supervised learning method for pixel-wise
prediction tasks [68.36996813591425]
Dense FixMatchは,高密度かつ構造化された予測タスクのオンライン半教師付き学習のための簡易な手法である。
我々は、擬似ラベルにマッチング操作を追加することにより、画像分類を超えた半教師付き学習問題にFixMatchの適用を可能にする。
Dense FixMatchは、ラベル付きデータのみを使用して教師付き学習と比較すると、結果を著しく改善し、ラベル付きサンプルの1/4でそのパフォーマンスに近づいた。
論文 参考訳(メタデータ) (2022-10-18T15:02:51Z) - Pre-training Co-evolutionary Protein Representation via A Pairwise
Masked Language Model [93.9943278892735]
タンパク質配列表現学習の鍵となる問題は、配列中の残基間の共変量によって反映される共進化情報をキャプチャすることである。
Pairwise Masked Language Model (PMLM) と呼ばれる専用言語モデルによる事前学習により,この情報を直接キャプチャする新しい手法を提案する。
提案手法は, 相互関係を効果的に把握し, ベースラインと比較して, 接触予測性能を最大9%向上できることを示す。
論文 参考訳(メタデータ) (2021-10-29T04:01:32Z) - Structure-aware Interactive Graph Neural Networks for the Prediction of
Protein-Ligand Binding Affinity [52.67037774136973]
薬物発見はタンパク質-リガンド結合親和性の予測にしばしば依存する。
近年の進歩は、タンパク質-リガンド複合体の表現を学習することで、グラフニューラルネットワーク(GNN)をより良い親和性予測に応用する大きな可能性を示している。
ポーラインスパイアグラフアテンション層(PGAL)とペア・インタラクティブ・プール(PiPool)の2つのコンポーネントから構成される構造対応型インタラクティブグラフニューラルネットワーク(SIGN)を提案する。
論文 参考訳(メタデータ) (2021-07-21T03:34:09Z) - Pre-training Protein Language Models with Label-Agnostic Binding Pairs
Enhances Performance in Downstream Tasks [1.452875650827562]
タンパク質配列の1%未満は構造的にも機能的にも注釈付けされている。
本稿では,結合タンパク質配列と非結合タンパク質配列を混合したRoBERTaモデルを提案する。
トランスフォーマーの注意機構は,タンパク質結合部位の発見に寄与することが示唆された。
論文 参考訳(メタデータ) (2020-12-05T17:37:41Z) - Deep Learning of High-Order Interactions for Protein Interface
Prediction [58.164371994210406]
本稿では,タンパク質界面の予測を2次元密度予測問題として定式化する。
タンパク質をグラフとして表現し、グラフニューラルネットワークを用いてノードの特徴を学習する。
我々は高次対相互作用を組み込んで、異なる対相互作用を含む3次元テンソルを生成する。
論文 参考訳(メタデータ) (2020-07-18T05:39:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。