論文の概要: Protein-ligand binding representation learning from fine-grained
interactions
- arxiv url: http://arxiv.org/abs/2311.16160v1
- Date: Thu, 9 Nov 2023 01:33:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-03 13:21:19.327756
- Title: Protein-ligand binding representation learning from fine-grained
interactions
- Title(参考訳): きめ細かい相互作用によるタンパク質-リガンド結合表現学習
- Authors: Shikun Feng, Minghao Li, Yinjun Jia, Weiying Ma, Yanyan Lan
- Abstract要約: 本稿では,タンパク質-リガンド結合表現を自己教師付き学習方式で学習することを提案する。
この自己教師付き学習問題は、決定的結合複素構造の予測として定式化される。
様々なバインディングタスクに対して,本手法の優位性を示す実験を行った。
- 参考スコア(独自算出の注目度): 29.965890962846093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The binding between proteins and ligands plays a crucial role in the realm of
drug discovery. Previous deep learning approaches have shown promising results
over traditional computationally intensive methods, but resulting in poor
generalization due to limited supervised data. In this paper, we propose to
learn protein-ligand binding representation in a self-supervised learning
manner. Different from existing pre-training approaches which treat proteins
and ligands individually, we emphasize to discern the intricate binding
patterns from fine-grained interactions. Specifically, this self-supervised
learning problem is formulated as a prediction of the conclusive binding
complex structure given a pocket and ligand with a Transformer based
interaction module, which naturally emulates the binding process. To ensure the
representation of rich binding information, we introduce two pre-training
tasks, i.e.~atomic pairwise distance map prediction and mask ligand
reconstruction, which comprehensively model the fine-grained interactions from
both structure and feature space. Extensive experiments have demonstrated the
superiority of our method across various binding tasks, including
protein-ligand affinity prediction, virtual screening and protein-ligand
docking.
- Abstract(参考訳): タンパク質とリガンドの間の結合は、創薬の分野で重要な役割を果たす。
従来のディープラーニングアプローチは、従来の計算集約的な手法よりも有望な結果を示しているが、教師付きデータに制限があるため、一般化が不十分である。
本稿では,タンパク質リガンド結合表現を自己教師あり学習で学ぶことを提案する。
タンパク質とリガンドを個別に扱う既存のプレトレーニングアプローチとは異なり、細かい粒度の相互作用から複雑な結合パターンを識別することを強調する。
具体的には、この自己教師付き学習問題を、結束過程を自然にエミュレートするトランスベースの相互作用モジュールを備えたポケットおよびリガンドが与えられた決定的結合複合体構造の予測として定式化する。
リッチな結合情報の表現を確実にするために、構造と特徴空間の両方からきめ細かい相互作用を包括的にモデル化する2つの事前学習タスク、すなわち-原子対方向距離マップ予測とマスクリガンド再構成を導入する。
タンパク質結合親和性予測,仮想スクリーニング,タンパク質結合ドッキングなど,様々な結合課題において,本手法の優越性が実証されている。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - A distributional simplicity bias in the learning dynamics of transformers [50.91742043564049]
自然言語データに基づいてトレーニングされたトランスフォーマーは、単純さのバイアスも示している。
具体的には、入力トークン間の多体相互作用を逐次学習し、低次相互作用の予測誤差において飽和点に達する。
このアプローチは、自然言語処理などにおいて、データ内の異なる順序の相互作用が学習にどのように影響するかを研究する可能性を開く。
論文 参考訳(メタデータ) (2024-10-25T15:39:34Z) - Assessing interaction recovery of predicted protein-ligand poses [0.39331876802505306]
タンパク質-リガンド相互作用指紋を無視するとモデル性能が過大評価される可能性が示唆された。
本研究では,タンパク質-リガンド相互作用指紋の無視がモデル性能の過大評価につながることを示す。
論文 参考訳(メタデータ) (2024-09-30T12:06:13Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - Protein Representation Learning by Capturing Protein Sequence-Structure-Function Relationship [12.11413472492417]
AMMAは3つのモダリティを統一表現空間に統合するために、統一されたマルチモーダルエンコーダを採用する。
AMMAは、配列の整った相互関係を示すタンパク質表現の学習に非常に効果的である。
論文 参考訳(メタデータ) (2024-04-29T05:42:29Z) - Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias [0.0]
本稿では,対話データセットからユニークなペアを抽出し,非バイアス付き機械学習のための非冗長なペアデータを生成する手法を提案する。
我々は,タンパク質のコード遺伝子のカオスゲーム表現から相互作用を学習し,予測できる畳み込みニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2023-10-23T10:02:23Z) - ProFSA: Self-supervised Pocket Pretraining via Protein
Fragment-Surroundings Alignment [20.012210194899605]
本稿では,高分解能原子タンパク質構造からの知識を活用したポケット事前学習手法を提案する。
ProFSAと命名された本手法は,ポケットの薬剤性予測など,様々なタスクにおける最先端性能を実現する。
我々の研究は、高品質で多様なタンパク質構造データベースを活用することにより、タンパク質-リガンド複合体データの不足を軽減するための新たな道を開く。
論文 参考訳(メタデータ) (2023-10-11T06:36:23Z) - Growing ecosystem of deep learning methods for modeling
protein$\unicode{x2013}$protein interactions [0.0]
本稿では,タンパク質相互作用をモデル化する深層学習手法のエコシステムを論じる。
新たな相互作用を発見し、物理的なメカニズムを調節し、エンジニアのバインダーがそれらの機能を解き放つ機会がある。
論文 参考訳(メタデータ) (2023-10-10T15:53:27Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Explainable Deep Relational Networks for Predicting Compound-Protein
Affinities and Contacts [80.69440684790925]
Deep Relationsは物理にインスパイアされた、本質的に説明可能なアーキテクチャを持つディープリレーショナルネットワークである。
それは最先端技術に対する優れた解釈可能性を示している。
接触予測 9.5, 16.9, 19.3, 5.7 倍の AUPRC をテスト用、複合ユニク、タンパク質ユニク、両ユニクセットで強化する。
論文 参考訳(メタデータ) (2019-12-29T00:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。