論文の概要: Boosting Convolutional Neural Networks' Protein Binding Site Prediction
Capacity Using SE(3)-invariant transformers, Transfer Learning and
Homology-based Augmentation
- arxiv url: http://arxiv.org/abs/2303.08818v2
- Date: Tue, 18 Apr 2023 05:05:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 17:39:18.267123
- Title: Boosting Convolutional Neural Networks' Protein Binding Site Prediction
Capacity Using SE(3)-invariant transformers, Transfer Learning and
Homology-based Augmentation
- Title(参考訳): se(3)不変トランスフォーマー、転送学習、ホモロジーに基づく拡張を用いた畳み込みニューラルネットワークのタンパク質結合部位予測能力の増強
- Authors: Daeseok Lee, Jeunghyun Byun and Bonggun Shin
- Abstract要約: 標的タンパク質の小さな結合部位を、ポケットや残基の分解能で見つけることは、実際の薬物発見のシナリオにおいて重要である。
そこで本研究では,実世界のアプリケーションに関係のある,結合サイト予測のための新しい計算手法を提案する。
- 参考スコア(独自算出の注目度): 1.160208922584163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Figuring out small molecule binding sites in target proteins, in the
resolution of either pocket or residue, is critical in many virtual and real
drug-discovery scenarios. Since it is not always easy to find such binding
sites based on domain knowledge or traditional methods, different deep learning
methods that predict binding sites out of protein structures have been
developed in recent years. Here we present a new such deep learning algorithm,
that significantly outperformed all state-of-the-art baselines in terms of the
both resolutions$\unicode{x2013}$pocket and residue. This good performance was
also demonstrated in a case study involving the protein human serum albumin and
its binding sites. Our algorithm included new ideas both in the model
architecture and in the training method. For the model architecture, it
incorporated SE(3)-invariant geometric self-attention layers that operate on
top of residue-level CNN outputs. This residue-level processing of the model
allowed a transfer learning between the two resolutions, which turned out to
significantly improve the binding pocket prediction. Moreover, we developed
novel augmentation method based on protein homology, which prevented our model
from over-fitting. Overall, we believe that our contribution to the literature
is twofold. First, we provided a new computational method for binding site
prediction that is relevant to real-world applications, as shown by the good
performance on different benchmarks and case study. Second, the novel ideas in
our method$\unicode{x2013}$the model architecture, transfer learning and the
homology augmentation$\unicode{x2013}$would serve as useful components in
future works.
- Abstract(参考訳): 標的タンパク質中の小さな分子結合部位を、ポケットや残基の分解能で見つけることは、多くの仮想的および実際の薬物発見シナリオにおいて重要である。
ドメイン知識や従来の手法に基づく結合サイトを見つけることは必ずしも容易ではないため、タンパク質構造から結合サイトを予測する異なる深層学習法が近年開発されている。
ここでは,最先端のベースラインをそれぞれ$\unicode{x2013}$pocketと残差で大幅に上回る,新たなディープラーニングアルゴリズムを提案する。
この優れた性能は、ヒト血清アルブミンとその結合部位のタンパク質を含むケーススタディでも実証された。
我々のアルゴリズムには、モデルアーキテクチャとトレーニング方法の両方で新しいアイデアが含まれていた。
モデルアーキテクチャでは、残差レベルCNN出力上で動作するSE(3)不変な幾何学的自己アテンション層を組み込んだ。
このモデルの残差レベル処理により、2つの解像度間の転送学習が可能となり、バインディングポケット予測を大幅に改善することができた。
さらに,タンパク質のホモロジーに基づく新しい拡張法を開発し,モデルが過度に適合することを防止した。
全体として、我々の文学への貢献は2つあると信じている。
まず,異なるベンチマークやケーススタディの優れた性能で示されるように,実世界のアプリケーションに関係のあるサイト予測を結合するための新しい計算方法を提案する。
第二に、我々の方法である$\unicode{x2013}$ the model architecture, transfer learning and the homology augmentation$\unicode{x2013}$would の斬新なアイデアは、将来の作品において有用な構成要素となる。
関連論文リスト
- Deep Manifold Transformation for Protein Representation Learning [42.43017670985785]
ユニバーサルアンダーラインタンパク質アンダーライン変換(DMTPRL)のための新しいアンダーラインディープアンダーラインマンフォールドアンダーライントランスアプローチを提案する。
学習した埋め込みの品質と適応性を改善するために、多様体学習戦略を採用している。
DMTPRL法は、一般的なデータセットをまたいだ様々な下流タスクにおける最先端のベースラインよりも優れている。
論文 参考訳(メタデータ) (2024-01-12T18:38:14Z) - The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - Tackling Computational Heterogeneity in FL: A Few Theoretical Insights [68.8204255655161]
我々は、計算異種データの形式化と処理を可能にする新しい集約フレームワークを導入し、分析する。
提案するアグリゲーションアルゴリズムは理論的および実験的予測から広範囲に解析される。
論文 参考訳(メタデータ) (2023-07-12T16:28:21Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - HAC-Net: A Hybrid Attention-Based Convolutional Neural Network for
Highly Accurate Protein-Ligand Binding Affinity Prediction [0.0]
本稿では,3次元畳み込みニューラルネットワークと2つのグラフ畳み込みニューラルネットワークからなる新しいディープラーニングアーキテクチャを提案する。
HAC-NetはPDBbind v.2016コアセットの最先端結果を取得する。
我々は,このモデルを,構造に基づく生体分子特性予測に関連する幅広い教師付き学習問題に拡張できると考えている。
論文 参考訳(メタデータ) (2022-12-23T16:14:53Z) - Integration of Pre-trained Protein Language Models into Geometric Deep
Learning Networks [68.90692290665648]
我々は、タンパク質言語モデルから学んだ知識を、いくつかの最先端の幾何学的ネットワークに統合する。
以上の結果から,ベースラインを20%上回る総合的な改善が見られた。
強い証拠は、タンパク質言語モデルの知識を取り入れることで、幾何学的ネットワークの能力が著しく向上することを示している。
論文 参考訳(メタデータ) (2022-12-07T04:04:04Z) - Improved Convergence Guarantees for Shallow Neural Networks [91.3755431537592]
勾配降下法により訓練された深度2ニューラルネットの収束度を世界最小とする。
我々のモデルには、二次損失関数による回帰、完全連結フィードフォワードアーキテクチャ、RelUアクティベーション、ガウスデータインスタンス、逆ラベルといった特徴がある。
彼らは、少なくとも我々のモデルでは、収束現象がNTK体制をはるかに超越していることを強く示唆している」。
論文 参考訳(メタデータ) (2022-12-05T14:47:52Z) - Adapting the Mean Teacher for keypoint-based lung registration under
geometric domain shifts [75.51482952586773]
ディープニューラルネットワークは一般的に、ラベル付きトレーニングデータが多く必要であり、トレーニングデータとテストデータの間のドメインシフトに弱い。
本稿では,ラベル付きソースからラベル付きターゲットドメインへのモデルの適用により,画像登録のための幾何学的領域適応手法を提案する。
本手法は,ベースラインモデルの精度を目標データに適合させながら,ベースラインモデルの50%/47%を継続的に改善する。
論文 参考訳(メタデータ) (2022-07-01T12:16:42Z) - A new method for binary classification of proteins with Machine Learning [0.0]
本研究では,ディープラーニング手法を用いてタンパク質構造を分類する手法を提案する。
私たちの人工知能は、タンパク質データバンク(PDB)データベースから外挿された複雑な生体分子構造を認識し、イメージとして再処理するように訓練されています。
この目的のために、これらの画像から重要な特徴を抽出し、分子を正しく分類するために、InceptionResNetV2やInceptionV3のような事前訓練された畳み込みニューラルネットワークを用いて様々な試験が行われた。
論文 参考訳(メタデータ) (2021-11-03T01:58:34Z) - Protein sequence-to-structure learning: Is this the end(-to-end
revolution)? [0.8399688944263843]
CASP14では、ディープラーニングにより、予想外のレベルがほぼ実験精度に達するまで、フィールドが強化された。
新しいアプローチには、(i)幾何学的学習、すなわち、
グラフ、3d voronoi tessellation、point cloudsといった表現について学ぶ。
我々は,過去2年間に開発され,CASP14で広く利用されている新しいディープラーニングアプローチの概要と展望について述べる。
論文 参考訳(メタデータ) (2021-05-16T10:46:44Z) - DeepFoldit -- A Deep Reinforcement Learning Neural Network Folding
Proteins [0.0]
私たちはDeepFolditと呼ばれるディープ強化ニューラルネットワークをトレーニングし、タンパク質の展開に割り当てられたスコアを改善しました。
提案手法は,Folditの直感的なユーザインタフェースと深層強化学習の効率性を組み合わせたものである。
論文 参考訳(メタデータ) (2020-10-28T16:05:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。