論文の概要: Site2Vec: a reference frame invariant algorithm for vector embedding of
protein-ligand binding sites
- arxiv url: http://arxiv.org/abs/2003.08149v2
- Date: Mon, 27 Jul 2020 10:30:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 13:16:05.812565
- Title: Site2Vec: a reference frame invariant algorithm for vector embedding of
protein-ligand binding sites
- Title(参考訳): Site2Vec:タンパク質-リガンド結合部位のベクター埋め込みのための参照フレーム不変アルゴリズム
- Authors: Arnab Bhadra and Kalidas Y
- Abstract要約: リガンド(Ligand)は、結合部位と呼ばれる表面上の特定の領域でタンパク質分子と相互作用する小さな分子である。
ディープニューラルネットワークアルゴリズムがデプロイされ、非常に複雑な入力特徴空間をキャプチャできるようになった。
本稿では,タンパク質-リガンド結合部位の参照フレーム不変ベクトル埋め込みを導出する新しいアルゴリズムについて報告する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Protein-ligand interactions are one of the fundamental types of molecular
interactions in living systems. Ligands are small molecules that interact with
protein molecules at specific regions on their surfaces called binding sites.
Tasks such as assessment of protein functional similarity and detection of side
effects of drugs need identification of similar binding sites of disparate
proteins across diverse pathways. Machine learning methods for similarity
assessment require feature descriptors of binding sites. Traditional methods
based on hand engineered motifs and atomic configurations are not scalable
across several thousands of sites. In this regard, deep neural network
algorithms are now deployed which can capture very complex input feature space.
However, one fundamental challenge in applying deep learning to structures of
binding sites is the input representation and the reference frame. We report
here a novel algorithm Site2Vec that derives reference frame invariant vector
embedding of a protein-ligand binding site. The method is based on pairwise
distances between representative points and chemical compositions in terms of
constituent amino acids of a site. The vector embedding serves as a locality
sensitive hash function for proximity queries and determining similar sites.
The method has been the top performer with more than 95% quality scores in
extensive benchmarking studies carried over 10 datasets and against 23 other
site comparison methods. The algorithm serves for high throughput processing
and has been evaluated for stability with respect to reference frame shifts,
coordinate perturbations and residue mutations. We provide Site2Vec as a stand
alone executable and a web service hosted at
\url{http://services.iittp.ac.in/bioinfo/home}.
- Abstract(参考訳): タンパク質とリガンドの相互作用は、生体における分子相互作用の基本的なタイプの1つである。
リガンドは、結合部位と呼ばれる表面の特定の領域でタンパク質分子と相互作用する小さな分子である。
タンパク質の機能的類似性の評価や薬物の副作用の検出などの課題は、様々な経路で異なるタンパク質の類似した結合部位を同定する必要がある。
類似度評価のための機械学習手法は、結合サイトの特徴記述子を必要とする。
手作業によるモチーフとアトミックな構成に基づく従来の手法は、数千のサイトでは拡張性がない。
この点に関して、ディープニューラルネットワークアルゴリズムがデプロイされ、非常に複雑な入力機能空間をキャプチャできます。
しかしながら、結合サイトの構造にディープラーニングを適用する上での基本的な課題は、入力表現と参照フレームである。
本稿では,タンパク質-リガンド結合部位の参照フレーム不変ベクトル埋め込みを導出する新しいアルゴリズムSite2Vecについて報告する。
本発明の方法は、部位の構成アミノ酸の観点から、代表点と化学組成の対距離に基づく。
ベクトル埋め込みは局所性に敏感なハッシュ関数として機能し、近接クエリや類似サイトを決定する。
この手法は10以上のデータセットと23のサイト比較手法を対象とする広範囲なベンチマーク研究において95%以上の品質スコアを持つトップパフォーマーである。
このアルゴリズムは高いスループットの処理に役立ち、参照フレームシフト、座標摂動、残基突然変異に関する安定性の評価がなされている。
site2vecはスタンドアローンの実行可能で、webサービスは \url{http://services.iittp.ac.in/bioinfo/home}でホストされています。
関連論文リスト
- Revisiting Adaptive Cellular Recognition Under Domain Shifts: A Contextual Correspondence View [49.03501451546763]
生物学的文脈における暗黙の対応の重要性を明らかにする。
モデル構成成分間のインスタンス認識トレードオフを確保するために, 自己適応型動的蒸留を提案する。
論文 参考訳(メタデータ) (2024-07-14T04:41:16Z) - ContactNet: Geometric-Based Deep Learning Model for Predicting Protein-Protein Interactions [2.874893537471256]
我々は,PPIモデルを正確かつ誤ったものに分類するための新しい注目型グラフニューラルネットワーク(GNN)であるContactNetを開発した。
ドッキング抗原やモデル抗体構造を訓練すると、ContactNetは現在の最先端のスコアリング機能の精度を2倍にする。
論文 参考訳(メタデータ) (2024-06-26T12:54:41Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Exploiting Hierarchical Interactions for Protein Surface Learning [52.10066114039307]
本質的には、タンパク質表面のポテンシャル関数部位は、幾何学的特徴と化学的特徴の両方によって決定される。
本稿では,ディープラーニング技術,すなわち階層型化学・幾何学的特徴相互作用ネットワーク(HCGNet)に基づく原則的フレームワークを提案する。
提案手法は,現場予測タスクが2.3%,インタラクションマッチングタスクが3.2%,従来の最先端手法が2.3%向上した。
論文 参考訳(メタデータ) (2024-01-17T14:10:40Z) - ProFSA: Self-supervised Pocket Pretraining via Protein
Fragment-Surroundings Alignment [20.012210194899605]
本稿では,高分解能原子タンパク質構造からの知識を活用したポケット事前学習手法を提案する。
ProFSAと命名された本手法は,ポケットの薬剤性予測など,様々なタスクにおける最先端性能を実現する。
我々の研究は、高品質で多様なタンパク質構造データベースを活用することにより、タンパク質-リガンド複合体データの不足を軽減するための新たな道を開く。
論文 参考訳(メタデータ) (2023-10-11T06:36:23Z) - Insights Into the Inner Workings of Transformer Models for Protein
Function Prediction [1.1183543438473609]
我々は、タンパク質機能予測のためのニューラルネットワークの内部動作に光を当てるのに、説明可能な人工知能(XAI)がいかに役立つかを探求した。
このアプローチにより、トランスフォーマーが特に注意を払う配列中のアミノ酸を同定し、これらの関連配列が生物学や化学からの期待を反映していることを示すことができた。
論文 参考訳(メタデータ) (2023-09-07T10:54:06Z) - Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Structure-aware Interactive Graph Neural Networks for the Prediction of
Protein-Ligand Binding Affinity [52.67037774136973]
薬物発見はタンパク質-リガンド結合親和性の予測にしばしば依存する。
近年の進歩は、タンパク質-リガンド複合体の表現を学習することで、グラフニューラルネットワーク(GNN)をより良い親和性予測に応用する大きな可能性を示している。
ポーラインスパイアグラフアテンション層(PGAL)とペア・インタラクティブ・プール(PiPool)の2つのコンポーネントから構成される構造対応型インタラクティブグラフニューラルネットワーク(SIGN)を提案する。
論文 参考訳(メタデータ) (2021-07-21T03:34:09Z) - High throughput screening with machine learning [18.152525914196993]
本研究では,分子結合親和性の予測における機械学習手法の有効性を評価する。
モデルは、タンパク質と小さな有機分子のペアのための阻害定数$K_i$の点で結合親和性を予測するように訓練された。
論文 参考訳(メタデータ) (2020-12-15T13:19:03Z) - Protein Conformational States: A First Principles Bayesian Method [0.0]
我々は,原子対原子対接触を利用するために,機械学習コミュニティのベイズ分類器を適用した。
我々の適応の非自明な特徴は情報エントロピーへの新たな接続であり、分類を損なうことなく構造的詳細のレベルを変更できる。
この方法の導出は、原子間接触の集合に関するベイズ解析から導かれ、より複雑なケースへの理解と拡張が容易になる。
論文 参考訳(メタデータ) (2020-08-05T20:35:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。