論文の概要: Dock2D: Synthetic data for the molecular recognition problem
- arxiv url: http://arxiv.org/abs/2212.03456v1
- Date: Wed, 7 Dec 2022 04:46:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 17:10:04.424690
- Title: Dock2D: Synthetic data for the molecular recognition problem
- Title(参考訳): Dock2D:分子認識問題のための合成データ
- Authors: Siddharth Bhadra-Lobo and Georgy Derevyanko and Guillaume Lamoureux
- Abstract要約: タンパク質の物理的相互作用を予測することは、計算生物学における基礎的な問題である。
学習に基づく新しいアルゴリズムのクラスが積極的に開発され、通常タンパク質複合体の構造についてエンドツーエンドに訓練されている。
そこで本研究では,対話ポーズタスクの解法とインタラクションタスクのファクト・オブ・アクションタスクによって,同じ基礎関数が学習可能であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting the physical interaction of proteins is a cornerstone problem in
computational biology. New classes of learning-based algorithms are actively
being developed, and are typically trained end-to-end on protein complex
structures extracted from the Protein Data Bank. These training datasets tend
to be large and difficult to use for prototyping and, unlike image or natural
language datasets, they are not easily interpretable by non-experts. We present
Dock2D-IP and Dock2D-IF, two "toy" datasets that can be used to select
algorithms predicting protein-protein interactions$\unicode{x2014}$or any other
type of molecular interactions. Using two-dimensional shapes as input, each
example from Dock2D-IP ("interaction pose") describes the interaction pose of
two shapes known to interact and each example from Dock2D-IF ("interaction
fact") describes whether two shapes form a stable complex or not. We propose a
number of baseline solutions to the problem and show that the same underlying
energy function can be learned either by solving the interaction pose task
(formulated as an energy-minimization "docking" problem) or the
fact-of-interaction task (formulated as a binding free energy estimation
problem).
- Abstract(参考訳): タンパク質の物理的相互作用を予測することは、計算生物学における基礎的な問題である。
学習に基づく新しいアルゴリズムのクラスが積極的に開発され、タンパク質データバンクから抽出されたタンパク質複合体のエンドツーエンドで訓練されている。
これらのトレーニングデータセットは、プロトタイピングに使用するのが難しく、画像や自然言語のデータセットとは異なり、非専門家によって容易に解釈できない。
Dock2D-IPとDock2D-IFは2つの"toy"データセットで、タンパク質とタンパク質の相互作用を予測するアルゴリズムを選択できる。
dock2d-ip(interaction pose)のそれぞれの例では、相互作用が知られている2つの形状の相互作用ポーズと、dock2d-if(interaction fact)のそれぞれの例が、2つの形状が安定な複合体を形成するかどうかを示している。
本稿では,この問題に対する基礎的解法をいくつか提案し,相互作用ポーズ課題(エネルギー最小化「ドッキング問題」として定式化)や相互作用の事実(拘束自由エネルギー推定問題として定式化)を解いて,その基礎的エネルギー関数を学習できることを示す。
関連論文リスト
- DiffDock-PP: Rigid Protein-Protein Docking with Diffusion Models [47.73386438748902]
DiffDock-PPは拡散生成モデルであり、非有界タンパク質構造をそれらの有界配座に翻訳し回転させる。
中央値C-RMSDが4.85でDIPSの最先端性能を達成し,すべてのベースラインを上回りました。
論文 参考訳(メタデータ) (2023-04-08T02:10:44Z) - EquiPocket: an E(3)-Equivariant Geometric Graph Neural Network for Ligand Binding Site Prediction [49.674494450107005]
標的タンパク質の結合部位の予測は、薬物発見の基本的な役割を担っている。
既存のディープラーニング手法の多くは、タンパク質を原子をボクセルに空間的にクラスタリングすることで3D画像とみなしている。
本研究では,結合サイト予測のためのE3-equivariant Graph Neural Network(GNN)であるEquiPocketを提案する。
論文 参考訳(メタデータ) (2023-02-23T17:18:26Z) - Protein-Ligand Complex Generator & Drug Screening via Tiered Tensor
Transform [18.509174420141832]
薬物スクリーニングにおけるポーズおよび親和性評価のための多種多様なタンパク質-リガンド複合体コンホメーションを生成するアルゴリズムを開発した。
3T構造変換はシステム物理学から切り離され、他の計算科学領域で将来利用できるようになる。
論文 参考訳(メタデータ) (2023-01-03T07:33:20Z) - Independent SE(3)-Equivariant Models for End-to-End Rigid Protein
Docking [57.2037357017652]
我々は、剛体タンパク質ドッキング、すなわち、個々の非結合構造からタンパク質-タンパク質複合体の3次元構造を計算的に予測する。
本研究では, タンパク質の回転と翻訳を予測し, 1つのタンパク質をドッキング位置に置くために, ペアワイズ非独立なSE(3)-等変グラフマッチングネットワークを設計する。
我々のモデルはEquiDockと呼ばれ、結合ポケットを近似し、キーポイントマッチングとアライメントを用いてドッキングポーズを予測する。
論文 参考訳(メタデータ) (2021-11-15T18:46:37Z) - Structure-aware Interactive Graph Neural Networks for the Prediction of
Protein-Ligand Binding Affinity [52.67037774136973]
薬物発見はタンパク質-リガンド結合親和性の予測にしばしば依存する。
近年の進歩は、タンパク質-リガンド複合体の表現を学習することで、グラフニューラルネットワーク(GNN)をより良い親和性予測に応用する大きな可能性を示している。
ポーラインスパイアグラフアテンション層(PGAL)とペア・インタラクティブ・プール(PiPool)の2つのコンポーネントから構成される構造対応型インタラクティブグラフニューラルネットワーク(SIGN)を提案する。
論文 参考訳(メタデータ) (2021-07-21T03:34:09Z) - NeuroMorph: Unsupervised Shape Interpolation and Correspondence in One
Go [109.88509362837475]
入力2つの3次元形状を考慮したニューラルネットワークアーキテクチャであるNeuroMorphを提案する。
NeuroMorphはそれらの間のスムーズかつポイントツーポイント対応を生成する。
異なる対象カテゴリの非等尺性ペアを含む、さまざまな入力形状に対してうまく機能する。
論文 参考訳(メタデータ) (2021-06-17T12:25:44Z) - Intrinsic-Extrinsic Convolution and Pooling for Learning on 3D Protein
Structures [18.961218808251076]
大規模タンパク質データの深部3次元解析を可能にする2つの新しい学習操作を提案する。
まず、内在的(タンパク質の折り畳みの下での不変)と外因的(結合下での不変)の両方を考慮する新しい畳み込み演算子を導入する。
第2に、階層的なプーリング演算子を導入し、タンパク質がアミノ酸の有限組の再結合であるという事実を活用することにより、マルチスケールのタンパク質分析を可能にする。
論文 参考訳(メタデータ) (2020-07-13T09:02:40Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z) - Energy-based Graph Convolutional Networks for Scoring Protein Docking
Models [19.09624358779376]
タンパク質ドッキングにおける2つの問題は、それぞれ相対的および絶対的なスコアと見なされ、物理に着想を得た1つのディープラーニングフレームワークで対処される。
グラフデータから直接、一般化された相互作用エネルギーを学習できるように、エッジ機能を介してノードの機能をプールする新しいグラフ畳み込みカーネルを提案する。
得られたエネルギーベースのグラフ畳み込みネットワーク(EGCN)は、多面的な注意を払って、分子内および分子間エネルギー、結合親和性、および遭遇複合体の品質測定(界面RMSD)を予測するために訓練される。
論文 参考訳(メタデータ) (2019-12-28T15:57:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。