論文の概要: Intrinsic-Extrinsic Convolution and Pooling for Learning on 3D Protein
Structures
- arxiv url: http://arxiv.org/abs/2007.06252v2
- Date: Mon, 19 Apr 2021 17:27:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 23:30:48.396248
- Title: Intrinsic-Extrinsic Convolution and Pooling for Learning on 3D Protein
Structures
- Title(参考訳): 3dタンパク質構造学習のための内在的外部畳み込みとプール化
- Authors: Pedro Hermosilla, Marco Sch\"afer, Mat\v{e}j Lang, Gloria Fackelmann,
Pere Pau V\'azquez, Barbora Kozl\'ikov\'a, Michael Krone, Tobias Ritschel,
Timo Ropinski
- Abstract要約: 大規模タンパク質データの深部3次元解析を可能にする2つの新しい学習操作を提案する。
まず、内在的(タンパク質の折り畳みの下での不変)と外因的(結合下での不変)の両方を考慮する新しい畳み込み演算子を導入する。
第2に、階層的なプーリング演算子を導入し、タンパク質がアミノ酸の有限組の再結合であるという事実を活用することにより、マルチスケールのタンパク質分析を可能にする。
- 参考スコア(独自算出の注目度): 18.961218808251076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Proteins perform a large variety of functions in living organisms, thus
playing a key role in biology. As of now, available learning algorithms to
process protein data do not consider several particularities of such data
and/or do not scale well for large protein conformations. To fill this gap, we
propose two new learning operations enabling deep 3D analysis of large-scale
protein data. First, we introduce a novel convolution operator which considers
both, the intrinsic (invariant under protein folding) as well as extrinsic
(invariant under bonding) structure, by using $n$-D convolutions defined on
both the Euclidean distance, as well as multiple geodesic distances between
atoms in a multi-graph. Second, we enable a multi-scale protein analysis by
introducing hierarchical pooling operators, exploiting the fact that proteins
are a recombination of a finite set of amino acids, which can be pooled using
shared pooling matrices. Lastly, we evaluate the accuracy of our algorithms on
several large-scale data sets for common protein analysis tasks, where we
outperform state-of-the-art methods.
- Abstract(参考訳): タンパク質は生物において様々な機能を果たすため、生物学において重要な役割を果たす。
現在、タンパク質データを処理するための利用可能な学習アルゴリズムは、そのようなデータのいくつかの特異性を考慮せず、大きなタンパク質のコンフォメーションのためにスケールしない。
このギャップを埋めるために,大規模タンパク質データの深部3次元解析を可能にする2つの新しい学習操作を提案する。
まず、ユークリッド距離と多グラフ中の原子間の複数の測地線距離の両方で定義されるn$-d畳み込みを用いて、内在的(タンパク質折り畳み下で不変)構造と外在的(結合下で不変)構造の両方を考える新しい畳み込み演算子を導入する。
第2に,階層的プーリング演算子を導入することで,タンパク質が有限個のアミノ酸の組換えであり,共有プーリング行列を用いてプールできるという事実を生かして,マルチスケールなタンパク質解析を可能にする。
最後に,タンパク質解析タスクのための大規模データセットを用いて,アルゴリズムの精度を評価する。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - CrysFormer: Protein Structure Prediction via 3d Patterson Maps and
Partial Structure Attention [7.716601082662128]
タンパク質の3次元構造は、しばしば非自明な計算コストをもたらす。
本稿では,タンパク質結晶学と部分構造情報を直接利用するトランスフォーマーモデルを提案する。
提案手法はtextttCrysFormer と呼ばれ,より小さなデータセットサイズと計算コストの削減に基づいて精度の高い予測を行うことができる。
論文 参考訳(メタデータ) (2023-10-05T21:10:22Z) - Pairing interacting protein sequences using masked language modeling [0.3222802562733787]
配列アライメントに基づいて訓練されたタンパク質言語モデルを用いて相互作用するタンパク質配列をペア化する手法を開発した。
我々は、MSAトランスフォーマーが、周囲のコンテキストを用いて複数の配列アライメントでマスクされたアミノ酸を埋める能力を利用する。
単一チェーンデータでトレーニングされている間に、チェーン間の共進化をキャプチャできることが示されています。
論文 参考訳(メタデータ) (2023-08-14T13:42:09Z) - Prot2Text: Multimodal Protein's Function Generation with GNNs and Transformers [18.498779242323582]
本稿では,タンパク質の機能を自由テキスト形式で予測する新しいアプローチであるProt2Textを提案する。
エンコーダ・デコーダフレームワークでグラフニューラルネットワーク(GNN)とLarge Language Models(LLM)を組み合わせることにより,本モデルは多種多様なデータ型を効果的に統合する。
論文 参考訳(メタデータ) (2023-07-25T09:35:43Z) - Integration of Pre-trained Protein Language Models into Geometric Deep
Learning Networks [68.90692290665648]
我々は、タンパク質言語モデルから学んだ知識を、いくつかの最先端の幾何学的ネットワークに統合する。
以上の結果から,ベースラインを20%上回る総合的な改善が見られた。
強い証拠は、タンパク質言語モデルの知識を取り入れることで、幾何学的ネットワークの能力が著しく向上することを示している。
論文 参考訳(メタデータ) (2022-12-07T04:04:04Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Independent SE(3)-Equivariant Models for End-to-End Rigid Protein
Docking [57.2037357017652]
我々は、剛体タンパク質ドッキング、すなわち、個々の非結合構造からタンパク質-タンパク質複合体の3次元構造を計算的に予測する。
本研究では, タンパク質の回転と翻訳を予測し, 1つのタンパク質をドッキング位置に置くために, ペアワイズ非独立なSE(3)-等変グラフマッチングネットワークを設計する。
我々のモデルはEquiDockと呼ばれ、結合ポケットを近似し、キーポイントマッチングとアライメントを用いてドッキングポーズを予測する。
論文 参考訳(メタデータ) (2021-11-15T18:46:37Z) - Geometric Transformers for Protein Interface Contact Prediction [3.031630445636656]
本稿では、回転および翻訳不変タンパク質界面の接触予測のための新しい幾何学進化グラフ変換器Geometric Transformerを提案する。
DeepInteractは、2つのタンパク質の3D第三次構造を入力として、パートナー特異的なタンパク質界面接触を予測する。
論文 参考訳(メタデータ) (2021-10-06T00:12:15Z) - DIPS-Plus: The Enhanced Database of Interacting Protein Structures for
Interface Prediction [2.697420611471228]
DIPS-Plusはタンパク質界面の幾何学的深層学習のための42,112複合体の強化された機能豊富なデータセットである。
DIPSの以前のバージョンは、与えられたタンパク質複合体を構成する原子のカルテシアン座標とタイプのみを含む。
DIPS-Plusには、プロテクション指標、半球アミノ酸組成、および各アミノ酸に対する新しいプロファイル隠れマルコフモデル(HMM)ベースの配列機能を含む、新しい残基レベルの特徴が多数含まれている。
論文 参考訳(メタデータ) (2021-06-06T23:56:27Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。