論文の概要: SidechainNet: An All-Atom Protein Structure Dataset for Machine Learning
- arxiv url: http://arxiv.org/abs/2010.08162v2
- Date: Sun, 15 Nov 2020 07:42:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 21:59:34.417555
- Title: SidechainNet: An All-Atom Protein Structure Dataset for Machine Learning
- Title(参考訳): SidechainNet: 機械学習のための全原子タンパク質構造データセット
- Authors: Jonathan E. King, David Ryan Koes
- Abstract要約: 私たちは、ProtectNetデータセットを直接拡張する新しいデータセットであるSidechainNetを紹介します。
SidechainNetは、各タンパク質構造の全ての重原子を記述することができる角度と原子座標情報を含んでいる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite recent advancements in deep learning methods for protein structure
prediction and representation, little focus has been directed at the
simultaneous inclusion and prediction of protein backbone and sidechain
structure information. We present SidechainNet, a new dataset that directly
extends the ProteinNet dataset. SidechainNet includes angle and atomic
coordinate information capable of describing all heavy atoms of each protein
structure. In this paper, we provide background information on the availability
of protein structure data and the significance of ProteinNet. Thereafter, we
argue for the potentially beneficial inclusion of sidechain information through
SidechainNet, describe the process by which we organize SidechainNet, and
provide a software package (https://github.com/jonathanking/sidechainnet) for
data manipulation and training with machine learning models.
- Abstract(参考訳): タンパク質構造の予測と表現のためのディープラーニング手法の最近の進歩にもかかわらず、タンパク質バックボーンと側鎖構造情報の同時包含と予測にはほとんど焦点が当てられていない。
我々は、proteinnetデータセットを直接拡張する新しいデータセットであるsidechainnetを提案する。
sidechainnetには、各タンパク質構造のすべての重原子を記述できる角度と原子座標情報が含まれている。
本稿では,タンパク質構造データの可用性とタンパク質ネットの意義に関する背景情報を提供する。
その後、sidechainnetを通じたサイドチェーン情報の潜在的に有益な包含を主張し、sidechainnetを組織するプロセスを説明し、機械学習モデルによるデータ操作とトレーニングのためのソフトウェアパッケージ(https://github.com/jonathanking/sidechainnet)を提供する。
関連論文リスト
- MMDesign: Multi-Modality Transfer Learning for Generative Protein Design [66.49989188722553]
タンパク質の設計は、対応するタンパク質のバックボーンに基づいてタンパク質配列を生成する。
深層生成モデルは、データから直接タンパク質設計を学ぶことを約束している。
パブリックな構造系列ペアリングの欠如は、一般化能力を制限している。
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - H-Packer: Holographic Rotationally Equivariant Convolutional Neural
Network for Protein Side-Chain Packing [0.0]
タンパク質側鎖パッキングは構造モデリングの重要なサブタスクである。
2つの軽量回転同変ニューラルネットワーク上に構築されたサイドチェーンパッキングのための新しい2段階アルゴリズムを提案する。
CASP13とCASP14の目標に対して,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-11-15T19:12:47Z) - Target-aware Variational Auto-encoders for Ligand Generation with
Multimodal Protein Representation Learning [2.01243755755303]
ターゲット認識型自動エンコーダであるTargetVAEを導入し、任意のタンパク質標的に対する高い結合親和性で生成する。
これは、タンパク質の異なる表現を単一のモデルに統一する最初の試みであり、これは我々がタンパク質マルチモーダルネットワーク(PMN)と呼ぶ。
論文 参考訳(メタデータ) (2023-08-02T12:08:17Z) - Neural Attentive Circuits [93.95502541529115]
我々は、NAC(Neural Attentive Circuits)と呼ばれる汎用的でモジュラーなニューラルアーキテクチャを導入する。
NACは、ドメイン知識を使わずに、ニューラルネットワークモジュールのパラメータ化と疎結合を学習する。
NACは推論時に8倍のスピードアップを達成するが、性能は3%以下である。
論文 参考訳(メタデータ) (2022-10-14T18:00:07Z) - HelixFold-Single: MSA-free Protein Structure Prediction by Using Protein
Language Model as an Alternative [61.984700682903096]
HelixFold-Singleは、大規模なタンパク質言語モデルとAlphaFold2の優れた幾何学的学習能力を組み合わせるために提案されている。
提案手法は,数千万の一次配列を持つ大規模タンパク質言語モデルを事前学習する。
我々は、一次系列のみから原子の3次元座標を予測するために、エンドツーエンドの微分可能なモデルを得る。
論文 参考訳(メタデータ) (2022-07-28T07:30:33Z) - Learning Protein Representations via Complete 3D Graph Networks [34.37014978178466]
3次元構造を持つタンパク質の表現学習について検討する。
タンパク質構造に基づく3Dグラフを構築し,その表現を学習するグラフネットワークを開発する。
論文 参考訳(メタデータ) (2022-07-26T01:55:25Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - Binary classification of proteins by a Machine Learning approach [0.0]
本稿では,タンパク質データバンクに含まれるタンパク質の記述に基づいてアミノ酸のタンパク質鎖を分類するシステムを提案する。
それぞれのタンパク質は、XML形式でのファイルの化学・物理・幾何学的特性で完全に記述されている。
この研究の目的は、大量のデータの収集と管理のためのディープラーニング機械を設計し、そのアミノ酸配列の分類への応用を通じてそれを検証することである。
論文 参考訳(メタデータ) (2021-11-03T01:58:16Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z) - A Theory of Usable Information Under Computational Constraints [103.5901638681034]
本稿では,複雑なシステムにおける情報推論のための新しいフレームワークを提案する。
我々の基礎はシャノンの情報理論の変分拡張に基づいている。
計算制約を組み込むことで,データから$mathcalV$-informationを確実に推定できることを示す。
論文 参考訳(メタデータ) (2020-02-25T06:09:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。