論文の概要: SidechainNet: An All-Atom Protein Structure Dataset for Machine Learning
- arxiv url: http://arxiv.org/abs/2010.08162v2
- Date: Sun, 15 Nov 2020 07:42:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 21:59:34.417555
- Title: SidechainNet: An All-Atom Protein Structure Dataset for Machine Learning
- Title(参考訳): SidechainNet: 機械学習のための全原子タンパク質構造データセット
- Authors: Jonathan E. King, David Ryan Koes
- Abstract要約: 私たちは、ProtectNetデータセットを直接拡張する新しいデータセットであるSidechainNetを紹介します。
SidechainNetは、各タンパク質構造の全ての重原子を記述することができる角度と原子座標情報を含んでいる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite recent advancements in deep learning methods for protein structure
prediction and representation, little focus has been directed at the
simultaneous inclusion and prediction of protein backbone and sidechain
structure information. We present SidechainNet, a new dataset that directly
extends the ProteinNet dataset. SidechainNet includes angle and atomic
coordinate information capable of describing all heavy atoms of each protein
structure. In this paper, we provide background information on the availability
of protein structure data and the significance of ProteinNet. Thereafter, we
argue for the potentially beneficial inclusion of sidechain information through
SidechainNet, describe the process by which we organize SidechainNet, and
provide a software package (https://github.com/jonathanking/sidechainnet) for
data manipulation and training with machine learning models.
- Abstract(参考訳): タンパク質構造の予測と表現のためのディープラーニング手法の最近の進歩にもかかわらず、タンパク質バックボーンと側鎖構造情報の同時包含と予測にはほとんど焦点が当てられていない。
我々は、proteinnetデータセットを直接拡張する新しいデータセットであるsidechainnetを提案する。
sidechainnetには、各タンパク質構造のすべての重原子を記述できる角度と原子座標情報が含まれている。
本稿では,タンパク質構造データの可用性とタンパク質ネットの意義に関する背景情報を提供する。
その後、sidechainnetを通じたサイドチェーン情報の潜在的に有益な包含を主張し、sidechainnetを組織するプロセスを説明し、機械学習モデルによるデータ操作とトレーニングのためのソフトウェアパッケージ(https://github.com/jonathanking/sidechainnet)を提供する。
関連論文リスト
- DeepProtein: Deep Learning Library and Benchmark for Protein Sequence Learning [14.480621697121565]
DeepProteinは、タンパク質関連のタスクに特化した、包括的でユーザフレンドリーなディープラーニングライブラリである。
これには、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)、トランスフォーマー、グラフニューラルネットワーク(GNN)、グラフトランスフォーマー(GT)が含まれる。
ユーザフレンドリなインターフェースを提供し、ドメイン研究者がタンパク質データにディープラーニング技術を適用するのを容易にする。
論文 参考訳(メタデータ) (2024-10-02T20:42:32Z) - FoldToken2: Learning compact, invariant and generative protein structure language [48.1647245005672]
我々はFoldToken2を提案し、元の構造の復元性を維持しつつ、同変構造を離散トークンに変換する。
タンパク質構造再構築タスクにおいてFoldToken2を評価し,従来のFoldToken1よりもTMScoreで20%,RMSDで81%優れていた。
我々はFoldToken2が、タンパク質構造表現学習、構造アライメント、構造生成タスクのさらなる改善をもたらすと考えている。
論文 参考訳(メタデータ) (2024-06-11T09:24:51Z) - Clustering for Protein Representation Learning [72.72957540484664]
本稿では,タンパク質の臨界成分を自動的に検出するニューラルネットワーククラスタリングフレームワークを提案する。
我々のフレームワークはタンパク質をグラフとして扱い、各ノードはアミノ酸を表し、各エッジはアミノ酸間の空間的またはシーケンシャルな接続を表す。
タンパク質の折り畳み分類, 酵素反応分類, 遺伝子期予測, 酵素コミッショニング数予測の4つの課題について検討した。
論文 参考訳(メタデータ) (2024-03-30T05:51:09Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - H-Packer: Holographic Rotationally Equivariant Convolutional Neural
Network for Protein Side-Chain Packing [0.0]
タンパク質側鎖パッキングは構造モデリングの重要なサブタスクである。
2つの軽量回転同変ニューラルネットワーク上に構築されたサイドチェーンパッキングのための新しい2段階アルゴリズムを提案する。
CASP13とCASP14の目標に対して,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-11-15T19:12:47Z) - Target-aware Variational Auto-encoders for Ligand Generation with
Multimodal Protein Representation Learning [2.01243755755303]
ターゲット認識型自動エンコーダであるTargetVAEを導入し、任意のタンパク質標的に対する高い結合親和性で生成する。
これは、タンパク質の異なる表現を単一のモデルに統一する最初の試みであり、これは我々がタンパク質マルチモーダルネットワーク(PMN)と呼ぶ。
論文 参考訳(メタデータ) (2023-08-02T12:08:17Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。