Fugu-MT 論文翻訳(概要): SidechainNet: An All-Atom Protein Structure Dataset for Machine Learning

論文の概要: SidechainNet: An All-Atom Protein Structure Dataset for Machine Learning

arxiv url: http://arxiv.org/abs/2010.08162v2
Date: Sun, 15 Nov 2020 07:42:27 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-06 21:59:34.417555
Title: SidechainNet: An All-Atom Protein Structure Dataset for Machine Learning
Title（参考訳）: SidechainNet: 機械学習のための全原子タンパク質構造データセット
Authors: Jonathan E. King, David Ryan Koes
Abstract要約: 私たちは、ProtectNetデータセットを直接拡張する新しいデータセットであるSidechainNetを紹介します。 SidechainNetは、各タンパク質構造の全ての重原子を記述することができる角度と原子座標情報を含んでいる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Despite recent advancements in deep learning methods for protein structure prediction and representation, little focus has been directed at the simultaneous inclusion and prediction of protein backbone and sidechain structure information. We present SidechainNet, a new dataset that directly extends the ProteinNet dataset. SidechainNet includes angle and atomic coordinate information capable of describing all heavy atoms of each protein structure. In this paper, we provide background information on the availability of protein structure data and the significance of ProteinNet. Thereafter, we argue for the potentially beneficial inclusion of sidechain information through SidechainNet, describe the process by which we organize SidechainNet, and provide a software package (https://github.com/jonathanking/sidechainnet) for data manipulation and training with machine learning models.
Abstract（参考訳）: タンパク質構造の予測と表現のためのディープラーニング手法の最近の進歩にもかかわらず、タンパク質バックボーンと側鎖構造情報の同時包含と予測にはほとんど焦点が当てられていない。我々は、proteinnetデータセットを直接拡張する新しいデータセットであるsidechainnetを提案する。 sidechainnetには、各タンパク質構造のすべての重原子を記述できる角度と原子座標情報が含まれている。本稿では,タンパク質構造データの可用性とタンパク質ネットの意義に関する背景情報を提供する。その後、sidechainnetを通じたサイドチェーン情報の潜在的に有益な包含を主張し、sidechainnetを組織するプロセスを説明し、機械学習モデルによるデータ操作とトレーニングのためのソフトウェアパッケージ(https://github.com/jonathanking/sidechainnet)を提供する。

関連論文リスト

An All-Atom Generative Model for Designing Protein Complexes [49.09672038729524]
APM(All-Atom Protein Generative Model)は、マルチチェーンタンパク質をモデル化するためのモデルである。原子レベルの情報を統合し、多鎖タンパク質のデータを活用することで、APMは鎖間相互作用を正確にモデル化し、結合能力を持つタンパク質複合体をゼロから設計することができる。
論文参考訳（メタデータ） (2025-04-17T16:37:41Z)
Protein Large Language Models: A Comprehensive Survey [71.65899614084853]
タンパク質特異的な大規模言語モデル(Protein LLMs)は、より効率的なタンパク質構造予測、機能アノテーション、設計を可能にすることで、タンパク質科学に革命をもたらしている。この作業は、アーキテクチャ、データセットのトレーニング、評価メトリクス、さまざまなアプリケーションをカバーする、Protein LLMの最初の包括的な概要を提供する。
論文参考訳（メタデータ） (2025-02-21T19:22:10Z)
DeepProtein: Deep Learning Library and Benchmark for Protein Sequence Learning [14.480621697121565]
DeepProteinは、タンパク質関連のタスクに特化した、包括的でユーザフレンドリーなディープラーニングライブラリである。これには、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)、トランスフォーマー、グラフニューラルネットワーク(GNN)、グラフトランスフォーマー(GT)が含まれる。ユーザフレンドリなインターフェースを提供し、ドメイン研究者がタンパク質データにディープラーニング技術を適用するのを容易にする。
論文参考訳（メタデータ） (2024-10-02T20:42:32Z)
FoldToken2: Learning compact, invariant and generative protein structure language [48.1647245005672]
我々はFoldToken2を提案し、元の構造の復元性を維持しつつ、同変構造を離散トークンに変換する。タンパク質構造再構築タスクにおいてFoldToken2を評価し,従来のFoldToken1よりもTMScoreで20%,RMSDで81%優れていた。我々はFoldToken2が、タンパク質構造表現学習、構造アライメント、構造生成タスクのさらなる改善をもたらすと考えている。
論文参考訳（メタデータ） (2024-06-11T09:24:51Z)
Clustering for Protein Representation Learning [72.72957540484664]
本稿では,タンパク質の臨界成分を自動的に検出するニューラルネットワーククラスタリングフレームワークを提案する。我々のフレームワークはタンパク質をグラフとして扱い、各ノードはアミノ酸を表し、各エッジはアミノ酸間の空間的またはシーケンシャルな接続を表す。タンパク質の折り畳み分類, 酵素反応分類, 遺伝子期予測, 酵素コミッショニング数予測の4つの課題について検討した。
論文参考訳（メタデータ） (2024-03-30T05:51:09Z)
ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。 PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。 PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文参考訳（メタデータ） (2024-03-30T05:32:42Z)
NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文参考訳（メタデータ） (2024-03-21T13:27:57Z)
H-Packer: Holographic Rotationally Equivariant Convolutional Neural Network for Protein Side-Chain Packing [0.0]
タンパク質側鎖パッキングは構造モデリングの重要なサブタスクである。 2つの軽量回転同変ニューラルネットワーク上に構築されたサイドチェーンパッキングのための新しい2段階アルゴリズムを提案する。 CASP13とCASP14の目標に対して,本手法の評価を行った。
論文参考訳（メタデータ） (2023-11-15T19:12:47Z)
Target-aware Variational Auto-encoders for Ligand Generation with Multimodal Protein Representation Learning [2.01243755755303]
ターゲット認識型自動エンコーダであるTargetVAEを導入し、任意のタンパク質標的に対する高い結合親和性で生成する。これは、タンパク質の異なる表現を単一のモデルに統一する最初の試みであり、これは我々がタンパク質マルチモーダルネットワーク(PMN)と呼ぶ。
論文参考訳（メタデータ） (2023-08-02T12:08:17Z)
Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文参考訳（メタデータ） (2022-04-06T02:18:41Z)
Binary classification of proteins by a Machine Learning approach [0.0]
本稿では,タンパク質データバンクに含まれるタンパク質の記述に基づいてアミノ酸のタンパク質鎖を分類するシステムを提案する。それぞれのタンパク質は、XML形式でのファイルの化学・物理・幾何学的特性で完全に記述されている。この研究の目的は、大量のデータの収集と管理のためのディープラーニング機械を設計し、そのアミノ酸配列の分類への応用を通じてそれを検証することである。
論文参考訳（メタデータ） (2021-11-03T01:58:16Z)
A Privacy-Preserving Distributed Architecture for Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文参考訳（メタデータ） (2020-03-30T15:12:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。