Fugu-MT 論文翻訳(概要): PDB-Struct: A Comprehensive Benchmark for Structure-based Protein Design

論文の概要: PDB-Struct: A Comprehensive Benchmark for Structure-based Protein Design

arxiv url: http://arxiv.org/abs/2312.00080v1
Date: Thu, 30 Nov 2023 02:37:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-04 17:13:38.184220
Title: PDB-Struct: A Comprehensive Benchmark for Structure-based Protein Design
Title（参考訳）: PDB-Struct:構造ベースタンパク質設計のための総合ベンチマーク
Authors: Chuanrui Wang, Bozitao Zhong, Zuobai Zhang, Narendra Chaudhary, Sanchit Misra, Jian Tang
Abstract要約: 我々は、リフォールダビリティベースのメトリクスと安定性ベースのメトリクスの2つの新しい指標を紹介した。 ByProt、ProteinMPNN、ESM-IFはベンチマークで非常によく機能しますが、ESM-DesignとAF-Designは不足しています。提案するベンチマークは,タンパク質設計手法の公平かつ包括的な評価方法である。
参考スコア（独自算出の注目度）: 19.324059406159325
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Structure-based protein design has attracted increasing interest, with numerous methods being introduced in recent years. However, a universally accepted method for evaluation has not been established, since the wet-lab validation can be overly time-consuming for the development of new algorithms, and the $\textit{in silico}$ validation with recovery and perplexity metrics is efficient but may not precisely reflect true foldability. To address this gap, we introduce two novel metrics: refoldability-based metric, which leverages high-accuracy protein structure prediction models as a proxy for wet lab experiments, and stability-based metric, which assesses whether models can assign high likelihoods to experimentally stable proteins. We curate datasets from high-quality CATH protein data, high-throughput $\textit{de novo}$ designed proteins, and mega-scale experimental mutagenesis experiments, and in doing so, present the $\textbf{PDB-Struct}$ benchmark that evaluates both recent and previously uncompared protein design methods. Experimental results indicate that ByProt, ProteinMPNN, and ESM-IF perform exceptionally well on our benchmark, while ESM-Design and AF-Design fall short on the refoldability metric. We also show that while some methods exhibit high sequence recovery, they do not perform as well on our new benchmark. Our proposed benchmark paves the way for a fair and comprehensive evaluation of protein design methods in the future. Code is available at https://github.com/WANG-CR/PDB-Struct.
Abstract（参考訳）: 構造に基づくタンパク質の設計が注目され、近年多くの方法が導入されている。しかし、新しいアルゴリズムの開発にはウェット・ラブ・バリデーションが過度に時間がかかるため、広く受け入れられている評価方法は確立されておらず、$\textit{in silico}$ validation with recovery and perplexity metricsは効率的であるが、真の折りたたみ可能性を正確に反映するものではない。このギャップに対処するために,実験室実験のプロキシとして高精度なタンパク質構造予測モデルを利用するリフォールダビリティ・ベース・メトリックと,実験安定タンパク質に高い確率を付与できるかどうかを評価する安定性・ベース・メトリックの2つの新しい指標を導入する。高品質のCATHタンパク質データ、高スループットの$\textit{de novo}$設計タンパク質、および大規模実験変異原性実験からデータセットをキュレートし、その際、最近のタンパク質設計法および未コンパイルタンパク質設計法の両方を評価する$\textbf{PDB-Struct}$ベンチマークを提示する。実験の結果,ByProt,ProteinMPNN,ESM-IFはベンチマークで非常に良好に機能し,ESM-DesignとAF-Designは再現性測定値に劣っていることがわかった。また、いくつかの手法は高いシーケンシャル回復を示すが、新しいベンチマークでは性能が良くないことを示す。提案するベンチマークは将来,タンパク質設計手法の公平かつ包括的評価の道を開くものである。コードはhttps://github.com/WANG-CR/PDB-Struct.comから入手できる。

関連論文リスト

Protein-SE(3): Benchmarking SE(3)-based Generative Models for Protein Structure Design [35.87227562237066]
SE(3)に基づく生成モデルは、タンパク質の幾何学的モデリングと効率的な構造設計において非常に有望である。統合トレーニングフレームワークに基づく新しいベンチマークであるProtein-SE(3)は、タンパク質の足場タスク、統合生成モデル、高レベルの数学的抽象化、多様な評価指標で構成されている。
論文参考訳（メタデータ） (2025-07-27T11:53:05Z)
DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。 DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文参考訳（メタデータ） (2025-06-18T23:58:22Z)
AlphaFold Database Debiasing for Robust Inverse Folding [58.792020809180336]
Debiasing Structure AutoEncoder (DeSAE)を導入し、故意に破損したバックボーンジオメトリからネイティブライクなコンフォーメーションを再構築することを学ぶ。推測において、DeSAEをAFDB構造に適用すると、逆折り畳み性能を著しく向上する偏りのある構造が生成される。
論文参考訳（メタデータ） (2025-06-10T02:25:31Z)
Protein Structure Tokenization: Benchmarking and New Recipe [16.842453216446987]
我々はStructTokenBenchを紹介した。StructTokenBenchは、構造トークンの質と効率を包括的に評価するフレームワークである。また、コードブック更新を強化し、コードブックのサイズと寸法を最適にバランスさせ、トークン化ツールの利用と品質を改善する戦略であるAminoAseedを開発します。
論文参考訳（メタデータ） (2025-02-28T15:14:33Z)
Hashing for Protein Structure Similarity Search [19.352125515561287]
タンパク質構造類似性探索(PSSS)の新しい手法を提案する。 Underlinetextp$runderlinetexto$tein $underlinetexts$tructure $underlinetexth$ashing (POSH) for PSSS。 POSHは各タンパク質構造に対するバイナリベクトル表現を学習し、PSSSの時間とメモリコストを劇的に削減することができる。
論文参考訳（メタデータ） (2024-11-13T02:02:52Z)
CPE-Pro: A Structure-Sensitive Deep Learning Method for Protein Representation and Origin Evaluation [7.161099050722313]
タンパク質構造評価用結晶対予測学習モデル(CPE-Pro)を開発した。 CPE-Proはタンパク質の構造情報を学習し、構造間の差異を捉え、4つのデータクラスの正確なトレーサビリティを実現する。我々は Foldseek を用いてタンパク質構造を「構造配列」にエンコードし、タンパク質構造配列言語モデル SSLM を訓練した。
論文参考訳（メタデータ） (2024-10-21T02:21:56Z)
ProteinBench: A Holistic Evaluation of Protein Foundation Models [53.59325047872512]
本稿では,タンパク質基盤モデルのための総合評価フレームワークであるProteinBenchを紹介する。本研究のアプローチは, タンパク質ドメインにおける課題を包括的に包括するタスクの分類学的分類, (ii) 品質, 新規性, 多様性, 堅牢性, および (iii) 様々なユーザ目標から詳細な分析を行い, モデルパフォーマンスの全体的視点を提供する,4つの重要な側面にわたるパフォーマンスを評価するマルチメトリック評価アプローチからなる。
論文参考訳（メタデータ） (2024-09-10T06:52:33Z)
NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。 DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文参考訳（メタデータ） (2024-06-16T08:23:21Z)
Endowing Protein Language Models with Structural Knowledge [5.587293092389789]
本稿では,タンパク質構造データを統合することにより,タンパク質言語モデルを強化する新しいフレームワークを提案する。 PST(Protein Structure Transformer)と呼ばれる精製モデルは、小さなタンパク質構造データベース上でさらに事前訓練されている。 PSTは、タンパク質配列の最先端基盤モデルであるESM-2を一貫して上回り、タンパク質機能予測の新しいベンチマークを設定している。
論文参考訳（メタデータ） (2024-01-26T12:47:54Z)
Protein 3D Graph Structure Learning for Robust Structure-based Protein Property Prediction [43.46012602267272]
タンパク質の構造に基づく特性予測は、様々な生物学的タスクにおいて有望なアプローチとして現れてきた。現在のプラクティスは、推論中に正確に予測された構造を用いるだけで、予測精度の顕著な低下に悩まされている。本フレームワークはモデルに依存しず,予測構造と実験構造の両方の特性予測の改善に有効である。
論文参考訳（メタデータ） (2023-10-14T08:43:42Z)
Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。 pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文参考訳（メタデータ） (2023-02-03T10:49:52Z)
State-specific protein-ligand complex structure prediction with a multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文参考訳（メタデータ） (2022-09-30T01:46:38Z)
PDBench: Evaluating Computational Methods for Protein Sequence Design [2.0187324832551385]
本稿では, タンパク質のベンチマークを行い, 深層学習法の性能評価試験を提案する。我々の堅牢なベンチマークは、その性能と実用性を評価するのに欠かせない設計手法の振る舞いに関する生物学的知見を提供する。
論文参考訳（メタデータ） (2021-09-16T12:20:03Z)
EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。 EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文参考訳（メタデータ） (2021-05-11T03:40:29Z)
Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文参考訳（メタデータ） (2020-08-11T15:01:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。