論文の概要: PDFBench: A Benchmark for De novo Protein Design from Function
- arxiv url: http://arxiv.org/abs/2505.20346v1
- Date: Sun, 25 May 2025 05:40:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.191941
- Title: PDFBench: A Benchmark for De novo Protein Design from Function
- Title(参考訳): PDFBench: 関数からのDenovoタンパク質設計のためのベンチマーク
- Authors: Jiahao Kuang, Nuowei Liu, Changzhi Sun, Tao Ji, Yuanbin Wu,
- Abstract要約: 関数からde novoタンパク質の設計を評価するための、最初の総合的なベンチマークであるPDFBenchを紹介する。
公平かつ多面的な評価を確保するため,22のメトリクスをコンパイルし,配列の妥当性,構造的忠実度,言語タンパク質のアライメントについて検討した。
我々は5つの最先端のベースラインを評価し、タスク間のそれぞれの長所と短所を明らかにした。
- 参考スコア(独自算出の注目度): 18.60597670849231
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, while natural language processing and multimodal learning have seen rapid advancements, the field of de novo protein design has also experienced significant growth. However, most current methods rely on proprietary datasets and evaluation rubrics, making fair comparisons between different approaches challenging. Moreover, these methods often employ evaluation metrics that capture only a subset of the desired properties of designed proteins, lacking a comprehensive assessment framework. To address these, we introduce PDFBench, the first comprehensive benchmark for evaluating de novo protein design from function. PDFBench supports two tasks: description-guided design and keyword-guided design. To ensure fair and multifaceted evaluation, we compile 22 metrics covering sequence plausibility, structural fidelity, and language-protein alignment, along with measures of novelty and diversity. We evaluate five state-of-the-art baselines, revealing their respective strengths and weaknesses across tasks. Finally, we analyze inter-metric correlations, exploring the relationships between four categories of metrics, and offering guidelines for metric selection. PDFBench establishes a unified framework to drive future advances in function-driven de novo protein design.
- Abstract(参考訳): 近年、自然言語処理やマルチモーダル学習が急速に進歩してきたが、デノボタンパク質の設計分野も著しい成長を遂げている。
しかし、現在のほとんどの手法はプロプライエタリなデータセットと評価ルーブリックに依存しており、異なるアプローチの公正な比較は困難である。
さらに、これらの手法は、設計されたタンパク質の望ましい性質のサブセットのみをキャプチャする評価指標を用いており、包括的な評価フレームワークが欠如している。
これらの問題に対処するため,関数からde novoタンパク質の設計を評価するための最初の総合的なベンチマークであるPDFBenchを紹介した。
PDFBenchは、説明誘導設計とキーワード誘導設計の2つのタスクをサポートしている。
公平かつ多面的な評価を確実にするために,22のメトリクスを,新規性と多様性の尺度とともに,シーケンスの妥当性,構造的忠実度,言語タンパク質のアライメントを網羅する。
我々は5つの最先端のベースラインを評価し、タスク間のそれぞれの長所と短所を明らかにした。
最後に、メトリクス間の相関を分析し、メトリクスの4つのカテゴリ間の関係を探索し、メトリクス選択のためのガイドラインを提供する。
PDFBenchは機能駆動型denovoタンパク質設計の今後の進歩を促進する統一フレームワークを確立している。
関連論文リスト
- Protein Structure Tokenization: Benchmarking and New Recipe [16.842453216446987]
我々はStructTokenBenchを紹介した。StructTokenBenchは、構造トークンの質と効率を包括的に評価するフレームワークである。
また、コードブック更新を強化し、コードブックのサイズと寸法を最適にバランスさせ、トークン化ツールの利用と品質を改善する戦略であるAminoAseedを開発します。
論文 参考訳(メタデータ) (2025-02-28T15:14:33Z) - ProteinBench: A Holistic Evaluation of Protein Foundation Models [53.59325047872512]
本稿では,タンパク質基盤モデルのための総合評価フレームワークであるProteinBenchを紹介する。
本研究のアプローチは, タンパク質ドメインにおける課題を包括的に包括するタスクの分類学的分類, (ii) 品質, 新規性, 多様性, 堅牢性, および (iii) 様々なユーザ目標から詳細な分析を行い, モデルパフォーマンスの全体的視点を提供する,4つの重要な側面にわたるパフォーマンスを評価するマルチメトリック評価アプローチからなる。
論文 参考訳(メタデータ) (2024-09-10T06:52:33Z) - NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - Progressive Multi-Modality Learning for Inverse Protein Folding [47.095862120116976]
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。
実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - PDB-Struct: A Comprehensive Benchmark for Structure-based Protein Design [19.324059406159325]
我々は、リフォールダビリティベースのメトリクスと安定性ベースのメトリクスの2つの新しい指標を紹介した。
ByProt、ProteinMPNN、ESM-IFはベンチマークで非常によく機能しますが、ESM-DesignとAF-Designは不足しています。
提案するベンチマークは,タンパク質設計手法の公平かつ包括的な評価方法である。
論文 参考訳(メタデータ) (2023-11-30T02:37:55Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。