論文の概要: PFMBench: Protein Foundation Model Benchmark
- arxiv url: http://arxiv.org/abs/2506.14796v1
- Date: Sun, 01 Jun 2025 07:40:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.683462
- Title: PFMBench: Protein Foundation Model Benchmark
- Title(参考訳): PFMBench: タンパク質基盤モデルベンチマーク
- Authors: Zhangyang Gao, Hao Wang, Cheng Tan, Chenrui Xu, Mengdi Liu, Bozhen Hu, Linlin Chao, Xiaoming Zhang, Stan Z. Li,
- Abstract要約: PFMBenchは、タンパク質科学の8つの重要な領域にまたがる38のタスクにわたるタンパク質基盤モデルを評価するベンチマークである。
タスク間の固有の相関を明らかにし、トップパフォーマンスモデルを特定し、合理化された評価プロトコルを提供する。
- 参考スコア(独自算出の注目度): 42.418536890859635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study investigates the current landscape and future directions of protein foundation model research. While recent advancements have transformed protein science and engineering, the field lacks a comprehensive benchmark for fair evaluation and in-depth understanding. Since ESM-1B, numerous protein foundation models have emerged, each with unique datasets and methodologies. However, evaluations often focus on limited tasks tailored to specific models, hindering insights into broader generalization and limitations. Specifically, researchers struggle to understand the relationships between tasks, assess how well current models perform across them, and determine the criteria in developing new foundation models. To fill this gap, we present PFMBench, a comprehensive benchmark evaluating protein foundation models across 38 tasks spanning 8 key areas of protein science. Through hundreds of experiments on 17 state-of-the-art models across 38 tasks, PFMBench reveals the inherent correlations between tasks, identifies top-performing models, and provides a streamlined evaluation protocol. Code is available at \href{https://github.com/biomap-research/PFMBench}{\textcolor{blue}{GitHub}}.
- Abstract(参考訳): 本研究では,タンパク質基盤モデル研究の現状と今後の方向性について検討する。
近年の進歩はタンパク質科学と工学に変化をもたらしたが、公正な評価と深い理解のための包括的なベンチマークは欠如している。
ESM-1B以降、多くのタンパク質基盤モデルが登場し、それぞれに独自のデータセットと方法論がある。
しかしながら、評価はしばしば特定のモデルに適した限定されたタスクに焦点を当て、より広範な一般化と制限に対する洞察を妨げる。
具体的には、研究者はタスク間の関係を理解し、現在のモデルがどのように機能するかを評価し、新しい基礎モデルを開発する際の基準を決定するのに苦労する。
このギャップを埋めるために、PFMBenchは、タンパク質科学の8つの重要な領域にまたがる38のタスクにわたるタンパク質基盤モデルを評価する包括的なベンチマークである。
38タスクにわたる17の最先端モデルに関する数百の実験を通じて、PFMBenchはタスク間の固有の相関を明らかにし、トップパフォーマンスモデルを特定し、合理化された評価プロトコルを提供する。
コードは \href{https://github.com/biomap-research/PFMBench}{\textcolor{blue}{GitHub}} で公開されている。
関連論文リスト
- VenusX: Unlocking Fine-Grained Functional Understanding of Proteins [3.9151216020893544]
VenusXは、微細な機能アノテーションと関数ベースのタンパク質ペアリングのための、残基、フラグメント、ドメインレベルでの最初の大規模なベンチマークである。
VenusXは、重要なアクティブサイト、バインディングサイト、保存されたサイトモチーフ、ドメイン、ペアワイズを含む3つの主要なタスクカテゴリで構成されている。
本ベンチマークでは,流通シナリオとアウト・オブ・ディストリビューションシナリオの両方において,モデル性能の総合評価を可能にする。
論文 参考訳(メタデータ) (2025-05-17T03:44:23Z) - Multi-Scale Representation Learning for Protein Fitness Prediction [31.735234482320283]
これまでの手法は主に、巨大でラベルなしのタンパク質配列や構造データセットに基づいて訓練された自己教師型モデルに依存してきた。
本稿では,タンパク質の機能を統合する新しいマルチモーダル表現学習フレームワークであるSequence-Structure-Surface Fitness (S3F)モデルを紹介する。
提案手法は,タンパク質言語モデルからの配列表現と,タンパク質のバックボーンと詳細な表面トポロジーをコードするGeometric Vector Perceptronネットワークを組み合わせる。
論文 参考訳(メタデータ) (2024-12-02T04:28:10Z) - ProteinBench: A Holistic Evaluation of Protein Foundation Models [53.59325047872512]
本稿では,タンパク質基盤モデルのための総合評価フレームワークであるProteinBenchを紹介する。
本研究のアプローチは, タンパク質ドメインにおける課題を包括的に包括するタスクの分類学的分類, (ii) 品質, 新規性, 多様性, 堅牢性, および (iii) 様々なユーザ目標から詳細な分析を行い, モデルパフォーマンスの全体的視点を提供する,4つの重要な側面にわたるパフォーマンスを評価するマルチメトリック評価アプローチからなる。
論文 参考訳(メタデータ) (2024-09-10T06:52:33Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - Unravelling the Architecture of Membrane Proteins with Conditional
Random Fields [11.321552104966326]
条件ランダム場 (CRF) は, 生物体に関するマイクロレベルの情報を数学的モデルに統合し, マクロレベルの振る舞いを理解するテンプレートを提供する。
ベンチマークデータセットと他の28の手法との比較では、CRFモデルが極めて正確な予測につながることが示されている。
論文 参考訳(メタデータ) (2020-08-06T05:57:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。