論文の概要: PepBenchmark: A Standardized Benchmark for Peptide Machine Learning
- arxiv url: http://arxiv.org/abs/2604.10531v1
- Date: Sun, 12 Apr 2026 08:48:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.079211
- Title: PepBenchmark: A Standardized Benchmark for Peptide Machine Learning
- Title(参考訳): PepBenchmark: ペプチド機械学習のための標準化されたベンチマーク
- Authors: Jiahui Zhang, Rouyi Wang, Kuangqi Zhou, Tianshu Xiao, Lingyan Zhu, Yaosen Min, Yang Wang,
- Abstract要約: PepBenchmarkは、ペプチドドラッグ発見のためのAI対応ベンチマークのセットである。
PepBenchData、PepBenchPipeline、およびPepBenchLeaderboardが含まれる。
データとコードはhttps://github.com/ZGCI-AI4S-Pep/PepBenchmark/.comで公開されている。
- 参考スコア(独自算出の注目度): 17.34763927543385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Peptide therapeutics are widely regarded as the "third generation" of drugs, yet progress in peptide Machine Learning (ML) are hindered by the absence of standardized benchmarks. Here we present PepBenchmark, which unifies datasets, preprocessing, and evaluation protocols for peptide drug discovery. PepBenchmark comprises three components: (1) PepBenchData, a well-curated collection comprising 29 canonical-peptide and 6 non-canonical-peptide datasets across 7 groups, systematically covering key aspects of peptide drug development, representing, to the best of our knowledge, the most comprehensive AI-ready dataset resource to date; (2) PepBenchPipeline, a standardized preprocessing pipeline that ensures consistent dataset cleaning, construction, splitting, and feature transformation, mitigating quality issues common in ad hoc pipelines; and (3) PepBenchLeaderboard, a unified evaluation protocol and leaderboard with strong baselines across 4 major methodological families: Fingerprint-based, GNN-based, PLM-based, and SMILES-based models. Together, PepBenchmark provides the first standardized and comparable foundation for peptide drug discovery, facilitating methodological advances and translation into real-world applications. The data and code are publicly available at https://github.com/ZGCI-AI4S-Pep/PepBenchmark/.
- Abstract(参考訳): ペプチド治療は薬物の第3世代と見なされているが、ペプチド機械学習(ML)の進歩は標準化されたベンチマークの欠如によって妨げられている。
ここでは、ペプチド薬物発見のためのデータセット、前処理、評価プロトコルを統一するPepBenchmarkを紹介する。
PepBenchDataは、29のカノニカルペプチドと6の非カノニカルペプチドデータセットからなる、よく計算されたコレクションで、7つのグループにまたがって、ペプチドドラッグ開発の主要な側面を体系的にカバーし、私たちの知る限り、最も包括的なAI対応のデータセットリソースを表しています。
PepBenchmarkは、ペプチド薬物発見のための最初の標準化され同等の基盤を提供し、方法論的な進歩と現実世界の応用への翻訳を促進する。
データとコードはhttps://github.com/ZGCI-AI4S-Pep/PepBenchmark/.comで公開されている。
関連論文リスト
- WelQrate: Defining the Gold Standard in Small Molecule Drug Discovery Benchmarking [13.880278087741482]
深層学習はコンピュータ支援による薬物発見に革命をもたらした。
ディープラーニングはコンピュータ支援薬の発見に革命をもたらしたが、AIコミュニティは主にモデルイノベーションに重点を置いてきた。
我々は、小型分子の薬物発見ベンチマークであるWelQrateの新しいゴールドスタンダードの確立を目指しています。
論文 参考訳(メタデータ) (2024-11-14T21:49:41Z) - NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - PPFlow: Target-aware Peptide Design with Torsional Flow Matching [52.567714059931646]
ペプチド構造設計のためのねじれ角の内部構造をモデル化するために,textscPPFlowと呼ばれるターゲット認識型ペプチド設計手法を提案する。
さらに, PPBench2024というタンパク質-ペプチド結合データセットを構築した。
論文 参考訳(メタデータ) (2024-03-05T13:26:42Z) - PepGB: Facilitating peptide drug discovery via graph neural networks [36.744839520938825]
ペプチド-タンパク質相互作用(PepPIs)を予測することにより、ペプチドの早期発見を容易にする深層学習フレームワークPepGBを提案する。
我々は、リード生成と最適化プロセスでよく見られる高度に不均衡なデータのモデリングのボトルネックに取り組むために、拡張バージョンの diPepGB を導出する。
論文 参考訳(メタデータ) (2024-01-26T06:13:09Z) - PepHarmony: A Multi-View Contrastive Learning Framework for Integrated
Sequence and Structure-Based Peptide Encoding [21.126660909515607]
本研究は、配列に基づくペプチド符号化タスクのための、新しいマルチビューコントラスト学習フレームワークであるPepHarmonyを紹介する。
タンパク質データバンク(PDB)とAlphaFoldデータベースから、幅広いペプチド配列と構造を含むデータセットを慎重に選択する。
実験データではペプハーモニーのペプチド配列と構造の間の複雑な関係を捉える能力が強調されている。
論文 参考訳(メタデータ) (2024-01-21T01:16:53Z) - PyTrial: Machine Learning Software and Benchmark for Clinical Trial
Applications [49.69824178329405]
PyTrialは、臨床試験の設計と運用のための一連の機械学習アルゴリズムのベンチマークとオープンソース実装を提供する。
患者結果予測,臨床試験サイト選択,トライアル結果予測,患者と臨床のマッチング,トライアル類似性検索,合成データ生成など,6つのタスクにわたる臨床試験のための34のMLアルゴリズムを網羅的に検討した。
PyTrialは、データローディング、モデル仕様、モデルトレーニング、モデル評価という、単純な4段階のプロセスで各タスクを定義します。
論文 参考訳(メタデータ) (2023-06-06T21:19:03Z) - Peptipedia: a comprehensive database for peptide research supported by
Assembled predictive models and Data Mining approaches [0.0]
Peptipediaは、ペプチド配列を検索、解析、分析するためのユーザフレンドリーなデータベースおよびWebアプリケーションである。
本ツールでは,これまでに報告された30のデータベースから情報を統合し,これまでに記録された活動を持つペプチドのリポジトリとして最大である。
論文 参考訳(メタデータ) (2021-01-28T10:59:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。