論文の概要: BioScore: A Foundational Scoring Function For Diverse Biomolecular Complexes
- arxiv url: http://arxiv.org/abs/2507.10877v1
- Date: Tue, 15 Jul 2025 00:41:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:02.929549
- Title: BioScore: A Foundational Scoring Function For Diverse Biomolecular Complexes
- Title(参考訳): BioScore: 多様な生体分子複合体のための基礎的スコーリング機能
- Authors: Yuchen Zhu, Jihong Chen, Yitong Li, Xiaomin Fang, Xianbin Ye, Jingzhou He, Xujun Zhang, Jingxuan Ge, Chao Shen, Xiaonan Zhang, Tingjun Hou, Chang-Yu Hsieh,
- Abstract要約: 現在の構造に基づくスコアリング関数は、様々な生体分子系における一般化性に欠けることが多い。
このBioScoreは、データの分散性、システム間の表現、タスクの互換性といった重要な課題に対処する基礎的なスコアリング機能です。
BioScoreはアフィニティ予測、コンフォーメーションランキング、構造ベースの仮想スクリーニングなど、幅広いタスクをサポートしている。
- 参考スコア(独自算出の注目度): 11.395906604051156
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Structural assessment of biomolecular complexes is vital for translating molecular models into functional insights, shaping our understanding of biology and aiding drug discovery. However, current structure-based scoring functions often lack generalizability across diverse biomolecular systems. We present BioScore, a foundational scoring function that addresses key challenges -- data sparsity, cross-system representation, and task compatibility -- through a dual-scale geometric graph learning framework with tailored modules for structure assessment and affinity prediction. BioScore supports a wide range of tasks, including affinity prediction, conformation ranking, and structure-based virtual screening. Evaluated on 16 benchmarks spanning proteins, nucleic acids, small molecules, and carbohydrates, BioScore consistently outperforms or matches 70 traditional and deep learning methods. Our newly proposed PPI Benchmark further enables comprehensive evaluation of protein-protein complex scoring. BioScore demonstrates broad applicability: (1) pretraining on mixed-structure data boosts protein-protein affinity prediction by up to 40% and antigen-antibody binding correlation by over 90%; (2) cross-system generalizability enables zero- and few-shot prediction with up to 71% correlation gain; and (3) its unified representation captures chemically challenging systems such as cyclic peptides, improving affinity prediction by over 60%. BioScore establishes a robust and generalizable framework for structural assessment across complex biomolecular landscapes.
- Abstract(参考訳): 生体分子複合体の構造評価は、分子モデルを機能的な洞察に翻訳し、生物学の理解を形成し、薬物発見を支援するために不可欠である。
しかし、現在の構造に基づくスコアリング機能は、様々な生体分子系にまたがる一般化性に欠けることが多い。
我々は、構造評価と親和性予測のための調整されたモジュールを備えた2段階の幾何学的グラフ学習フレームワークを通して、データ空間、システム間表現、タスク互換性といった重要な課題に対処する基礎的なスコアリング機能であるBioScoreを提案する。
BioScoreはアフィニティ予測、コンフォーメーションランキング、構造ベースの仮想スクリーニングなど、幅広いタスクをサポートしている。
タンパク質、核酸、小さな分子、炭水化物にまたがる16のベンチマークで評価され、BioScoreは従来型およびディープラーニングの手法を一貫して上回っている。
新たに提案したPPIベンチマークにより,タンパク質複合体スコアリングの総合的な評価が可能となった。
BioScoreは、(1)タンパク質-タンパク質親和性予測を40%以上、抗原-抗体結合相関を90%以上増加させ、(2)システム間一般化により、最大71%の相関関係を持つゼロおよび少数ショット予測を可能にし、(3)その統一表現は環状ペプチドのような化学的に困難なシステムを捕捉し、親和性予測を60%以上改善する。
BioScoreは、複雑な生体分子のランドスケープをまたいだ構造評価のための堅牢で一般化可能なフレームワークを確立する。
関連論文リスト
- PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [80.08310253195144]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-07-07T15:21:05Z) - DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。
DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。
その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文 参考訳(メタデータ) (2025-06-18T23:58:22Z) - KEPLA: A Knowledge-Enhanced Deep Learning Framework for Accurate Protein-Ligand Binding Affinity Prediction [60.23701115249195]
KEPLAは、遺伝子オントロジーとリガンド特性の事前知識を統合し、予測性能を向上させる新しいディープラーニングフレームワークである。
2つのベンチマークデータセットの実験では、KEPLAは一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-06-16T08:02:42Z) - VenusX: Unlocking Fine-Grained Functional Understanding of Proteins [3.9151216020893544]
VenusXは、微細な機能アノテーションと関数ベースのタンパク質ペアリングのための、残基、フラグメント、ドメインレベルでの最初の大規模なベンチマークである。
VenusXは、重要なアクティブサイト、バインディングサイト、保存されたサイトモチーフ、ドメイン、ペアワイズを含む3つの主要なタスクカテゴリで構成されている。
本ベンチマークでは,流通シナリオとアウト・オブ・ディストリビューションシナリオの両方において,モデル性能の総合評価を可能にする。
論文 参考訳(メタデータ) (2025-05-17T03:44:23Z) - A Generalist Cross-Domain Molecular Learning Framework for Structure-Based Drug Discovery [32.573496601865465]
構造に基づく薬物発見(Structure-based drug discovery、SBDD)は、標的タンパク質の詳細な物理的構造を利用して新しい薬物を開発する体系的な科学的プロセスである。
生体分子の事前学習モデルの最近の進歩は、様々な生化学的応用において顕著な成功を収めている。
論文 参考訳(メタデータ) (2025-03-06T12:04:56Z) - COMET: Benchmark for Comprehensive Biological Multi-omics Evaluation Tasks and Language Models [56.81513758682858]
COMETは、シングルオミクス、クロスオミクス、マルチオミクスタスクのモデルを評価することを目的としている。
まず、我々は、DNA、RNA、タンパク質の主要な構造的および機能的側面をカバーする、下流タスクとデータセットの多様なコレクションをキュレートし、開発する。
そこで我々は,DNA,RNA,タンパク質の既存の基礎言語モデルと,新たに提案されたマルチオミクス法を評価する。
論文 参考訳(メタデータ) (2024-12-13T18:42:00Z) - NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Deep Learning Methods for Protein Family Classification on PDB
Sequencing Data [0.0]
本稿では,新たな双方向LSTMや畳み込みモデルなどのディープラーニングフレームワークの性能を,広く利用可能なシークエンシングデータ上で実証し比較する。
我々のディープラーニングモデルは従来の機械学習手法よりも優れた性能を示し、畳み込みアーキテクチャは最も印象的な推論性能を提供する。
論文 参考訳(メタデータ) (2022-07-14T06:11:32Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。