論文の概要: BioLM-Score: Language-Prior Conditioned Probabilistic Geometric Potentials for Protein-Ligand Scoring
- arxiv url: http://arxiv.org/abs/2602.18476v1
- Date: Mon, 09 Feb 2026 12:31:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 07:21:25.601391
- Title: BioLM-Score: Language-Prior Conditioned Probabilistic Geometric Potentials for Protein-Ligand Scoring
- Title(参考訳): バイオLMスコア:タンパク質-リガンドスコーリングのための言語条件付き確率的幾何学的ポテンシャル
- Authors: Zhangfan Yang, Baoyun Chen, Dong Xu, Jia Wang, Ruibin Bai, Junkai Ji, Zexuan Zhu,
- Abstract要約: 本稿では,モデルと表現学習を結合した単純で一般化可能なタンパク質リガンドスコアモデルであるBioLM-Scoreを提案する。
CASF-2016ベンチマークの評価では、ドッキング、スコアリング、ランキング、スクリーニングタスク間で大幅に改善されている。
要約すると、BioLM-Scoreは、構造に基づく薬物発見のための効率性、一般化、解釈性を組み合わせた、既存のスコアリング機能に対する原則的で実用的な代替手段を提供する。
- 参考スコア(独自算出の注目度): 23.407269396970168
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Protein-ligand scoring is a central component of structure-based drug design, underpinning molecular docking, virtual screening, and pose optimization. Conventional physics-based energy functions are often computationally expensive, limiting their utility in large-scale screening. In contrast, deep learning-based scoring models offer improved computational efficiency but frequently suffer from limited cross-target generalization and poor interpretability, which restrict their practical applicability. Here we present BioLM-Score, a simple yet generalizable protein-ligand scoring model that couples geometric modeling with representation learning. Specifically, it employs modality-specific and structure-aware encoders for proteins and ligands, each augmented with biomolecular language models to enrich structural and chemical representations. Subsequently, these representations are integrated through a mixture density network to predict multimodal interatomic distance distributions, from which statistically grounded likelihood-based scores are derived. Evaluations on the CASF-2016 benchmark demonstrate that BioLM-Score achieves significant improvements across docking, scoring, ranking, and screening tasks. Moreover, the proposed scoring function serves as an effective optimization objective for guiding docking protocols and conformational search. In summary, BioLM-Score provides a principled and practical alternative to existing scoring functions, combining efficiency, generalization, and interpretability for structure-based drug discovery.
- Abstract(参考訳): タンパク質リガンドスコア(英: protein-ligand score)は、構造に基づく薬物設計、分子ドッキング、仮想スクリーニング、ポーズ最適化の中心的な構成要素である。
従来の物理学に基づくエネルギー関数は、しばしば計算コストが高く、大規模なスクリーニングにおいて有効性を制限している。
対照的に、ディープラーニングに基づくスコアリングモデルでは、計算効率が向上するが、ターゲット間の一般化が制限され、解釈性が低下し、実用性が制限されることがしばしばある。
ここでは、幾何学モデリングと表現学習を結合した、単純だが一般化可能なタンパク質リガンドスコアモデルであるBioLM-Scoreを紹介する。
具体的には、タンパク質やリガンドのモダリティに特化して構造を意識したエンコーダを使用し、それぞれが生体分子言語モデルで強化され、構造的および化学的表現が強化される。
その後、これらの表現は混合密度ネットワークを通じて統合され、統計学的に基底化された確率に基づくスコアが導出されるマルチモーダル原子間距離分布を予測する。
CASF-2016ベンチマークの評価によると、BioLM-Scoreはドッキング、スコアリング、ランキング、スクリーニングタスクで大幅に改善されている。
さらに,提案したスコアリング関数はドッキングプロトコルとコンフォメーション探索を導くための効果的な最適化目的として機能する。
要約すると、BioLM-Scoreは、構造に基づく薬物発見のための効率性、一般化、解釈性を組み合わせた、既存のスコアリング機能に対する原則的で実用的な代替手段を提供する。
関連論文リスト
- DrugR: Optimizing Molecular Drugs through LLM-based Explicit Reasoning [24.70952870676648]
DrugRは、明示的で段階的な薬理学的推論を最適化プロセスに導入する、大きな言語モデルである。
提案手法は, ドメイン固有の事前学習, 逆データ工学による微調整, 自己バランス型多粒性強化学習を統合した。
実験結果から、Dr.Rは構造的類似性や標的結合親和性を損なうことなく、複数の特性を包括的に拡張できることが示された。
論文 参考訳(メタデータ) (2026-02-09T02:26:25Z) - Purely Agentic Black-Box Optimization for Biological Design [34.69167338457496]
小分子の薬物発見、抗微生物ペプチド開発、タンパク質工学など、生物設計における重要な課題はブラックボックス最適化である。
既存の手法は主に生の構造データに依存しており、豊かな科学文献の活用に苦慮している。
我々は、生物学的ブラックボックス最適化を、完全にエージェント的、言語に基づく推論プロセスとして用いた。
論文 参考訳(メタデータ) (2026-01-29T22:45:07Z) - Edge-aware GAT-based protein binding site prediction [3.3941174310007685]
生体分子間の結合部位のきめ細かい予測のためのエッジ対応グラフ注意ネットワーク(Edge対応GAT)モデルを提案する。
本手法は原子レベルのグラフを構築し,幾何学的記述子を含む多次元構造特徴を統合する。
本モデルでは,タンパク質結合部位予測のためのROC-AUCの0.93を達成し,いくつかの最先端手法より優れている。
論文 参考訳(メタデータ) (2026-01-05T14:09:57Z) - Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting [92.57796055887995]
本稿では,言語モデルエージェントの強化学習から後視体験のリプレイに適応するプロンプトフレームワークECHOを紹介する。
ECHOは失敗した試みで達成できた代替目標のために最適化された軌道を生成する。
我々は、テキストベースのナビゲーションと計画ベンチマークであるXMiniGridのステートフルバージョンと、協調的な情報収集企業シミュレーションであるPeopleJoinQAについて、ECHOを評価した。
論文 参考訳(メタデータ) (2025-10-11T18:11:09Z) - A Geometric Graph-Based Deep Learning Model for Drug-Target Affinity Prediction [0.0]
グラフ学習フレームワークに残差接続とアテンション機構を統合したディープ畳み込みニューラルネットワークDeepGGLを導入する。
マルチスケールの重み付き二部体部分グラフを活用することで、DeepGGLは複数のスケールにわたるタンパク質-リガンド複合体の微細な原子レベルの相互作用を効果的に捉えることができる。
DeepGGLは高い予測精度を維持し、構造に基づく薬物発見におけるアフィニティ予測への適応性と信頼性を強調した。
論文 参考訳(メタデータ) (2025-09-15T14:06:39Z) - PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [88.98041407783502]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-07-07T15:21:05Z) - Improving Biomedical Entity Linking with Retrieval-enhanced Learning [53.24726622142558]
$k$NN-BioELは、トレーニングコーパス全体から同様のインスタンスを予測のヒントとして参照する機能を備えたBioELモデルを提供する。
k$NN-BioELは、いくつかのデータセットで最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-12-15T14:04:23Z) - Learning Multiscale Consistency for Self-supervised Electron Microscopy
Instance Segmentation [48.267001230607306]
本稿では,EMボリュームのマルチスケール一貫性を高める事前学習フレームワークを提案する。
当社のアプローチでは,強力なデータ拡張と弱いデータ拡張を統合することで,Siameseネットワークアーキテクチャを活用している。
効果的にボクセルと機能の一貫性をキャプチャし、EM分析のための転送可能な表現を学習する。
論文 参考訳(メタデータ) (2023-08-19T05:49:13Z) - PIGNet2: A Versatile Deep Learning-based Protein-Ligand Interaction
Prediction Model for Binding Affinity Scoring and Virtual Screening [0.0]
タンパク質-リガンド相互作用の予測(PLI)は、薬物発見において重要な役割を果たす。
結合親和性を正確に評価し、効率的な仮想スクリーニングを行う汎用モデルの開発は依然として課題である。
本稿では、物理インフォームドグラフニューラルネットワークと組み合わせて、新しいデータ拡張戦略を導入することにより、実現可能なソリューションを提案する。
論文 参考訳(メタデータ) (2023-07-03T14:46:49Z) - End-to-end cell recognition by point annotation [5.130998755172569]
本稿では,事前設定されたアンカーポイントに対して,直接回帰と分類を適用するエンドツーエンドフレームワークを提案する。
具体的には,低レベル特徴と高レベル意味論を同時に組み合わせたピラミッド型特徴集合戦略を提案する。
さらに,基本事実と予測点とを一致させて,マルチタスク学習フレームワークを適応させる最適化コスト関数を設計した。
論文 参考訳(メタデータ) (2022-07-01T02:44:58Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。