論文の概要: ToxBench: A Binding Affinity Prediction Benchmark with AB-FEP-Calculated Labels for Human Estrogen Receptor Alpha
- arxiv url: http://arxiv.org/abs/2507.08966v1
- Date: Fri, 11 Jul 2025 18:50:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:21.970088
- Title: ToxBench: A Binding Affinity Prediction Benchmark with AB-FEP-Calculated Labels for Human Estrogen Receptor Alpha
- Title(参考訳): ToxBench:ヒトエストロゲン受容体αに対するAB-FEP-Calculated Labelを用いた結合親和性予測ベンチマーク
- Authors: Meng Liu, Karl Leswing, Simon K. S. Chu, Farhad Ramezanghorbani, Griffin Young, Gabriel Marques, Prerna Das, Anjali Panikar, Esther Jamir, Mohammed Sulaiman Shamsudeen, K. Shawn Watts, Ananya Sen, Hari Priya Devannagari, Edward B. Miller, Muyun Lihan, Howook Hwang, Janet Paulsen, Xin Yu, Kyle Gion, Timur Rvachov, Emine Kucukbenli, Saee Gopal Paliwal,
- Abstract要約: ToxBenchは、機械学習(ML)開発用に設計された最初の大規模AB-FEPデータセットである。
我々は最先端のML手法をベンチマークし、特に、結合エネルギー関数を効果的に学習するためにデュアルロスフレームワークを使用するDualBindモデルを提案する。
ベンチマークの結果、計算コストのごく一部でAB-FEPを近似する上で、DualBindの優れた性能とMLの可能性を示した。
- 参考スコア(独自算出の注目度): 11.033850071706503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Protein-ligand binding affinity prediction is essential for drug discovery and toxicity assessment. While machine learning (ML) promises fast and accurate predictions, its progress is constrained by the availability of reliable data. In contrast, physics-based methods such as absolute binding free energy perturbation (AB-FEP) deliver high accuracy but are computationally prohibitive for high-throughput applications. To bridge this gap, we introduce ToxBench, the first large-scale AB-FEP dataset designed for ML development and focused on a single pharmaceutically critical target, Human Estrogen Receptor Alpha (ER$\alpha$). ToxBench contains 8,770 ER$\alpha$-ligand complex structures with binding free energies computed via AB-FEP with a subset validated against experimental affinities at 1.75 kcal/mol RMSE, along with non-overlapping ligand splits to assess model generalizability. Using ToxBench, we further benchmark state-of-the-art ML methods, and notably, our proposed DualBind model, which employs a dual-loss framework to effectively learn the binding energy function. The benchmark results demonstrate the superior performance of DualBind and the potential of ML to approximate AB-FEP at a fraction of the computational cost.
- Abstract(参考訳): タンパク質-リガンド結合親和性予測は、薬物の発見と毒性評価に不可欠である。
機械学習(ML)は高速で正確な予測を約束するが、その進歩は信頼性のあるデータの可用性によって制約される。
対照的に、絶対結合自由エネルギー摂動(AB-FEP)のような物理学に基づく手法は高い精度を提供するが、高スループットアプリケーションでは計算が禁じられている。
このギャップを埋めるために、私たちは、ML開発用に設計された最初の大規模AB-FEPデータセットであるToxBenchを紹介し、単一の薬剤学的に重要なターゲットであるHuman Estrogen Receptor Alpha(ER$\alpha$)に焦点を当てた。
ToxBenchは8,770 ER$\alpha$-ligand複素構造を持ち、AB-FEPを介して計算された結合自由エネルギーと1.75 kcal/mol RMSEにおける実験親和性に対して検証された部分集合と、モデルの一般化性を評価するために重複しないリガンド分割を含む。
ToxBenchを用いて、最先端のML手法、特に、結合エネルギー関数を効果的に学習するためにデュアルロスフレームワークを使用するDualBindモデルをさらにベンチマークする。
ベンチマークの結果、計算コストのごく一部でAB-FEPを近似する上で、DualBindの優れた性能とMLの可能性を示した。
関連論文リスト
- Fitness aligned structural modeling enables scalable virtual screening with AuroBind [56.720030595081845]
AuroBindは、100万規模のケモゲノミクスデータ上に、カスタム原子レベルの構造モデルを微調整するスケーラブルな仮想スクリーニングフレームワークである。
AuroBindは、直接選好最適化、高信頼錯体からの自己蒸留、教師-学生加速戦略を統合している。
AuroBindは10の疾患関連目標に対して、実験的なヒット率7-69%を達成し、トップ化合物はナノモラール下からピコモラールに到達した。
論文 参考訳(メタデータ) (2025-08-04T07:34:48Z) - PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [80.08310253195144]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-07-07T15:21:05Z) - Prediction of Freezing of Gait in Parkinsons Disease using Explainable AI and Federated Deep Learning for Wearable Sensors [0.0]
本研究では、慣性計測ユニット(IMU)データセットを用いて、歩行凍結の早期検出と予測のための説明可能なAI手法を開発する。
Stacking Ensembleモデルは、ハイブリッド双方向GRUモデルを超え、99%近い分類精度を達成し、優れた性能を達成する。
提案するFOG予測フレームワークには,各デバイス上でモデルをローカルにトレーニングし,中央サーバに集約するフェデレーション学習が組み込まれている。
論文 参考訳(メタデータ) (2025-07-01T01:22:12Z) - PLAME: Leveraging Pretrained Language Models to Generate Enhanced Protein Multiple Sequence Alignments [53.55710514466851]
タンパク質構造予測は、薬物の発見と生物学的機能の理解に不可欠である。
ほとんどの折り畳みモデルは予測性能を高めるために多重シーケンスアライメント(MSA)に大きく依存している。
我々は、事前学習されたタンパク質言語モデルからの進化的埋め込みを利用する新しいMSA設計モデルPLAMEを提案する。
論文 参考訳(メタデータ) (2025-06-17T04:11:30Z) - Stochastic Primal-Dual Double Block-Coordinate for Two-way Partial AUC Maximization [56.805574957824135]
2方向部分AUCAUCは、不均衡なデータを持つバイナリ分類における重要な性能指標である。
TPAUC最適化のための既存のアルゴリズムは未探索のままである。
TPAUC最適化のための2つの革新的な二重座標ブロック座標アルゴリズムを導入する。
論文 参考訳(メタデータ) (2025-05-28T03:55:05Z) - Semiparametric inference for impulse response functions using double/debiased machine learning [49.1574468325115]
本稿では,インパルス応答関数(IRF)に対する機械学習推定手法を提案する。
提案した推定器は、処理と結果変数の完全な非パラメトリック関係に依存することができ、柔軟な機械学習アプローチを用いてIRFを推定することができる。
論文 参考訳(メタデータ) (2024-11-15T07:42:02Z) - BAPULM: Binding Affinity Prediction using Language Models [7.136205674624813]
本稿では,ProtT5-XL-U50およびMollFormerを介してタンパク質の化学潜伏表現を利用する,革新的な配列ベースフレームワークであるBAPULMを紹介する。
提案手法は,ベンチマーク1k2101, Test2016_290, CSAR-HiQ_36でそれぞれ0.925 $pm$0.043, 0.914 $pm$0.004, 0.8132 $pm$0.0001のシーケンシャルスコアリングパワー(R)値を達成した。
論文 参考訳(メタデータ) (2024-11-06T04:35:30Z) - DualBind: A Dual-Loss Framework for Protein-Ligand Binding Affinity Prediction [7.088174555911565]
本稿では、教師付き平均二乗誤差(MSE)と教師なし復調スコアマッチング(DSM)を統合して、結合エネルギー関数を正確に学習する新しいフレームワークであるDualBindを提案する。
実験の結果,DualBindは結合親和性の予測に優れ,ラベル付きデータとラベルなしデータの両方を有効利用して性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2024-06-11T23:29:48Z) - Comparing Hyper-optimized Machine Learning Models for Predicting Efficiency Degradation in Organic Solar Cells [38.647921189039934]
本研究は,有機太陽電池 (OSC) の電力変換効率 (PCE) に苦しむ時間的劣化を表現するための機械学習モデルを提案する。
製造プロセスと環境条件の両方に関して最大7変数を含む996項目のデータベースを180日間以上作成しました。
一方、根平均二乗誤差(RMSE)、二乗誤差(SSE)の和、および平均絶対誤差(MAE)>1%の目標値であるPCEは、係数決定(R2)の値に達した。
論文 参考訳(メタデータ) (2024-03-29T22:05:26Z) - Maximum Likelihood Learning of Unnormalized Models for Simulation-Based
Inference [44.281860162298564]
シミュレーションベース推論のための2つの合成確率法を提案する。
本研究では,シミュレータによって生成された合成データを用いて,条件付きエネルギーベースモデル(EBM)を学習する。
本研究は, カニの神経科学ネットワークのモデルに適用し, 各種合成データセット上での両手法の特性を実証する。
論文 参考訳(メタデータ) (2022-10-26T14:38:24Z) - Pseudo-Spherical Contrastive Divergence [119.28384561517292]
エネルギーベースモデルの最大学習確率を一般化するために,擬球面コントラスト分散(PS-CD)を提案する。
PS-CDは難解な分割関数を避け、学習目的の一般化されたファミリーを提供する。
論文 参考訳(メタデータ) (2021-11-01T09:17:15Z) - ResAtom System: Protein and Ligand Affinity Prediction Model Based on
Deep Learning [1.1493209685387984]
我々は,resnetニューラルネットワークを用いたタンパク質リガンド親和性予測モデルを構築した。
その結果,ResAtom-Scoreと組み合わせてDeltaVinaRF20を用いることで,スコア関数に近い親和性予測が実現できることがわかった。
論文 参考訳(メタデータ) (2021-04-17T15:37:10Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。