論文の概要: Fitness aligned structural modeling enables scalable virtual screening with AuroBind
- arxiv url: http://arxiv.org/abs/2508.02137v1
- Date: Mon, 04 Aug 2025 07:34:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.227526
- Title: Fitness aligned structural modeling enables scalable virtual screening with AuroBind
- Title(参考訳): AuroBindによるスケーラブルな仮想スクリーニングを実現するフィットネスアライメント構造モデリング
- Authors: Zhongyue Zhang, Jiahua Rao, Jie Zhong, Weiqiang Bai, Dongxue Wang, Shaobo Ning, Lifeng Qiao, Sheng Xu, Runze Ma, Will Hua, Jack Xiaoyu Chen, Odin Zhang, Wei Lu, Hanyi Feng, He Yang, Xinchao Shi, Rui Li, Wanli Ouyang, Xinzhu Ma, Jiahao Wang, Jixian Zhang, Jia Duan, Siqi Sun, Jian Zhang, Shuangjia Zheng,
- Abstract要約: AuroBindは、100万規模のケモゲノミクスデータ上に、カスタム原子レベルの構造モデルを微調整するスケーラブルな仮想スクリーニングフレームワークである。
AuroBindは、直接選好最適化、高信頼錯体からの自己蒸留、教師-学生加速戦略を統合している。
AuroBindは10の疾患関連目標に対して、実験的なヒット率7-69%を達成し、トップ化合物はナノモラール下からピコモラールに到達した。
- 参考スコア(独自算出の注目度): 56.720030595081845
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Most human proteins remain undrugged, over 96% of human proteins remain unexploited by approved therapeutics. While structure-based virtual screening promises to expand the druggable proteome, existing methods lack atomic-level precision and fail to predict binding fitness, limiting translational impact. We present AuroBind, a scalable virtual screening framework that fine-tunes a custom atomic-level structural model on million-scale chemogenomic data. AuroBind integrates direct preference optimization, self-distillation from high-confidence complexes, and a teacher-student acceleration strategy to jointly predict ligand-bound structures and binding fitness. The proposed models outperform state-of-the-art models on structural and functional benchmarks while enabling 100,000-fold faster screening across ultra-large compound libraries. In a prospective screen across ten disease-relevant targets, AuroBind achieved experimental hit rates of 7-69%, with top compounds reaching sub-nanomolar to picomolar potency. For the orphan GPCRs GPR151 and GPR160, AuroBind identified both agonists and antagonists with success rates of 16-30%, and functional assays confirmed GPR160 modulation in liver and prostate cancer models. AuroBind offers a generalizable framework for structure-function learning and high-throughput molecular screening, bridging the gap between structure prediction and therapeutic discovery.
- Abstract(参考訳): ヒトのタンパク質の96%以上は、承認された治療薬によって未発見のままである。
構造に基づく仮想スクリーニングは、薬剤性プロテオームを拡張することを約束するが、既存の手法では原子レベルの精度が欠如し、結合適合の予測に失敗し、翻訳の影響を制限している。
AuroBindは、100万規模のケモゲノミクスデータ上に、カスタム原子レベルの構造モデルを微調整するスケーラブルな仮想スクリーニングフレームワークである。
AuroBindは、直接選好最適化、高信頼錯体からの自己蒸留、およびリガンド結合構造と結合適合性を共同で予測する教師-学生加速戦略を統合する。
提案したモデルは、構造的および機能的ベンチマークにおける最先端モデルよりも優れ、超大規模複合ライブラリでの10万倍高速スクリーニングを可能にする。
AuroBindは10の疾患関連目標に対して、実験的なヒット率7-69%を達成し、トップ化合物はナノモラール下からピコモラールに到達した。
孤児のGPCR GPR151とGPR160について、AuroBindはアゴニストとアンタゴニストの両方を16-30%の成功率で同定し、肝および前立腺癌モデルにおけるGPR160の調節を確認した。
AuroBindは、構造関数学習と高スループット分子スクリーニングのための一般化可能なフレームワークを提供し、構造予測と治療発見のギャップを埋めている。
関連論文リスト
- AMix-1: A Pathway to Test-Time Scalable Protein Foundation Model [92.51919604882984]
本稿では,Flow Bayesian Networks上に構築された強力なタンパク質基盤モデルAMix-1を紹介する。
AMix-1は、事前学習のスケーリング法則、創発的能力分析、コンテキスト内学習機構、テスト時間スケーリングアルゴリズムを含む、体系的なトレーニング手法によって強化されている。
この基盤を基盤として、タンパク質設計を汎用フレームワークに統合するためのマルチシーケンスアライメント(MSA)ベースのコンテキスト内学習戦略を考案した。
論文 参考訳(メタデータ) (2025-07-11T17:02:25Z) - DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。
DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。
その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文 参考訳(メタデータ) (2025-06-18T23:58:22Z) - PLAME: Leveraging Pretrained Language Models to Generate Enhanced Protein Multiple Sequence Alignments [53.55710514466851]
タンパク質構造予測は、薬物の発見と生物学的機能の理解に不可欠である。
ほとんどの折り畳みモデルは予測性能を高めるために多重シーケンスアライメント(MSA)に大きく依存している。
我々は、事前学習されたタンパク質言語モデルからの進化的埋め込みを利用する新しいMSA設計モデルPLAMEを提案する。
論文 参考訳(メタデータ) (2025-06-17T04:11:30Z) - AANet: Virtual Screening under Structural Uncertainty via Alignment and Aggregation [18.8920680373474]
構造的不確実性の下で正確な仮想スクリーニングを実現するためのアライメント・アンド・アグリゲーション・フレームワークを導入する。
本手法は,新しいアポ構造のベンチマークで評価し,ブラインドアポ設定における最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2025-06-06T05:52:19Z) - GenShin:geometry-enhanced structural graph embodies binding pose can better predicting compound-protein interaction affinity [6.1468096893238915]
我々は,タンパク質や化合物から付加的な特徴を抽出する構造グラフモジュールを構成するGenShinモデルを紹介する。
合成タンパク質親和性の予測において主流モデルと同等の精度を達成し、入力としての適切な結合ポーズの必要性を排除した。
私たちの研究は、AIモデルと実用的な薬物発見の課題の間のギャップを埋めるために、より多くの努力を喚起するでしょう。
論文 参考訳(メタデータ) (2025-03-16T09:11:56Z) - A general language model for peptide identification [4.044600688588866]
PDeepPPは、事前訓練されたタンパク質言語モデルとハイブリッドトランスフォーマー-畳み込みアーキテクチャを統合する統合ディープラーニングフレームワークである。
大規模かつ正確なペプチド分析を可能にすることにより、PDeepPPは生物医学研究と疾患治療のための新しい治療標的の発見を支援している。
論文 参考訳(メタデータ) (2025-02-21T17:31:22Z) - Manifold-Constrained Nucleus-Level Denoising Diffusion Model for Structure-Based Drug Design [81.95343363178662]
原子は分離違反を避けるために 最小の対距離を維持する必要がある
NucleusDiff は原子核と周囲の電子雲の間の相互作用を距離制約によってモデル化する。
違反率は1000%まで減少し、結合親和性は22.16%まで向上し、構造に基づく薬物設計の最先端モデルを上回る。
論文 参考訳(メタデータ) (2024-09-16T08:42:46Z) - ProFSA: Self-supervised Pocket Pretraining via Protein
Fragment-Surroundings Alignment [20.012210194899605]
本稿では,高分解能原子タンパク質構造からの知識を活用したポケット事前学習手法を提案する。
ProFSAと命名された本手法は,ポケットの薬剤性予測など,様々なタスクにおける最先端性能を実現する。
我々の研究は、高品質で多様なタンパク質構造データベースを活用することにより、タンパク質-リガンド複合体データの不足を軽減するための新たな道を開く。
論文 参考訳(メタデータ) (2023-10-11T06:36:23Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Unsupervisedly Prompting AlphaFold2 for Few-Shot Learning of Accurate
Folding Landscape and Protein Structure Prediction [28.630603355510324]
そこで我々は,メタ生成モデルであるEvoGenを提案し,貧弱なMSAターゲットに対するAlphaFold2のアンダーパフォーマンスを改善する。
EvoGenは、キャリブレーションまたは実質的に生成されたホモログシーケンスでモデルにプロンプトすることで、AlphaFold2を低データで正確に折り畳むのに役立つ。
論文 参考訳(メタデータ) (2022-08-20T10:23:17Z) - From Static to Dynamic Structures: Improving Binding Affinity Prediction with Graph-Based Deep Learning [40.83037811977803]
Dynaformerは、タンパク質-リガンド結合親和性を予測するために開発されたグラフベースのディープラーニングモデルである。
CASF-2016ベンチマークデータセットでは、最先端のスコアとランキングの能力を示している。
熱ショックタンパク質90(HSP90)の仮想スクリーニングにおいて、20の候補を同定し、それらの結合親和性を実験的に検証する。
論文 参考訳(メタデータ) (2022-08-19T14:55:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。