論文の概要: Pearl: A Foundation Model for Placing Every Atom in the Right Location
- arxiv url: http://arxiv.org/abs/2510.24670v1
- Date: Tue, 28 Oct 2025 17:36:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:37.311018
- Title: Pearl: A Foundation Model for Placing Every Atom in the Right Location
- Title(参考訳): Pearl: すべてのAtomを適切な場所に配置するための基盤モデル
- Authors: Genesis Research Team, Alejandro Dobles, Nina Jovic, Kenneth Leidal, Pranav Murugan, David C. Williams, Drausin Wulsin, Nate Gruver, Christina X. Ji, Korrawat Pruegsanusak, Gianluca Scarpellini, Ansh Sharma, Wojciech Swiderski, Andrea Bootsma, Richard Strong Bowen, Charlotte Chen, Jamin Chen, Marc André Dämgen, Roy Tal Dew, Benjamin DiFrancesco, J. D. Fishman, Alla Ivanova, Zach Kagin, David Li-Bland, Zuli Liu, Igor Morozov, Jeffrey Ouyang-Zhang, Frank C. Pickard IV, Kushal S. Shah, Ben Shor, Gabriel Monteiro da Silva, Maxx Tessmer, Carl Tilbury, Cyr Vetcher, Daniel Zeng, Maruan Al-Shedivat, Aleksandra Faust, Evan N. Feinberg, Michael V. LeVine, Matteus Pan,
- Abstract要約: タンパク質-リガンド共フォールディングの基礎モデルであるPearlを紹介した。
パールはタンパク質-リガンド結合における新しい最先端性能を確立している。
Pearlは、パブリックなRuns N' PosesとPoseBustersベンチマークでAlphaFold 3や他のオープンソースベースラインを上回っている。
- 参考スコア(独自算出の注目度): 52.35027831422145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately predicting the three-dimensional structures of protein-ligand complexes remains a fundamental challenge in computational drug discovery that limits the pace and success of therapeutic design. Deep learning methods have recently shown strong potential as structural prediction tools, achieving promising accuracy across diverse biomolecular systems. However, their performance and utility are constrained by scarce experimental data, inefficient architectures, physically invalid poses, and the limited ability to exploit auxiliary information available at inference. To address these issues, we introduce Pearl (Placing Every Atom in the Right Location), a foundation model for protein-ligand cofolding at scale. Pearl addresses these challenges with three key innovations: (1) training recipes that include large-scale synthetic data to overcome data scarcity; (2) architectures that incorporate an SO(3)-equivariant diffusion module to inherently respect 3D rotational symmetries, improving generalization and sample efficiency, and (3) controllable inference, including a generalized multi-chain templating system supporting both protein and non-polymeric components as well as dual unconditional/conditional modes. Pearl establishes a new state-of-the-art performance in protein-ligand cofolding. On the key metric of generating accurate (RMSD < 2 \r{A}) and physically valid poses, Pearl surpasses AlphaFold 3 and other open source baselines on the public Runs N' Poses and PoseBusters benchmarks, delivering 14.5% and 14.2% improvements, respectively, over the next best model. In the pocket-conditional cofolding regime, Pearl delivers $3.6\times$ improvement on a proprietary set of challenging, real-world drug targets at the more rigorous RMSD < 1 \r{A} threshold. Finally, we demonstrate that model performance correlates directly with synthetic dataset size used in training.
- Abstract(参考訳): タンパク質-リガンド複合体の3次元構造を正確に予測することは、治療設計のペースと成功を制限する計算薬物発見の根本的な課題である。
近年, 深層学習は構造予測ツールとして大きな可能性を示し, 多様な生体分子系において有望な精度を実現している。
しかし、それらの性能と実用性は、実験データ不足、非効率なアーキテクチャ、物理的に無効なポーズ、推論で利用可能な補助情報を利用する能力の制限によって制限されている。
これらの問題に対処するため,タンパク質-リガンド結合の基礎モデルであるPearl(Placing Every Atom in the Right Location)を紹介した。
パールは、データの不足を克服するために大規模な合成データを含むトレーニングレシピ、(2)SO(3)-同変拡散モジュールを内包して3次元回転対称性を本質的に尊重するアーキテクチャ、(3)一般化とサンプル効率の向上、(3)タンパク質と非高分子成分の両方をサポートする一般化多鎖テンプレートシステム、および二重無条件/条件モードを含む制御可能な推論の3つの重要なイノベーションに対処する。
パールはタンパク質-リガンド結合における新しい最先端性能を確立している。
正確な (RMSD < 2 \r{A}) と物理的に有効なポーズを生成するキーメトリックでは、PearlはAlphaFold 3や他のオープンソースベースラインを、パブリックなRuns N' PosesとPoseBustersベンチマークで上回り、次のベストモデルよりも14.5%と14.2%改善した。
ポケットコンディショナーの折り畳み式では、パールはより厳格なRMSD < 1 \r{A}しきい値で、プロプライエタリな現実のドラッグターゲットセットに3.6\times$改善を提供する。
最後に、モデル性能がトレーニングで使用される合成データセットサイズと直接相関することを示す。
関連論文リスト
- Large-Scale Diverse Synthesis for Mid-Training [15.81154701009597]
BoostQAは100Bの大規模質問回答データセットである。
本稿では,BoostQAを合成するための新しい多様化パイプラインを提案する。
提案手法は,Llama-3 8Bを40Bトーケンデータセットで中級訓練し,MMLUとCMMLUで平均$mathbf12.74%の改善を実現する。
論文 参考訳(メタデータ) (2025-08-02T11:37:16Z) - Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs [51.21041884010009]
Ring-liteは、強化学習(RL)により最適化されたMixture-of-Experts(MoE)ベースの大規模言語モデルである
我々のアプローチは、挑戦的なベンチマーク上でのSOTA(State-of-the-art)の小規模推論モデルの性能と一致する。
論文 参考訳(メタデータ) (2025-06-17T17:12:34Z) - PoseX: AI Defeats Physics Approaches on Protein-Ligand Cross Docking [74.76447568426276]
PoseXは、セルフドッキングとクロスドッキングの両方を評価するためのオープンソースのベンチマークである。
23のドッキング法を3つの方法論カテゴリに組み込んだ。
我々は,コンフォメーションエネルギーを最小化し,結合ポーズを洗練するために,後処理の緩和法を開発した。
論文 参考訳(メタデータ) (2025-05-03T05:35:37Z) - Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [55.95767828747407]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文 参考訳(メタデータ) (2025-02-14T03:26:57Z) - ALoRE: Efficient Visual Adaptation via Aggregating Low Rank Experts [71.91042186338163]
ALoREは、Kroneckerによって構築された超複素パラメータ化空間をAggregate Low Rank Expertsに再利用する新しいPETL法である。
巧妙な設計のおかげで、ALoREは無視できる余分なパラメータを保持し、凍ったバックボーンに強制的にマージできる。
論文 参考訳(メタデータ) (2024-12-11T12:31:30Z) - One-step Structure Prediction and Screening for Protein-Ligand Complexes using Multi-Task Geometric Deep Learning [6.605588716386855]
マルチタスク幾何学的深層学習に基づいて,LigPoseを1つのモデル,すなわちLigPoseに正確に取り組めることを示す。
LigPoseはリガンドとタンパク質のペアをグラフとして表現し、結合強度と原子間相互作用を補助的なタスクとして学習する。
実験によると、LigPoseは薬物研究の主要な課題について最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-08-21T05:53:50Z) - On Machine Learning Approaches for Protein-Ligand Binding Affinity Prediction [2.874893537471256]
本研究では,タンパク質-リガンド結合親和性予測における古典的木モデルと高度なニューラルネットワークの性能を評価する。
2次元モデルと3次元モデルを組み合わせることで、現在の最先端のアプローチを超えて、アクティブな学習結果が向上することを示す。
論文 参考訳(メタデータ) (2024-07-15T13:06:00Z) - Pre-Training on Large-Scale Generated Docking Conformations with HelixDock to Unlock the Potential of Protein-ligand Structure Prediction Models [42.16524616409125]
本研究では,大規模ドッキングコンフォーメーションの事前学習により,優れた性能を有するタンパク質リガンド構造予測モデルが得られることを示す。
提案モデルであるHelixDockは,物理ベースのドッキングツールによってカプセル化された物理知識を,事前学習期間中に取得することを目的としている。
論文 参考訳(メタデータ) (2023-10-21T05:54:26Z) - Prediction of SLAM ATE Using an Ensemble Learning Regression Model and
1-D Global Pooling of Data Characterization [3.4399698738841553]
原位置センサの入力特性に基づいてSLAMの局所化誤差を予測する新しい手法を提案する。
提案手法は, 原位置センサデータから生成した1次元グローバルプール特徴に基づくランダム森林回帰モデルを用いた。
また,12の異なる1次元大域プール関数が回帰品質に及ぼす影響について検討し,その1次元大域平均化の優位性について定量的に検証した。
論文 参考訳(メタデータ) (2023-03-01T16:12:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。