論文の概要: On fine-tuning Boltz-2 for protein-protein affinity prediction
- arxiv url: http://arxiv.org/abs/2512.06592v1
- Date: Sat, 06 Dec 2025 23:07:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.422921
- Title: On fine-tuning Boltz-2 for protein-protein affinity prediction
- Title(参考訳): タンパク質親和性予測のための微調整ボルツ-2について
- Authors: James King, Lewis Cornwall, Andrei Cristian Nica, James Day, Aaron Sim, Neil Dalchau, Lilly Wollman, Joshua Meyers,
- Abstract要約: 我々は,タンパク質-リガンド親和性予測器であるボルツ-2をタンパク質-タンパク質親和性回帰に適用した。
構造精度が高いにもかかわらず、Boltz-2-PPIは、小規模データと大規模データレギュレーションの両方において、シーケンスベースの代替よりも性能が低い。
その結果、構造データによるトレーニングに伴う既知のバイアスを反映し、現在の構造に基づく表現は、性能的親和性予測には適さないことが示唆された。
- 参考スコア(独自算出の注目度): 1.7607577951969595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate prediction of protein-protein binding affinity is vital for understanding molecular interactions and designing therapeutics. We adapt Boltz-2, a state-of-the-art structure-based protein-ligand affinity predictor, for protein-protein affinity regression and evaluate it on two datasets, TCR3d and PPB-affinity. Despite high structural accuracy, Boltz-2-PPI underperforms relative to sequence-based alternatives in both small- and larger-scale data regimes. Combining embeddings from Boltz-2-PPI with sequence-based embeddings yields complementary improvements, particularly for weaker sequence models, suggesting different signals are learned by sequence- and structure-based models. Our results echo known biases associated with training with structural data and suggest that current structure-based representations are not primed for performant affinity prediction.
- Abstract(参考訳): タンパク質結合親和性の正確な予測は、分子間相互作用の理解と治療設計に不可欠である。
我々は,タンパク質親和性評価のための最先端構造に基づくタンパク質-リガンド親和性予測器であるBoltz-2を適応し,TCR3dとPB親和性という2つのデータセットで評価した。
構造精度が高いにもかかわらず、Boltz-2-PPIは、小規模データと大規模データレギュレーションの両方において、シーケンスベースの代替よりも性能が低い。
Boltz-2-PPIからの埋め込みとシーケンスベースの埋め込みを組み合わせることで、特に弱いシーケンスモデルに対して補完的な改善が得られ、シーケンスベースのモデルと構造ベースのモデルによって異なる信号が学習されることが示唆された。
その結果、構造データによるトレーニングに伴う既知のバイアスを反映し、現在の構造に基づく表現は、性能的親和性予測には適さないことが示唆された。
関連論文リスト
- PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [88.98041407783502]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-07-07T15:21:05Z) - KEPLA: A Knowledge-Enhanced Deep Learning Framework for Accurate Protein-Ligand Binding Affinity Prediction [60.23701115249195]
KEPLAは、遺伝子オントロジーとリガンド特性の事前知識を統合し、予測性能を向上させる新しいディープラーニングフレームワークである。
2つのベンチマークデータセットの実験では、KEPLAは一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-06-16T08:02:42Z) - CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction [23.1499716310298]
我々は,タンパク質-RNA結合親和性データセットPRA310を構築し,性能評価を行った。
我々は,(1)タンパク質-RNA結合親和性,(2)変異による結合親和性の変化を正確に予測できること,(3)データのスケーリングとモデルサイズによるメリットを広く分析し,検証する。
論文 参考訳(メタデータ) (2024-08-21T09:48:22Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Multimodal Pre-Training Model for Sequence-based Prediction of
Protein-Protein Interaction [7.022012579173686]
タンパク質モデルによる効果的な表現の学習は、タンパク質とタンパク質の相互作用において重要である。
PPIの事前学習モデルのほとんどは配列ベースであり、自然言語処理で使用される言語モデルをアミノ酸配列に導入している。
本稿では, 配列, 構造, 機能という3つのモーダル性を持つマルチモーダルタンパク質事前学習モデルを提案する。
論文 参考訳(メタデータ) (2021-12-09T10:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。