論文の概要: Hierarchical Contrastive Learning for Multi-Domain Protein-Ligand Binding
- arxiv url: http://arxiv.org/abs/2605.19902v1
- Date: Tue, 19 May 2026 14:33:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.40107
- Title: Hierarchical Contrastive Learning for Multi-Domain Protein-Ligand Binding
- Title(参考訳): マルチドメインタンパク質-リガンド結合のための階層的コントラスト学習
- Authors: Shuo Zhang, Rongqi Hong, Huifeng Zhang, Jian K. Liu,
- Abstract要約: 本稿では,タンパク質-リガンド親和性を予測する自己教師型フレームワークであるHCLBindを紹介する。
HCLBindは、識別インタフェースの特徴を効果的に学習し、堅牢な不確実性推定を提供する。
PDBBindの実験は、HCLBindが識別インタフェースの特徴を効果的に学習し、堅牢な不確実性推定を提供することを示した。
- 参考スコア(独自算出の注目度): 13.923026855785173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting protein-ligand binding affinity remains intractable for multi-domain proteins, where inter-domain dynamics govern molecular recognition. Existing geometric deep learning methods typically treat proteins as monolithic static graphs, suffering from rigid-body assumptions and aleatoric noise in flexible regions. To address this, we introduced HCLBind, a self-supervised framework that decouples geometric representation learning from affinity regression. HCLBind leverages a general-to-specific pre-training paradigm on the Q-BioLiP database to learn a robust physical grammar of binding. We propose a novel hierarchical decoy strategy: the model learns local physicochemical constraints through protein coordinate perturbation in single-domain proteins and global conformational geometry through inter-domain rotation in multi-domain complexes. Our hybrid architecture integrates a domain-gated graph attention network and cross-modal attention to explicitly prioritize domain interfaces. Furthermore, we employ LoRA on protein and ligand foundation models, ensuring efficient optimization while preserving evolutionary knowledge. Experiments on PDBBind demonstrate that HCLBind effectively learns discriminative interface features and provides robust uncertainty estimation, overcoming the limitations of standard supervised learning. The code is available at https://github.com/jiankliu/HCLBind.
- Abstract(参考訳): タンパク質-リガンド結合親和性を予測することは、ドメイン間ダイナミクスが分子認識を制御している多ドメインタンパク質にとって依然として難解である。
既存の幾何学的深層学習法は、タンパク質をモノリシックな静的グラフとして扱うのが一般的である。
そこで我々は,幾何学的表現学習を親和性回帰から分離する自己教師型フレームワークであるHCLBindを紹介した。
HCLBindは、Q-BioLiPデータベース上の一般から特定の事前学習パラダイムを利用して、堅牢な物理文法のバインディングを学ぶ。
モデルでは、単一ドメインタンパク質のタンパク質座標摂動と、多ドメイン複合体のドメイン間回転によるグローバルコンフォメーション幾何学を通して、局所的な物理化学的制約を学習する。
我々のハイブリッドアーキテクチャはドメインゲートグラフアテンションネットワークとクロスモーダルアテンションを統合し、ドメインインターフェースを明示的に優先順位付けします。
さらに,タンパク質およびリガンド基盤モデルにLoRAを用い,進化的知識を保ちながら効率的な最適化を実現する。
PDBBindの実験は、HCLBindが識別インタフェースの特徴を効果的に学習し、標準教師付き学習の限界を克服し、堅牢な不確実性推定を提供することを示した。
コードはhttps://github.com/jiankliu/HCLBind.comで入手できる。
関連論文リスト
- Proteo-R1: Reasoning Foundation Models for De Novo Protein Design [129.2825640976092]
推論誘導型タンパク質設計フレームワークであるbfProteo-R1を紹介する。
アンフェロメトリ生成から分子内理解を分離する。
Proteo-R1は、最新の幾何学的生成モデルと推論の安定、解釈可能、モジュール的な統合を実現する。
論文 参考訳(メタデータ) (2026-05-01T06:52:27Z) - Scaling Atomistic Protein Binder Design with Generative Pretraining and Test-Time Compute [64.59043351161004]
両パラダイムを統一する新規な完全原子結合体生成法であるProteina-Complexaを提案する。
Proteina-Complexa は計算バインダー設計ベンチマークにおける新しい技術状態を設定する。
また, 界面水素結合最適化, フォールドクラス誘導結合体生成, 小分子ターゲットへの拡張, 酵素設計タスクについても述べる。
論文 参考訳(メタデータ) (2026-03-30T01:54:03Z) - Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles [74.32932832937618]
我々は、微調整の前に幾何学学習を前もってロードする幾何学事前学習フレームワークであるtextbfRigidSSL$(textitRigidity-Aware Self-Supervised Learning$)を紹介した。
フェーズI(RigidSSL-Perturb)は、AlphaFoldタンパク質構造データベースから432K構造から、シミュレートされた摂動を持つ幾何学的先行を学習する。
フェーズII(RigidSSL-MD)は、1.3K分子動力学軌道上のこれらの表現を洗練し、物理的に現実的な遷移を捉える。
論文 参考訳(メタデータ) (2026-03-02T21:32:30Z) - Edge-aware GAT-based protein binding site prediction [3.3941174310007685]
生体分子間の結合部位のきめ細かい予測のためのエッジ対応グラフ注意ネットワーク(Edge対応GAT)モデルを提案する。
本手法は原子レベルのグラフを構築し,幾何学的記述子を含む多次元構造特徴を統合する。
本モデルでは,タンパク質結合部位予測のためのROC-AUCの0.93を達成し,いくつかの最先端手法より優れている。
論文 参考訳(メタデータ) (2026-01-05T14:09:57Z) - scMRDR: A scalable and flexible framework for unpaired single-cell multi-omics data integration [53.683726781791385]
単一セルマルチオミクス(ScMRDR)と呼ばれるスケーラブルでフレキシブルな生成フレームワークを導入する。
本手法は, バッチ補正, モダリティアライメント, 生体信号保存の観点から, ベンチマークデータセット上での優れた性能を実現する。
論文 参考訳(メタデータ) (2025-10-28T21:28:39Z) - ProteinAE: Protein Diffusion Autoencoders for Structure Encoding [64.77182442408254]
本稿では,新規かつ合理化されたタンパク質拡散オートエンコーダであるProteinAEを紹介する。
プロテインAEは、タンパク質のバックボーン座標を直接E(3)から連続的でコンパクトな潜在空間にマッピングする。
本研究では,既存のオートエンコーダよりも優れた,最先端の再構築品質を実現することを実証する。
論文 参考訳(メタデータ) (2025-10-12T14:30:32Z) - Deep Manifold Transformation for Protein Representation Learning [42.43017670985785]
ユニバーサルアンダーラインタンパク質アンダーライン変換(DMTPRL)のための新しいアンダーラインディープアンダーラインマンフォールドアンダーライントランスアプローチを提案する。
学習した埋め込みの品質と適応性を改善するために、多様体学習戦略を採用している。
DMTPRL法は、一般的なデータセットをまたいだ様々な下流タスクにおける最先端のベースラインよりも優れている。
論文 参考訳(メタデータ) (2024-01-12T18:38:14Z) - Target-aware Variational Auto-encoders for Ligand Generation with
Multimodal Protein Representation Learning [2.01243755755303]
ターゲット認識型自動エンコーダであるTargetVAEを導入し、任意のタンパク質標的に対する高い結合親和性で生成する。
これは、タンパク質の異なる表現を単一のモデルに統一する最初の試みであり、これは我々がタンパク質マルチモーダルネットワーク(PMN)と呼ぶ。
論文 参考訳(メタデータ) (2023-08-02T12:08:17Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。