論文の概要: Learning Protein-Ligand Binding in Hyperbolic Space
- arxiv url: http://arxiv.org/abs/2508.15480v1
- Date: Thu, 21 Aug 2025 11:56:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.306856
- Title: Learning Protein-Ligand Binding in Hyperbolic Space
- Title(参考訳): 双曲空間におけるタンパク質-リガンド結合の学習
- Authors: Jianhui Wang, Wenyu Zhu, Bowen Gao, Xin Hong, Ya-Qin Zhang, Wei-Ying Ma, Yanyan Lan,
- Abstract要約: HypSeekは、タンパク質ポケットと配列をローレンツモデル双曲空間に埋め込む、双曲表現学習フレームワークである。
双曲空間の指数幾何学と負曲率を活用することで、HypSeekは表現的で親和性に敏感な埋め込みを可能にする。
本モードでは,仮想スクリーニングと親和性ランキングを一つのフレームワークに統合し,タンパク質誘導型3towerアーキテクチャを導入する。
- 参考スコア(独自算出の注目度): 21.421085367060343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Protein-ligand binding prediction is central to virtual screening and affinity ranking, two fundamental tasks in drug discovery. While recent retrieval-based methods embed ligands and protein pockets into Euclidean space for similarity-based search, the geometry of Euclidean embeddings often fails to capture the hierarchical structure and fine-grained affinity variations intrinsic to molecular interactions. In this work, we propose HypSeek, a hyperbolic representation learning framework that embeds ligands, protein pockets, and sequences into Lorentz-model hyperbolic space. By leveraging the exponential geometry and negative curvature of hyperbolic space, HypSeek enables expressive, affinity-sensitive embeddings that can effectively model both global activity and subtle functional differences-particularly in challenging cases such as activity cliffs, where structurally similar ligands exhibit large affinity gaps. Our mode unifies virtual screening and affinity ranking in a single framework, introducing a protein-guided three-tower architecture to enhance representational structure. HypSeek improves early enrichment in virtual screening on DUD-E from 42.63 to 51.44 (+20.7%) and affinity ranking correlation on JACS from 0.5774 to 0.7239 (+25.4%), demonstrating the benefits of hyperbolic geometry across both tasks and highlighting its potential as a powerful inductive bias for protein-ligand modeling.
- Abstract(参考訳): タンパク質-リガンド結合予測は、仮想スクリーニングと親和性ランキングの中心であり、薬物発見における2つの基本的な課題である。
最近の検索に基づく手法では、類似性に基づく探索のためにリガンドやタンパク質ポケットをユークリッド空間に埋め込むが、ユークリッドの埋め込みの幾何学は分子間相互作用に固有の階層構造や微細な親和性の変化を捉えるのに失敗することが多い。
本研究では、リガンド、タンパク質ポケット、配列をローレンツモデル双曲空間に埋め込んだ双曲表現学習フレームワークHypSeekを提案する。
双曲空間の指数幾何学と負の曲率を活用することで、ヒップシークは、グローバルな活動と微妙な機能的差異の両方を効果的にモデル化できる表現的で親和性に敏感な埋め込みを可能にする。
我々のモードは仮想スクリーニングと親和性ランキングを一つのフレームワークに統合し、表現構造を強化するためのタンパク質誘導型3-towerアーキテクチャを導入する。
HypSeek は DUD-E 上の仮想スクリーニングの早期強化を 42.63 から 51.44 (+20.7%) に改善し、JACS 上の親和性ランキング相関を 0.5774 から 0.7239 (+25.4%) に改善した。
関連論文リスト
- Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles [74.32932832937618]
幾何学的事前学習フレームワークであるtextbfRigidSSL$(textitRigidity-Aware Self-Supervised Learning$)を紹介した。
フェーズI(RigidSSL-Perturb)は、AlphaFoldタンパク質構造データベースから432K構造から、シミュレートされた摂動を持つ幾何学的先行を学習する。
フェーズII(RigidSSL-MD)は、1.3K分子動力学軌道上のこれらの表現を洗練し、物理的に現実的な遷移を捉える。
論文 参考訳(メタデータ) (2026-03-02T21:32:30Z) - HypRAG: Hyperbolic Dense Retrieval for Retrieval Augmented Generation [30.711145880382286]
HyTE-FHとHyTE-Hは、事前訓練されたユークリッド埋め込みを双曲空間に投影する双曲表現である。
外向きアインシュタイン中間点(英: Outward Einstein Midpoint)は、階層構造を確実に保存する幾何学的なプーリング作用素である。
また,本分析により,ハイパボリック表現はノルムに基づく分離によって文書の特異性を符号化することが明らかとなった。
論文 参考訳(メタデータ) (2026-02-08T00:18:05Z) - LumiX: Structured and Coherent Text-to-Intrinsic Generation [56.659456254026985]
本稿では,コヒーレントテキスト-内在的生成のための構造化拡散フレームワークであるLumiXを紹介する。
LumiXはコヒーレントで物理的に有意義な結果をもたらし、23%のアライメントとより良い選好スコアを得る。
同じフレームワーク内でイメージ条件の分解を行うことも可能だ。
論文 参考訳(メタデータ) (2025-12-02T13:56:02Z) - S$^2$Drug: Bridging Protein Sequence and 3D Structure in Contrastive Representation Learning for Virtual Screening [72.89086338778098]
タンパク質リガンドコントラスト表現学習のための2段階フレームワークを提案する。
最初の段階では、ESM2ベースのバックボーンを用いて、ChemBLでタンパク質配列を事前訓練する。
第2段階では、残基レベルゲーティングモジュールを介して配列と構造情報を融合することでPDBBindを微調整する。
この補助的なタスクは、モデルを誘導し、タンパク質配列内の結合残基を正確に局在させ、それらの3次元空間配列をキャプチャする。
論文 参考訳(メタデータ) (2025-11-10T11:57:47Z) - scMRDR: A scalable and flexible framework for unpaired single-cell multi-omics data integration [53.683726781791385]
単一セルマルチオミクス(ScMRDR)と呼ばれるスケーラブルでフレキシブルな生成フレームワークを導入する。
本手法は, バッチ補正, モダリティアライメント, 生体信号保存の観点から, ベンチマークデータセット上での優れた性能を実現する。
論文 参考訳(メタデータ) (2025-10-28T21:28:39Z) - A Novel Framework for Multi-Modal Protein Representation Learning [13.33566214386641]
2つのコア機構に対処する統合フレームワークであるDAMPE(Diffused and Aligned Multi-modal Protein Embedding)を提案する。
まず、異なるモードの内在的な埋め込み空間間の対応性を確立するための最適輸送(OT)に基づく表現アライメントを提案する。
次に,条件付きグラフ生成(CGG)に基づく情報融合手法を開発した。
論文 参考訳(メタデータ) (2025-10-27T12:33:01Z) - DOOMGAN:High-Fidelity Dynamic Identity Obfuscation Ocular Generative Morphing [3.9440964696313485]
可視光スペクトルの眼の生体計測は、高い精度、スプーフィングに対する耐性、非侵襲的な性質のために顕著なモダリティとして現れている。
モーフィング攻撃 合成生体認証特性 複数の個人の特徴を混ぜ合わせて 生体認証システムの整合性を脅かす
論文 参考訳(メタデータ) (2025-07-23T02:43:49Z) - KEPLA: A Knowledge-Enhanced Deep Learning Framework for Accurate Protein-Ligand Binding Affinity Prediction [60.23701115249195]
KEPLAは、遺伝子オントロジーとリガンド特性の事前知識を統合し、予測性能を向上させる新しいディープラーニングフレームワークである。
2つのベンチマークデータセットの実験では、KEPLAは一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-06-16T08:02:42Z) - Bidirectional Hierarchical Protein Multi-Modal Representation Learning [4.682021474006426]
大規模タンパク質配列で事前訓練されたタンパク質言語モデル(pLM)は、配列ベースタスクにおいて大きな成功を収めた。
3次元構造情報を活用するために設計されたグラフニューラルネットワーク(GNN)は、タンパク質関連予測タスクにおいて有望な一般化を示している。
本稿では、よりリッチで包括的なタンパク質表現を捉えるために、双方向かつ階層的な(双階層的な)融合アプローチを提案する。
論文 参考訳(メタデータ) (2025-04-07T06:47:49Z) - GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - Hyperbolic Image-and-Pointcloud Contrastive Learning for 3D Classification [14.439996427728483]
双曲型画像・ポイントクラウドコントラスト学習法(HyperIPC)を提案する。
モジュラー内分岐に対しては、点雲の双曲的埋め込み表現を探索するために、本質的な幾何学的構造に依存する。
クロスモーダルブランチでは、画像を利用してポイントクラウドをガイドし、強力なセマンティック階層的相関を確立する。
論文 参考訳(メタデータ) (2024-09-24T07:13:37Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - From Static to Dynamic Structures: Improving Binding Affinity Prediction with Graph-Based Deep Learning [40.83037811977803]
Dynaformerは、タンパク質-リガンド結合親和性を予測するために開発されたグラフベースのディープラーニングモデルである。
CASF-2016ベンチマークデータセットでは、最先端のスコアとランキングの能力を示している。
熱ショックタンパク質90(HSP90)の仮想スクリーニングにおいて、20の候補を同定し、それらの結合親和性を実験的に検証する。
論文 参考訳(メタデータ) (2022-08-19T14:55:12Z) - Hyperbolic Neural Networks++ [66.16106727715061]
ニューラルネットワークの基本成分を1つの双曲幾何モデル、すなわちポアンカーの球モデルで一般化する。
実験により, 従来の双曲成分と比較してパラメータ効率が優れ, ユークリッド成分よりも安定性と性能が優れていた。
論文 参考訳(メタデータ) (2020-06-15T08:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。