論文の概要: ReactEmbed: A Cross-Domain Framework for Protein-Molecule Representation Learning via Biochemical Reaction Networks
- arxiv url: http://arxiv.org/abs/2501.18278v2
- Date: Thu, 06 Feb 2025 11:18:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:30:08.294417
- Title: ReactEmbed: A Cross-Domain Framework for Protein-Molecule Representation Learning via Biochemical Reaction Networks
- Title(参考訳): ReactEmbed: 生化学反応ネットワークによるタンパク質分子表現学習のためのクロスドメインフレームワーク
- Authors: Amitay Sicherman, Kira Radinsky,
- Abstract要約: この研究は、分子とタンパク質間の相互作用を含む生化学反応を統合することで表現を強化する。
ReactEmbedは、コントラスト学習を通じて統合的な埋め込み空間を作成する新しい方法である。
薬物-標的相互作用,タンパク質-タンパク質相互作用,タンパク質特性予測,分子特性予測など,さまざまなタスクにまたがるReactEmbedの評価を行った。
- 参考スコア(独自算出の注目度): 22.154465616964263
- License:
- Abstract: The challenge in computational biology and drug discovery lies in creating comprehensive representations of proteins and molecules that capture their intrinsic properties and interactions. Traditional methods often focus on unimodal data, such as protein sequences or molecular structures, limiting their ability to capture complex biochemical relationships. This work enhances these representations by integrating biochemical reactions encompassing interactions between molecules and proteins. By leveraging reaction data alongside pre-trained embeddings from state-of-the-art protein and molecule models, we develop ReactEmbed, a novel method that creates a unified embedding space through contrastive learning. We evaluate ReactEmbed across diverse tasks, including drug-target interaction, protein-protein interaction, protein property prediction, and molecular property prediction, consistently surpassing all current state-of-the-art models. Notably, we showcase ReactEmbed's practical utility through successful implementation in lipid nanoparticle-based drug delivery, enabling zero-shot prediction of blood-brain barrier permeability for protein-nanoparticle complexes. The code and comprehensive database of reaction pairs are available for open use at \href{https://github.com/amitaysicherman/ReactEmbed}{GitHub}.
- Abstract(参考訳): 計算生物学と薬物発見の課題は、その固有の性質と相互作用を捉えるタンパク質や分子の包括的表現を作ることである。
従来の手法では、タンパク質配列や分子構造などの一様データに焦点を合わせ、複雑な生化学的関係を捉える能力を制限することが多かった。
この研究は、分子とタンパク質間の相互作用を含む生化学反応を統合することによって、これらの表現を強化する。
現状のタンパク質および分子モデルからの事前学習された埋め込みと並行して反応データを活用することにより、対照的な学習を通して統合的な埋め込み空間を作成する新しい手法であるReactEmbedを開発する。
薬物-標的相互作用,タンパク質-タンパク質相互作用,タンパク質特性予測,分子特性予測など,さまざまなタスクにまたがるReactEmbedの評価を行った。
特に, タンパク質-ナノ粒子複合体における血液脳関門透過性のゼロショット予測を可能にするために, 脂質ナノ粒子による薬物輸送の実現を成功させることにより, ReactEmbedの実用性を示す。
反応ペアのコードと包括的なデータベースは、 \href{https://github.com/amitaysicherman/ReactEmbed}{GitHub}で公開されている。
関連論文リスト
- Docking-Aware Attention: Dynamic Protein Representations through Molecular Context Integration [22.154465616964263]
動的にコンテキスト依存的なタンパク質表現を生成する新しいアーキテクチャであるDocking-Aware Attention (DAA)を提案する。
本手法は,従来の最先端手法よりも優れた酵素反応予測法である。
論文 参考訳(メタデータ) (2025-02-03T15:52:38Z) - Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - UniIF: Unified Molecule Inverse Folding [67.60267592514381]
全分子の逆折り畳みのための統一モデルUniIFを提案する。
提案手法は,全タスクにおける最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-05-29T10:26:16Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Exploiting Hierarchical Interactions for Protein Surface Learning [52.10066114039307]
本質的には、タンパク質表面のポテンシャル関数部位は、幾何学的特徴と化学的特徴の両方によって決定される。
本稿では,ディープラーニング技術,すなわち階層型化学・幾何学的特徴相互作用ネットワーク(HCGNet)に基づく原則的フレームワークを提案する。
提案手法は,現場予測タスクが2.3%,インタラクションマッチングタスクが3.2%,従来の最先端手法が2.3%向上した。
論文 参考訳(メタデータ) (2024-01-17T14:10:40Z) - Protein-ligand binding representation learning from fine-grained
interactions [29.965890962846093]
本稿では,タンパク質-リガンド結合表現を自己教師付き学習方式で学習することを提案する。
この自己教師付き学習問題は、決定的結合複素構造の予測として定式化される。
様々なバインディングタスクに対して,本手法の優位性を示す実験を行った。
論文 参考訳(メタデータ) (2023-11-09T01:33:09Z) - Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias [0.0]
本稿では,対話データセットからユニークなペアを抽出し,非バイアス付き機械学習のための非冗長なペアデータを生成する手法を提案する。
我々は,タンパク質のコード遺伝子のカオスゲーム表現から相互作用を学習し,予測できる畳み込みニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2023-10-23T10:02:23Z) - Growing ecosystem of deep learning methods for modeling
protein$\unicode{x2013}$protein interactions [0.0]
本稿では,タンパク質相互作用をモデル化する深層学習手法のエコシステムを論じる。
新たな相互作用を発見し、物理的なメカニズムを調節し、エンジニアのバインダーがそれらの機能を解き放つ機会がある。
論文 参考訳(メタデータ) (2023-10-10T15:53:27Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。