論文の概要: Representational Alignment with Chemical Induced Fit for Molecular Relational Learning
- arxiv url: http://arxiv.org/abs/2502.07027v1
- Date: Fri, 07 Feb 2025 09:29:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:09:24.075710
- Title: Representational Alignment with Chemical Induced Fit for Molecular Relational Learning
- Title(参考訳): 分子関係学習のための化学誘導フィットを用いた表現アライメント
- Authors: Peiliang Zhang, Jingling Yuan, Qing Xie, Yongjun Zhu, Lin Li,
- Abstract要約: 分子学習学習(MRL)は自然科学において、構造的特徴を抽出することによって分子対間の予測に広く応用されている。
注意機構による部分構造表現の整合性は 化学知識からのガイダンスを欠いている
ReAlignFitは化学誘起Fit誘導誘導バイアスを導入することでMRLのサブ構造表現を動的に調整する。
- 参考スコア(独自算出の注目度): 8.210187365702119
- License:
- Abstract: Molecular Relational Learning (MRL) is widely applied in natural sciences to predict relationships between molecular pairs by extracting structural features. The representational similarity between substructure pairs determines the functional compatibility of molecular binding sites. Nevertheless, aligning substructure representations by attention mechanisms lacks guidance from chemical knowledge, resulting in unstable model performance in chemical space (\textit{e.g.}, functional group, scaffold) shifted data. With theoretical justification, we propose the \textbf{Re}presentational \textbf{Align}ment with Chemical Induced \textbf{Fit} (ReAlignFit) to enhance the stability of MRL. ReAlignFit dynamically aligns substructure representation in MRL by introducing chemical Induced Fit-based inductive bias. In the induction process, we design the Bias Correction Function based on substructure edge reconstruction to align representations between substructure pairs by simulating chemical conformational changes (dynamic combination of substructures). ReAlignFit further integrates the Subgraph Information Bottleneck during fit process to refine and optimize substructure pairs exhibiting high chemical functional compatibility, leveraging them to generate molecular embeddings. Experimental results on nine datasets demonstrate that ReAlignFit outperforms state-of-the-art models in two tasks and significantly enhances model's stability in both rule-shifted and scaffold-shifted data distributions.
- Abstract(参考訳): 分子関係学習(MRL)は、構造的特徴を抽出することによって分子対の関係を予測するために、自然科学に広く応用されている。
サブ構造対間の表現的類似性は、分子結合部位の機能的整合性を決定する。
それでも、アテンション機構による部分構造表現の整合は、化学知識からのガイダンスを欠くため、化学空間における不安定なモデル性能(官能基、足場)がシフトした。
理論的正当化により、MRLの安定性を高めるために、Chemical induced \textbf{Fit} (ReAlignFit) を用いた \textbf{Re}presentational \textbf{Align}ment を提案する。
ReAlignFitは化学誘起Fit誘導誘導バイアスを導入することでMRLのサブ構造表現を動的に調整する。
誘導過程において, 部分構造のエッジ再構成に基づくバイアス補正関数を設計し, 化学的構造変化(部分構造の動的結合)をシミュレートすることで, 部分構造対間の表現を整列させる。
ReAlignFitはさらに、適合プロセス中にサブグラフ情報ボトルネックを統合して、高い化学機能互換性を示すサブ構造対を洗練、最適化し、それらを利用して分子埋め込みを生成する。
9つのデータセットの実験結果から、ReAlignFitは2つのタスクにおける最先端モデルよりも優れており、ルールシフトと足場シフトの両方のデータ分布におけるモデルの安定性を大幅に向上することが示された。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.946648071157618]
構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。
我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。
次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文 参考訳(メタデータ) (2024-04-02T14:44:02Z) - Diffusion-Driven Generative Framework for Molecular Conformation
Prediction [0.66567375919026]
機械学習の急速な進歩は、この文脈における予測モデリングの精度に革命をもたらした。
本研究は,最先端な生成手法を提案する。
メソッドは原子を独立した実体とみなし、拡散の逆転を導くのに優れている。
論文 参考訳(メタデータ) (2023-12-22T11:49:39Z) - SE(3)-Invariant Multiparameter Persistent Homology for Chiral-Sensitive
Molecular Property Prediction [1.534667887016089]
多パラメータ持続ホモロジー(MPPH)を用いた新しい分子指紋生成法を提案する。
この技術は、正確な分子特性予測が不可欠である薬物発見と材料科学において、かなりの重要性を持っている。
分子特性の予測における既存の最先端手法よりも優れた性能を示し,MoleculeNetベンチマークで広範囲な評価を行った。
論文 参考訳(メタデータ) (2023-12-12T09:33:54Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Shift-Robust Molecular Relational Learning with Causal Substructure [5.319553007291377]
分子関係学習における分布シフトに頑健なCMRLを提案する。
まず、分子科学の分野知識に基づいて因果関係を仮定し、変数間の関係を明らかにする構造因果モデル(SCM)を構築する。
本モデルは, 因果的部分構造から学習し, 化学反応と突発的に相関する短絡的部分構造の共役効果を緩和する。
論文 参考訳(メタデータ) (2023-05-29T04:02:10Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Semi-Supervised GCN for learning Molecular Structure-Activity
Relationships [4.468952886990851]
そこで本稿では,半教師付き学習を用いたグラフ-グラフ間ニューラルネットワークの学習手法を提案する。
最終目標として、我々のアプローチは、アクティビティ崖、リード最適化、デノボドラッグデザインといった問題に対処するための貴重なツールとなる可能性がある。
論文 参考訳(メタデータ) (2022-01-25T09:09:43Z) - Learning Neural Generative Dynamics for Molecular Conformation
Generation [89.03173504444415]
分子グラフから分子コンフォメーション(つまり3d構造)を生成する方法を検討した。
分子グラフから有効かつ多様なコンフォーメーションを生成する新しい確率論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-02-20T03:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。