論文の概要: Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model
- arxiv url: http://arxiv.org/abs/2410.13597v1
- Date: Thu, 17 Oct 2024 14:30:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:21:05.632688
- Title: Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model
- Title(参考訳): 拡散言語モデルを用いたテキスト誘導多機能分子最適化
- Authors: Yida Xiong, Kun Li, Weiwei Liu, Jia Wu, Bo Du, Shirui Pan, Wenbin Hu,
- Abstract要約: 変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。
提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
- 参考スコア(独自算出の注目度): 77.50732023411811
- License:
- Abstract: Molecular optimization (MO) is a crucial stage in drug discovery in which task-oriented generated molecules are optimized to meet practical industrial requirements. Existing mainstream MO approaches primarily utilize external property predictors to guide iterative property optimization. However, learning all molecular samples in the vast chemical space is unrealistic for predictors. As a result, errors and noise are inevitably introduced during property prediction due to the nature of approximation. This leads to discrepancy accumulation, generalization reduction and suboptimal molecular candidates. In this paper, we propose a text-guided multi-property molecular optimization method utilizing transformer-based diffusion language model (TransDLM). TransDLM leverages standardized chemical nomenclature as semantic representations of molecules and implicitly embeds property requirements into textual descriptions, thereby preventing error propagation during diffusion process. Guided by physically and chemically detailed textual descriptions, TransDLM samples and optimizes encoded source molecules, retaining core scaffolds of source molecules and ensuring structural similarities. Moreover, TransDLM enables simultaneous sampling of multiple molecules, making it ideal for scalable, efficient large-scale optimization through distributed computation on web platforms. Furthermore, our approach surpasses state-of-the-art methods in optimizing molecular structural similarity and enhancing chemical properties on the benchmark dataset. The code is available at: https://anonymous.4open.science/r/TransDLM-A901.
- Abstract(参考訳): 分子最適化(MO)は、タスク指向の生成分子が工業的要求を満たすように最適化される薬物発見の重要な段階である。
既存のメインストリームMOアプローチは、主に外部プロパティ予測器を使用して反復的なプロパティ最適化を導出する。
しかし、巨大な化学空間における全ての分子サンプルを学習することは予測者にとって非現実的である。
その結果、近似の性質により、特性予測中にエラーやノイズが必然的に導入される。
これにより、不一致の蓄積、一般化還元、および準最適分子候補が生じる。
本稿では,変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
TransDLMは、標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込み、拡散過程におけるエラーの伝播を防ぐ。
物理的、化学的に詳細なテキスト記述によってガイドされ、TransDLMは、コード化されたソース分子をサンプリングし、最適化し、ソース分子の中核の足場を保持し、構造的類似性を確保する。
さらに、TransDLMは複数の分子の同時サンプリングを可能にし、Webプラットフォーム上での分散計算によるスケーラブルで効率的な大規模最適化に最適である。
さらに,本手法は,分子構造類似性を最適化し,ベンチマークデータセットの化学的特性を向上するための最先端手法を超越している。
コードは以下の通りである。 https://anonymous.4open.science/r/TransDLM-A901。
関連論文リスト
- Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - XMOL: Explainable Multi-property Optimization of Molecules [2.320539066224081]
複数の分子特性を同時に最適化するために,分子のマルチプロパティ最適化(XMOL)を提案する。
我々のアプローチは、最先端の幾何学的拡散モデルに基づいており、それらをマルチプロパティ最適化に拡張している。
最適化プロセス全体を通して解釈的および説明可能な技術を統合する。
論文 参考訳(メタデータ) (2024-09-12T06:35:04Z) - Small Molecule Optimization with Large Language Models [17.874902319523663]
計算特性を持つ110M分子の新規コーパスを微調整した2つの言語モデルについて述べる。
ブラックボックスオラクルへのアクセスに制限がある場合、言語モデルを利用して任意の特性の分子を最適化する新しい最適化アルゴリズムを導入する。
論文 参考訳(メタデータ) (2024-07-26T17:51:33Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Molecule Optimization via Fragment-based Generative Models [21.888942129750124]
創薬において、分子最適化は、望ましい薬物特性の観点から薬候補をより良いものにするための重要なステップである。
本稿では,計算量最適化分子に対する革新的シリコアプローチを提案し,最適化分子グラフを生成するために問題を定式化する。
我々の生成モデルはフラグメントベースの薬物設計の重要なアイデアに従い、小さなフラグメントを変更することで分子を最適化します。
論文 参考訳(メタデータ) (2020-12-08T05:52:16Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - Predicting drug properties with parameter-free machine learning:
Pareto-Optimal Embedded Modeling (POEM) [0.13854111346209866]
POEMは、最適化を必要とせず、信頼性の高い予測モデルを生成するために開発された非パラメトリックな教師付きMLアルゴリズムである。
我々は、業界標準のMLアルゴリズムと比較してPOEMをベンチマークし、17の分類タスクにまたがって結果を公表する。
論文 参考訳(メタデータ) (2020-02-11T17:20:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。