論文の概要: Cross-Modality Controlled Molecule Generation with Diffusion Language Model
- arxiv url: http://arxiv.org/abs/2508.14748v1
- Date: Wed, 20 Aug 2025 14:48:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.48769
- Title: Cross-Modality Controlled Molecule Generation with Diffusion Language Model
- Title(参考訳): 拡散言語モデルを用いたクロスモーダル制御分子生成
- Authors: Yunzhe Zhang, Yifei Wang, Khanh Vinh Nguyen, Pengyu Hong,
- Abstract要約: 拡散言語モデル(CMCM-DLM)を用いたクロスモーダル制御分子生成
提案手法は,SCM(Structure Control Module)とPCM(Property Control Module)の2つのトレーニング可能なモジュールを組み込んだ,事前学習拡散モデルに基づく。
第1相は、初期の拡散過程において構造的制約を注入するためにSCMを使用し、分子のバックボーンを効果的に固定する。
第2相は、さらにPCMを導入して、推論の後半段階を誘導し、生成した分子を精製し、それらの化学的性質が指定された標的と一致することを保証する。
- 参考スコア(独自算出の注目度): 14.435311248340824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current SMILES-based diffusion models for molecule generation typically support only unimodal constraint. They inject conditioning signals at the start of the training process and require retraining a new model from scratch whenever the constraint changes. However, real-world applications often involve multiple constraints across different modalities, and additional constraints may emerge over the course of a study. This raises a challenge: how to extend a pre-trained diffusion model not only to support cross-modality constraints but also to incorporate new ones without retraining. To tackle this problem, we propose the Cross-Modality Controlled Molecule Generation with Diffusion Language Model (CMCM-DLM), demonstrated by two distinct cross modalities: molecular structure and chemical properties. Our approach builds upon a pre-trained diffusion model, incorporating two trainable modules, the Structure Control Module (SCM) and the Property Control Module (PCM), and operates in two distinct phases during the generation process. In Phase I, we employs the SCM to inject structural constraints during the early diffusion steps, effectively anchoring the molecular backbone. Phase II builds on this by further introducing PCM to guide the later stages of inference to refine the generated molecules, ensuring their chemical properties match the specified targets. Experimental results on multiple datasets demonstrate the efficiency and adaptability of our approach, highlighting CMCM-DLM's significant advancement in molecular generation for drug discovery applications.
- Abstract(参考訳): 分子生成のための現在のSMILESベースの拡散モデルは、典型的には単調な制約のみをサポートする。
トレーニングプロセスの開始時に条件付け信号を注入し、制約が変わるたびに新しいモデルをスクラッチから再トレーニングする必要がある。
しかしながら、現実世界のアプリケーションは、しばしば異なるモダリティにまたがる複数の制約を伴い、研究の過程で追加の制約が生じることがある。
事前トレーニングされた拡散モデルを拡張して、モダリティを越えた制約をサポートするだけでなく、再トレーニングなしに新しい拡散モデルを組み込む方法という課題を提起する。
この問題に対処するため,分子構造と化学的性質の2つの異なるクロスモーダル性を持つ拡散言語モデル(CMCM-DLM)を提案する。
提案手法は,SCM(Structure Control Module)とPCM(Property Control Module)という2つのトレーニング可能なモジュールを組み込んだ事前学習拡散モデルを構築し,生成過程において2つの異なるフェーズで動作する。
第一相では、初期の拡散過程において構造的制約を注入するためにSCMを使用し、分子のバックボーンを効果的に固定する。
第2相は、さらにPCMを導入して、推論の後半段階を誘導し、生成した分子を精製し、それらの化学的性質が指定された標的と一致することを保証する。
CMCM-DLMの分子生成の進歩が薬物発見への応用に大きく寄与していることを明らかにするために, 提案手法の効率性と適応性を示す実験結果を得た。
関連論文リスト
- AdaptMol: Adaptive Fusion from Sequence String to Topological Structure for Few-shot Drug Discovery [7.338199946027998]
本稿では,Adaptive Multimodal fusion for representationを組み込んだプロトタイプネットワークであるAdaptMolを提案する。
このフレームワークは、グローバルおよび局所的な分子的特徴を動的に統合するための二重レベルアテンション機構を用いる。
5ショットと10ショット設定で一般的に使用される3つのベンチマークの実験は、AdaptMolが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-05-17T07:12:12Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - LDMol: A Text-to-Molecule Diffusion Model with Structurally Informative Latent Space Surpasses AR Models [55.5427001668863]
テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
実験の結果, LDMolはテキストから分子生成ベンチマークにおいて, 既存の自己回帰ベースラインよりも優れていた。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文 参考訳(メタデータ) (2024-05-28T04:59:13Z) - ControlMol: Adding Substructure Control To Molecule Diffusion Models [2.8372258697984627]
条件学習と条件最適化を組み合わせた2段階の訓練手法を提案する。
実験では, ランダムに分割したサブ構造データのみを学習し, より有効で多様な分子を生成することにより, 従来の手法より優れていた。
論文 参考訳(メタデータ) (2024-04-22T14:36:19Z) - AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.946648071157618]
構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。
我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。
次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文 参考訳(メタデータ) (2024-04-02T14:44:02Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - Scaffold-constrained molecular generation [0.0]
SMILESをベースとしたリカレントニューラルネットワーク(Recurrent Neural Network, RNN)生成モデルを構築し, 足場制約付き生成を実現するため, サンプリング手法を改良した。
本稿では,様々なタスクにおいて足場制約付き生成を行う手法について紹介する。
論文 参考訳(メタデータ) (2020-09-15T15:41:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。