論文の概要: LDMol: A Text-to-Molecule Diffusion Model with Structurally Informative Latent Space Surpasses AR Models
- arxiv url: http://arxiv.org/abs/2405.17829v3
- Date: Sat, 31 May 2025 08:53:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-03 20:53:52.83791
- Title: LDMol: A Text-to-Molecule Diffusion Model with Structurally Informative Latent Space Surpasses AR Models
- Title(参考訳): LDMol: 構造的インフォーマティブな遅延空間をARモデルに通過させるテキスト-分子拡散モデル
- Authors: Jinho Chang, Jong Chul Ye,
- Abstract要約: テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
実験の結果, LDMolはテキストから分子生成ベンチマークにおいて, 既存の自己回帰ベースラインよりも優れていた。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
- 参考スコア(独自算出の注目度): 55.5427001668863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the emergence of diffusion models as a frontline generative model, many researchers have proposed molecule generation techniques with conditional diffusion models. However, the unavoidable discreteness of a molecule makes it difficult for a diffusion model to connect raw data with highly complex conditions like natural language. To address this, here we present a novel latent diffusion model dubbed LDMol for text-conditioned molecule generation. By recognizing that the suitable latent space design is the key to the diffusion model performance, we employ a contrastive learning strategy to extract novel feature space from text data that embeds the unique characteristics of the molecule structure. Experiments show that LDMol outperforms the existing autoregressive baselines on the text-to-molecule generation benchmark, being one of the first diffusion models that outperforms autoregressive models in textual data generation with a better choice of the latent domain. Furthermore, we show that LDMol can be applied to downstream tasks such as molecule-to-text retrieval and text-guided molecule editing, demonstrating its versatility as a diffusion model.
- Abstract(参考訳): 拡散モデルが最前線生成モデルとして出現し、多くの研究者が条件付き拡散モデルを用いた分子生成技術を提案している。
しかし、分子の避けられない離散性は、拡散モデルが自然言語のような非常に複雑な条件で生データを繋ぐのを難しくする。
そこで本研究では,テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
拡散モデル性能の鍵は適切な潜在空間設計であることを認識することによって,分子構造の特異な特徴を埋め込んだテキストデータから,新しい特徴空間を抽出するコントラスト学習戦略を採用する。
実験の結果, LDMolはテキストから分子生成ベンチマークにおいて既存の自己回帰ベースラインよりも優れており, テキストデータ生成において自己回帰モデルよりも高い性能を示し, 潜在ドメインの選択が優れている。
さらに, LDMolは, 分子間検索やテキスト誘導分子編集などの下流処理にも適用可能であることを示し, 拡散モデルとしての汎用性を示した。
関連論文リスト
- Diffusion Models for Molecules: A Survey of Methods and Tasks [56.44565051667812]
分子に関する生成タスクは、薬物の発見と材料設計に不可欠である。
拡散モデルは、深い生成モデルの印象的なクラスとして現れている。
本稿では拡散モデルに基づく分子生成法について包括的に調査する。
論文 参考訳(メタデータ) (2025-02-13T17:22:50Z) - MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories [7.366789601705544]
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。
本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。
この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
論文 参考訳(メタデータ) (2024-11-10T22:00:55Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - MING: A Functional Approach to Learning Molecular Generative Models [46.189683355768736]
本稿では,関数表現に基づく分子生成モデル学習のための新しいパラダイムを提案する。
本稿では,関数空間における分子分布を学習する拡散モデルである分子インプリシットニューラルジェネレーション(MING)を提案する。
論文 参考訳(メタデータ) (2024-10-16T13:02:02Z) - SubGDiff: A Subgraph Diffusion Model to Improve Molecular Representation Learning [14.338345772161102]
本稿では,分子サブグラフ情報を拡散に用いた新しい拡散モデルSubGDiffを提案する。
SubGDiffは、サブグラフ予測、期待状態、kステップの同じサブグラフ拡散という3つの重要な技術を採用している。
実験的に、広範囲な下流タスクは、我々のアプローチの優れた性能を示す。
論文 参考訳(メタデータ) (2024-05-09T10:37:33Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Integrating Chemical Language and Molecular Graph in Multimodal Fused Deep Learning for Drug Property Prediction [9.388979080270103]
分子表現の異なる多モード深層学習モデルを構築した。
モノモーダルモデルと比較すると,マルチモーダルフューズドディープラーニング(MMFDL)モデルは単一モデルよりも精度,信頼性,耐雑音性に優れている。
論文 参考訳(メタデータ) (2023-12-29T07:19:42Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - A Survey of Diffusion Models in Natural Language Processing [11.233768932957771]
拡散モデルは、ネットワークや多様体にまたがる情報や信号の拡散を捉える。
本稿は,NLPで使用される拡散モデルの異なる定式化,その強度と限界,それらの応用について論じる。
論文 参考訳(メタデータ) (2023-05-24T03:25:32Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。