論文の概要: Learning Latent Space Energy-Based Prior Model for Molecule Generation
- arxiv url: http://arxiv.org/abs/2010.09351v1
- Date: Mon, 19 Oct 2020 09:34:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 22:34:42.788605
- Title: Learning Latent Space Energy-Based Prior Model for Molecule Generation
- Title(参考訳): 遅延宇宙エネルギーに基づく分子生成の事前学習モデル
- Authors: Bo Pang, Tian Han, Ying Nian Wu
- Abstract要約: 分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
- 参考スコア(独自算出の注目度): 59.875533935578375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep generative models have recently been applied to molecule design. If the
molecules are encoded in linear SMILES strings, modeling becomes convenient.
However, models relying on string representations tend to generate invalid
samples and duplicates. Prior work addressed these issues by building models on
chemically-valid fragments or explicitly enforcing chemical rules in the
generation process. We argue that an expressive model is sufficient to
implicitly and automatically learn the complicated chemical rules from the
data, even if molecules are encoded in simple character-level SMILES strings.
We propose to learn latent space energy-based prior model with SMILES
representation for molecule modeling. Our experiments show that our method is
able to generate molecules with validity and uniqueness competitive with
state-of-the-art models. Interestingly, generated molecules have structural and
chemical features whose distributions almost perfectly match those of the real
molecules.
- Abstract(参考訳): 深層生成モデルは最近分子設計に応用されている。
分子が線形スマイル文字列でコードされている場合、モデリングは便利になる。
しかし、文字列表現に依存するモデルは、無効なサンプルと重複を生成する傾向がある。
以前の研究は、化学的に有価な断片のモデルを構築したり、生成過程において化学規則を明示的に強制することでこれらの問題に対処した。
単純な文字レベルのSMILES文字列に分子をエンコードしたとしても、表現的モデルは暗黙的にかつ自動的にデータから複雑な化学規則を学習するのに十分であると主張する。
分子モデリングのためのスマイル表現を用いた潜在空間エネルギーに基づく事前モデルを学ぶことを提案する。
本手法は,最先端モデルに匹敵する有効性と一意性を有する分子を生成できることを示す。
興味深いことに、生成した分子は構造的および化学的特徴を持ち、その分布は実際の分子とほぼ完全に一致する。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Chemical Language Model Linker: blending text and molecules with modular adapters [2.2667044928324747]
我々は、ChemLML(ChemLML)という、軽量なアダプタベースの戦略を提案する。
ChemLMLは2つの単一ドメインモデルをブレンドし、テキスト記述から条件付き分子生成を得る。
SMILESとSELFIESのChemLMLにおける分子表現の選択は,条件付き分子生成性能に強い影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2024-10-26T13:40:13Z) - LDMol: Text-to-Molecule Diffusion Model with Structurally Informative Latent Space [55.5427001668863]
テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
LDMolは、学習可能で構造的に有意な特徴空間を生成する分子オートエンコーダを含む。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文 参考訳(メタデータ) (2024-05-28T04:59:13Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - De Novo Molecular Generation with Stacked Adversarial Model [24.83456726428956]
近年, ド・ノボの薬物設計に期待できるアプローチとして, 条件付き生成逆数モデルが提案されている。
本稿では、2つのモデルを重ね合わせることで、既存の対向オートエンコーダモデルを拡張する新しい生成モデルを提案する。
我々の積み重ねられたアプローチは、既知の薬物とより類似した分子と同様に、より有効な分子を生成する。
論文 参考訳(メタデータ) (2021-10-24T14:23:16Z) - Barking up the right tree: an approach to search over molecule synthesis
DAGs [28.13323960125482]
現在の分子の深層生成モデルは合成可能性を無視している。
我々は,現実世界のプロセスをよりよく表現する深い生成モデルを提案する。
我々のアプローチは化学空間をうまくモデル化でき、幅広い多様な分子を生成できることを示します。
論文 参考訳(メタデータ) (2020-12-21T17:35:06Z) - Learning a Continuous Representation of 3D Molecular Structures with
Deep Generative Models [0.0]
生成モデルは、連続的な潜伏空間における分子の表現と最適化を学ぶ全く異なるアプローチである。
原子密度格子を用いた三次元分子構造の深部生成モデルについて述べる。
また、与えられた入力化合物に基づいて多様な分子の集合をサンプリングすることで、有効な薬物様分子の創出の可能性を高めることができる。
論文 参考訳(メタデータ) (2020-10-17T01:15:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。