論文の概要: LLamol: A Dynamic Multi-Conditional Generative Transformer for De Novo
Molecular Design
- arxiv url: http://arxiv.org/abs/2311.14407v1
- Date: Fri, 24 Nov 2023 10:59:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-27 15:26:45.735103
- Title: LLamol: A Dynamic Multi-Conditional Generative Transformer for De Novo
Molecular Design
- Title(参考訳): LLamol:デノボ分子設計のための動的多成分生成変換器
- Authors: Niklas Dobberstein, Astrid Maass, Jan Hamaekers
- Abstract要約: LLamolはLLama 2アーキテクチャに基づいた単一の新しい生成トランスフォーマーモデルである。
モデルが最大4つの条件で単一条件および多条件の有機分子生成を順応的に処理できることを実証する。
より詳しくは,個別に,あるいは数値特性と組み合わせて,トークンシーケンスを条件付けに活用するモデルの能力について紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Generative models have demonstrated substantial promise in Natural Language
Processing (NLP) and have found application in designing molecules, as seen in
General Pretrained Transformer (GPT) models. In our efforts to develop such a
tool for exploring the organic chemical space in search of potentially
electro-active compounds, we present "LLamol", a single novel generative
transformer model based on the LLama 2 architecture, which was trained on a 13M
superset of organic compounds drawn from diverse public sources. To allow for a
maximum flexibility in usage and robustness in view of potentially incomplete
data, we introduce "Stochastic Context Learning" as a new training procedure.
We demonstrate that the resulting model adeptly handles single- and
multi-conditional organic molecule generation with up to four conditions, yet
more are possible. The model generates valid molecular structures in SMILES
notation while flexibly incorporating three numerical and/or one token sequence
into the generative process, just as requested. The generated compounds are
very satisfactory in all scenarios tested. In detail, we showcase the model's
capability to utilize token sequences for conditioning, either individually or
in combination with numerical properties, making LLamol a potent tool for de
novo molecule design, easily expandable with new properties.
- Abstract(参考訳): 生成モデルは自然言語処理(nlp)において有望であり、一般予習トランスフォーマー(gpt)モデルに見られるように分子の設計に応用されている。
このような有機化学空間を探索して電気活性化合物を探索するツールを開発するために,我々は,llama 2アーキテクチャに基づく1つの新しい生成トランスフォーマモデルである「llamol」を提案する。
潜在的な不完全なデータを見て,使用の柔軟性とロバスト性を最大化するために,新しい学習手順として「stochastic context learning」を導入する。
得られたモデルが最大4条件の単条件および多条件有機分子生成を順応的に処理できることを実証する。
このモデルは、3つの数値および/または1つのトークン配列を要求通りに生成プロセスに柔軟に組み込んでSMILES表記の有効な分子構造を生成する。
生成された化合物は、テストされたすべてのシナリオで非常に満足できる。
具体的には,トークン配列を個々に,または数値的性質と組み合わせてコンディショニングに利用し,llamolをde novo分子設計のための強力なツールとし,新たな特性により容易に拡張できるモデルについて紹介する。
関連論文リスト
- A novel molecule generative model of VAE combined with Transformer [0.0]
トランスフォーマーとVAEは強力なモデルとして広く使われているが、構造的ミスマッチと性能的ミスマッチのために組み合わせて使われることは滅多にない。
本研究では, この2つのモデルを組み合わせて, 多様な分子の処理における構造とパラメータの最適化を行うモデルを提案する。
提案モデルでは, 既存の分子生成モデルに匹敵する性能を示し, 未知の構造を持つ分子生成モデルにおいて, はるかに優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-19T08:46:04Z) - Learning Over Molecular Conformer Ensembles: Datasets and Benchmarks [45.9401235464876]
コンフォーマーアンサンブルを用いた学習の可能性を徹底的に評価するための,最初のMoleculAR Conformer Ensemble Learningベンチマークを導入する。
その結果,コンバータ空間からの直接学習は,様々なタスクやモデルの性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-09-29T20:06:46Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - PrefixMol: Target- and Chemistry-aware Molecule Design via Prefix
Embedding [34.27649279751879]
対象ポケットの状況と様々な化学特性を考慮した新しい生成モデルを構築した。
実験により,本モデルは単条件および多条件の分子生成において良好な制御性を示すことが示された。
論文 参考訳(メタデータ) (2023-02-14T15:27:47Z) - Bidirectional Generation of Structure and Properties Through a Single
Molecular Foundation Model [44.60174246341653]
本稿では, 構造と生化学的性質を組み込んだ, 新規なマルチモーダル分子事前学習モデルを提案する。
提案するデータハンドリングおよびトレーニング目的のモデルパイプラインは、共通埋め込み空間における構造/プロパティの特徴を整合させる。
これらのコントリビューションは相乗的知識を生み出し、単一のモデルでマルチモーダルと非モーダルの両方の下流タスクに取り組むことができる。
論文 参考訳(メタデータ) (2022-11-19T05:16:08Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Augmenting Molecular Deep Generative Models with Topological Data
Analysis Representations [21.237758981760784]
分子のトポロジカルデータ解析(TDA)表現を付加したSMILES変分自動エンコーダ(VAE)を提案する。
実験の結果, このTDA拡張により, SMILES VAEは3次元幾何学と電子特性の複雑な関係を捉えることができることがわかった。
論文 参考訳(メタデータ) (2021-06-08T15:49:21Z) - Learning Neural Generative Dynamics for Molecular Conformation
Generation [89.03173504444415]
分子グラフから分子コンフォメーション(つまり3d構造)を生成する方法を検討した。
分子グラフから有効かつ多様なコンフォーメーションを生成する新しい確率論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-02-20T03:17:58Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。