論文の概要: LLamol: A Dynamic Multi-Conditional Generative Transformer for De Novo
Molecular Design
- arxiv url: http://arxiv.org/abs/2311.14407v1
- Date: Fri, 24 Nov 2023 10:59:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-27 15:26:45.735103
- Title: LLamol: A Dynamic Multi-Conditional Generative Transformer for De Novo
Molecular Design
- Title(参考訳): LLamol:デノボ分子設計のための動的多成分生成変換器
- Authors: Niklas Dobberstein, Astrid Maass, Jan Hamaekers
- Abstract要約: LLamolはLLama 2アーキテクチャに基づいた単一の新しい生成トランスフォーマーモデルである。
モデルが最大4つの条件で単一条件および多条件の有機分子生成を順応的に処理できることを実証する。
より詳しくは,個別に,あるいは数値特性と組み合わせて,トークンシーケンスを条件付けに活用するモデルの能力について紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Generative models have demonstrated substantial promise in Natural Language
Processing (NLP) and have found application in designing molecules, as seen in
General Pretrained Transformer (GPT) models. In our efforts to develop such a
tool for exploring the organic chemical space in search of potentially
electro-active compounds, we present "LLamol", a single novel generative
transformer model based on the LLama 2 architecture, which was trained on a 13M
superset of organic compounds drawn from diverse public sources. To allow for a
maximum flexibility in usage and robustness in view of potentially incomplete
data, we introduce "Stochastic Context Learning" as a new training procedure.
We demonstrate that the resulting model adeptly handles single- and
multi-conditional organic molecule generation with up to four conditions, yet
more are possible. The model generates valid molecular structures in SMILES
notation while flexibly incorporating three numerical and/or one token sequence
into the generative process, just as requested. The generated compounds are
very satisfactory in all scenarios tested. In detail, we showcase the model's
capability to utilize token sequences for conditioning, either individually or
in combination with numerical properties, making LLamol a potent tool for de
novo molecule design, easily expandable with new properties.
- Abstract(参考訳): 生成モデルは自然言語処理(nlp)において有望であり、一般予習トランスフォーマー(gpt)モデルに見られるように分子の設計に応用されている。
このような有機化学空間を探索して電気活性化合物を探索するツールを開発するために,我々は,llama 2アーキテクチャに基づく1つの新しい生成トランスフォーマモデルである「llamol」を提案する。
潜在的な不完全なデータを見て,使用の柔軟性とロバスト性を最大化するために,新しい学習手順として「stochastic context learning」を導入する。
得られたモデルが最大4条件の単条件および多条件有機分子生成を順応的に処理できることを実証する。
このモデルは、3つの数値および/または1つのトークン配列を要求通りに生成プロセスに柔軟に組み込んでSMILES表記の有効な分子構造を生成する。
生成された化合物は、テストされたすべてのシナリオで非常に満足できる。
具体的には,トークン配列を個々に,または数値的性質と組み合わせてコンディショニングに利用し,llamolをde novo分子設計のための強力なツールとし,新たな特性により容易に拡張できるモデルについて紹介する。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Generative Modeling of Molecular Dynamics Trajectories [12.255021091552441]
データからMDの柔軟なマルチタスクサロゲートモデルを学ぶためのパラダイムとして,分子軌道の生成モデルを提案する。
このような生成モデルは,前方シミュレーションや遷移経路サンプリング,軌道上アップサンプリングといった多様なタスクに適応可能であることを示す。
論文 参考訳(メタデータ) (2024-09-26T13:02:28Z) - Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文 参考訳(メタデータ) (2024-03-20T02:15:55Z) - A novel molecule generative model of VAE combined with Transformer for unseen structure generation [0.0]
トランスフォーマーとVAEは強力なモデルとして広く使われているが、構造的ミスマッチと性能的ミスマッチのために組み合わせて使われることは滅多にない。
本研究では, この2つのモデルを組み合わせて, 多様な分子の処理における構造とパラメータの最適化を行うモデルを提案する。
提案モデルでは, 既存の分子生成モデルに匹敵する性能を示し, 未知の構造を持つ分子生成モデルにおいて, はるかに優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-19T08:46:04Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - PrefixMol: Target- and Chemistry-aware Molecule Design via Prefix
Embedding [34.27649279751879]
対象ポケットの状況と様々な化学特性を考慮した新しい生成モデルを構築した。
実験により,本モデルは単条件および多条件の分子生成において良好な制御性を示すことが示された。
論文 参考訳(メタデータ) (2023-02-14T15:27:47Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Augmenting Molecular Deep Generative Models with Topological Data
Analysis Representations [21.237758981760784]
分子のトポロジカルデータ解析(TDA)表現を付加したSMILES変分自動エンコーダ(VAE)を提案する。
実験の結果, このTDA拡張により, SMILES VAEは3次元幾何学と電子特性の複雑な関係を捉えることができることがわかった。
論文 参考訳(メタデータ) (2021-06-08T15:49:21Z) - Learning Neural Generative Dynamics for Molecular Conformation
Generation [89.03173504444415]
分子グラフから分子コンフォメーション(つまり3d構造)を生成する方法を検討した。
分子グラフから有効かつ多様なコンフォーメーションを生成する新しい確率論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-02-20T03:17:58Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。