論文の概要: Molecular Language Model as Multi-task Generator
- arxiv url: http://arxiv.org/abs/2301.11259v1
- Date: Thu, 26 Jan 2023 17:52:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-27 13:08:40.507006
- Title: Molecular Language Model as Multi-task Generator
- Title(参考訳): マルチタスクジェネレータとしての分子言語モデル
- Authors: Yin Fang, Ningyu Zhang, Zhuo Chen, Xiaohui Fan, Huajun Chen
- Abstract要約: MolGenはトレーニング済みの分子言語モデルで、複数の世代タスクやドメインの知識を効果的に学習し、共有する。
実験により、MollGenはよく知られた分子生成ベンチマークデータセットで優れた性能を得ることができることが示された。
- 参考スコア(独自算出の注目度): 30.738684922996466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecule generation with desired properties has grown immensely in popularity
by disruptively changing the way scientists design molecular structures and
providing support for chemical and materials design. However, despite the
promising outcome, previous machine learning-based deep generative models
suffer from a reliance on complex, task-specific fine-tuning, limited
dimensional latent spaces, or the quality of expert rules. In this work, we
propose MolGen, a pre-trained molecular language model that effectively learns
and shares knowledge across multiple generation tasks and domains.
Specifically, we pre-train MolGen with the chemical language SELFIES on more
than 100 million unlabelled molecules. We further propose multi-task molecular
prefix tuning across several molecular generation tasks and different molecular
domains (synthetic & natural products) with a self-feedback mechanism.
Extensive experiments show that MolGen can obtain superior performances on
well-known molecular generation benchmark datasets. The further analysis
illustrates that MolGen can accurately capture the distribution of molecules,
implicitly learn their structural characteristics, and efficiently explore the
chemical space with the guidance of multi-task molecular prefix tuning. Codes,
datasets, and the pre-trained model will be available in
https://github.com/zjunlp/MolGen.
- Abstract(参考訳): 望ましい性質を持つ分子の生成は、科学者が分子構造を設計する方法を変え、化学や材料の設計をサポートすることによって、非常に人気を高めてきた。
しかし、有望な結果にもかかわらず、従来の機械学習に基づく深層生成モデルは、複雑なタスク固有の微調整、限られた次元の潜在空間、あるいはエキスパートルールの品質に依存している。
本研究では,複数の世代タスクやドメインの知識を効果的に学習し,共有する分子言語モデルであるMolGenを提案する。
具体的には、MolGenを化学言語SELFIESで1億以上の未標識分子で事前訓練する。
さらに,複数の分子生成タスクと異なる分子ドメイン(合成および天然物)にまたがるマルチタスク分子プレフィックスチューニングを自己フィードバック機構で提案する。
大規模な実験により、MollGenはよく知られた分子生成ベンチマークデータセットで優れた性能を得ることができることが示された。
さらに,分子の分布を正確に把握し,その構造的特性を暗黙的に学習し,マルチタスク分子プレフィックスチューニングの指導により効率的に化学空間を探索できることを示した。
コード、データセット、および事前トレーニングされたモデルはhttps://github.com/zjunlp/MolGen.orgで入手できる。
関連論文リスト
- Diffusing on Two Levels and Optimizing for Multiple Properties: A Novel
Approach to Generating Molecules with Desirable Properties [33.2976176283611]
本稿では,分子を望ましい性質で生成する新しい手法を提案する。
望ましい分子断片を得るため,我々は新しい電子効果に基づくフラグメンテーション法を開発した。
提案手法により生成する分子は, 従来のSOTAモデルより有効, 特異性, 新規性, Fr'echet ChemNet Distance (FCD), QED, PlogP を有することを示す。
論文 参考訳(メタデータ) (2023-10-05T11:43:21Z) - Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文 参考訳(メタデータ) (2023-06-21T02:05:48Z) - Empowering Molecule Discovery for Molecule-Caption Translation with
Large Language Models: A ChatGPT Perspective [37.87910278902631]
本稿では,分子キャプション変換のための新しいフレームワーク(textbfMolReGPT)を提案する。
分子理解とテキストベースの分子生成を含む分子キャプション変換によるMollReGPTの有効性を評価する。
論文 参考訳(メタデータ) (2023-06-11T08:16:25Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Fragment-based Sequential Translation for Molecular Optimization [23.152338167332374]
本稿では,分子断片を用いた分子生成のためのフレキシブルな編集パラダイムを提案する。
我々は変分オートエンコーダを用いて分子断片をコヒーレント潜在空間に符号化する。
そして、分子を編集して複雑な化学特性空間を探索する語彙として利用します。
論文 参考訳(メタデータ) (2021-10-26T21:20:54Z) - Graph Energy-based Model for Substructure Preserving Molecular Design [15.939981475281309]
グラフエネルギーベースのモデル(GEM)は、サブ構造を修正し、残りを生成することができます。
実験の結果、化学データセットから訓練されたGEMは、新しい分子を生成することに成功した。
論文 参考訳(メタデータ) (2021-02-09T01:46:12Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。