論文の概要: Molecular Language Model as Multi-task Generator
- arxiv url: http://arxiv.org/abs/2301.11259v1
- Date: Thu, 26 Jan 2023 17:52:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-27 13:08:40.507006
- Title: Molecular Language Model as Multi-task Generator
- Title(参考訳): マルチタスクジェネレータとしての分子言語モデル
- Authors: Yin Fang, Ningyu Zhang, Zhuo Chen, Xiaohui Fan, Huajun Chen
- Abstract要約: MolGenはトレーニング済みの分子言語モデルで、複数の世代タスクやドメインの知識を効果的に学習し、共有する。
実験により、MollGenはよく知られた分子生成ベンチマークデータセットで優れた性能を得ることができることが示された。
- 参考スコア(独自算出の注目度): 30.738684922996466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecule generation with desired properties has grown immensely in popularity
by disruptively changing the way scientists design molecular structures and
providing support for chemical and materials design. However, despite the
promising outcome, previous machine learning-based deep generative models
suffer from a reliance on complex, task-specific fine-tuning, limited
dimensional latent spaces, or the quality of expert rules. In this work, we
propose MolGen, a pre-trained molecular language model that effectively learns
and shares knowledge across multiple generation tasks and domains.
Specifically, we pre-train MolGen with the chemical language SELFIES on more
than 100 million unlabelled molecules. We further propose multi-task molecular
prefix tuning across several molecular generation tasks and different molecular
domains (synthetic & natural products) with a self-feedback mechanism.
Extensive experiments show that MolGen can obtain superior performances on
well-known molecular generation benchmark datasets. The further analysis
illustrates that MolGen can accurately capture the distribution of molecules,
implicitly learn their structural characteristics, and efficiently explore the
chemical space with the guidance of multi-task molecular prefix tuning. Codes,
datasets, and the pre-trained model will be available in
https://github.com/zjunlp/MolGen.
- Abstract(参考訳): 望ましい性質を持つ分子の生成は、科学者が分子構造を設計する方法を変え、化学や材料の設計をサポートすることによって、非常に人気を高めてきた。
しかし、有望な結果にもかかわらず、従来の機械学習に基づく深層生成モデルは、複雑なタスク固有の微調整、限られた次元の潜在空間、あるいはエキスパートルールの品質に依存している。
本研究では,複数の世代タスクやドメインの知識を効果的に学習し,共有する分子言語モデルであるMolGenを提案する。
具体的には、MolGenを化学言語SELFIESで1億以上の未標識分子で事前訓練する。
さらに,複数の分子生成タスクと異なる分子ドメイン(合成および天然物)にまたがるマルチタスク分子プレフィックスチューニングを自己フィードバック機構で提案する。
大規模な実験により、MollGenはよく知られた分子生成ベンチマークデータセットで優れた性能を得ることができることが示された。
さらに,分子の分布を正確に把握し,その構造的特性を暗黙的に学習し,マルチタスク分子プレフィックスチューニングの指導により効率的に化学空間を探索できることを示した。
コード、データセット、および事前トレーニングされたモデルはhttps://github.com/zjunlp/MolGen.orgで入手できる。
関連論文リスト
- MolTRES: Improving Chemical Language Representation Learning for Molecular Property Prediction [14.353313239109337]
MolTRESは化学言語表現学習フレームワークである。
ジェネレータと識別器のトレーニングが組み込まれており、より難しい例からモデルを学習することができる。
我々のモデルは、一般的な分子特性予測タスクにおける既存の最先端モデルよりも優れています。
論文 参考訳(メタデータ) (2024-07-09T01:14:28Z) - Navigating Chemical Space with Latent Flows [20.95884505685799]
本稿では,分子生成モデルによって学習された潜伏空間をフローを通して移動させることにより,化学空間を横断する新しいフレームワークであるChemFlowを提案する。
我々は,分子操作におけるChemFlowの有効性と,教師なしおよび教師なしの両方の分子発見条件下での単目的および多目的最適化タスクの有効性を検証した。
論文 参考訳(メタデータ) (2024-05-07T03:55:57Z) - From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning [10.025809630976065]
本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。
提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文 参考訳(メタデータ) (2023-11-05T23:47:52Z) - Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文 参考訳(メタデータ) (2023-06-21T02:05:48Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Graph Energy-based Model for Substructure Preserving Molecular Design [15.939981475281309]
グラフエネルギーベースのモデル(GEM)は、サブ構造を修正し、残りを生成することができます。
実験の結果、化学データセットから訓練されたGEMは、新しい分子を生成することに成功した。
論文 参考訳(メタデータ) (2021-02-09T01:46:12Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。