論文の概要: Domain-Agnostic Molecular Generation with Chemical Feedback
- arxiv url: http://arxiv.org/abs/2301.11259v6
- Date: Mon, 4 Mar 2024 12:54:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 03:57:11.999213
- Title: Domain-Agnostic Molecular Generation with Chemical Feedback
- Title(参考訳): 化学フィードバックによるドメイン非依存的分子生成
- Authors: Yin Fang, Ningyu Zhang, Zhuo Chen, Lingbing Guo, Xiaohui Fan, Huajun
Chen
- Abstract要約: MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。
我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
- 参考スコア(独自算出の注目度): 44.063584808910896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The generation of molecules with desired properties has become increasingly
popular, revolutionizing the way scientists design molecular structures and
providing valuable support for chemical and drug design. However, despite the
potential of language models in molecule generation, they face challenges such
as generating syntactically or chemically flawed molecules, having narrow
domain focus, and struggling to create diverse and feasible molecules due to
limited annotated data or external molecular databases. To tackle these
challenges, we introduce MolGen, a pre-trained molecular language model
tailored specifically for molecule generation. Through the reconstruction of
over 100 million molecular SELFIES, MolGen internalizes structural and
grammatical insights. This is further enhanced by domain-agnostic molecular
prefix tuning, fostering robust knowledge transfer across diverse domains.
Importantly, our chemical feedback paradigm steers the model away from
molecular hallucinations, ensuring alignment between the model's estimated
probabilities and real-world chemical preferences. Extensive experiments on
well-known benchmarks underscore MolGen's optimization capabilities in
properties such as penalized logP, QED, and molecular docking. Additional
analyses confirm its proficiency in accurately capturing molecule
distributions, discerning intricate structural patterns, and efficiently
exploring the chemical space. Code is available at
https://github.com/zjunlp/MolGen.
- Abstract(参考訳): 望ましい性質を持つ分子の生成は、科学者が分子構造を設計し、化学物質や医薬品の設計に貴重な支援を提供する方法に革命をもたらした。
しかし、分子生成における言語モデルの可能性にもかかわらず、構文的または化学的に欠陥のある分子を生成すること、ドメインの焦点が狭いこと、アノテートされたデータや外部の分子データベースによって多様で実現可能な分子を作るのに苦労することといった課題に直面している。
これらの課題に対処するために,分子生成に特化した分子言語モデルであるMolGenを紹介する。
1億以上の分子SELFIESを再構築することで、モルゲンは構造的および文法的な洞察を内部化する。
これはドメインに依存しない分子プレフィックスチューニングによってさらに強化され、多様なドメイン間の堅牢な知識伝達を促進する。
重要なことに、我々の化学フィードバックパラダイムは、モデルが分子幻覚から遠ざけ、モデルの推定確率と実世界の化学選好の一致を確実にする。
良く知られたベンチマークに関する大規模な実験は、Penalized logP、QED、分子ドッキングなどの特性におけるMollGenの最適化能力を裏付けるものである。
さらなる分析により、分子の分布を正確に把握し、複雑な構造パターンを識別し、化学空間を効率的に探索する能力が確認された。
コードはhttps://github.com/zjunlp/molgenで入手できる。
関連論文リスト
- Diffusing on Two Levels and Optimizing for Multiple Properties: A Novel
Approach to Generating Molecules with Desirable Properties [33.2976176283611]
本稿では,分子を望ましい性質で生成する新しい手法を提案する。
望ましい分子断片を得るため,我々は新しい電子効果に基づくフラグメンテーション法を開発した。
提案手法により生成する分子は, 従来のSOTAモデルより有効, 特異性, 新規性, Fr'echet ChemNet Distance (FCD), QED, PlogP を有することを示す。
論文 参考訳(メタデータ) (2023-10-05T11:43:21Z) - Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文 参考訳(メタデータ) (2023-06-21T02:05:48Z) - Empowering Molecule Discovery for Molecule-Caption Translation with
Large Language Models: A ChatGPT Perspective [37.87910278902631]
本稿では,分子キャプション変換のための新しいフレームワーク(textbfMolReGPT)を提案する。
分子理解とテキストベースの分子生成を含む分子キャプション変換によるMollReGPTの有効性を評価する。
論文 参考訳(メタデータ) (2023-06-11T08:16:25Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Fragment-based Sequential Translation for Molecular Optimization [23.152338167332374]
本稿では,分子断片を用いた分子生成のためのフレキシブルな編集パラダイムを提案する。
我々は変分オートエンコーダを用いて分子断片をコヒーレント潜在空間に符号化する。
そして、分子を編集して複雑な化学特性空間を探索する語彙として利用します。
論文 参考訳(メタデータ) (2021-10-26T21:20:54Z) - Graph Energy-based Model for Substructure Preserving Molecular Design [15.939981475281309]
グラフエネルギーベースのモデル(GEM)は、サブ構造を修正し、残りを生成することができます。
実験の結果、化学データセットから訓練されたGEMは、新しい分子を生成することに成功した。
論文 参考訳(メタデータ) (2021-02-09T01:46:12Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。