論文の概要: Domain-Agnostic Molecular Generation with Self-feedback
- arxiv url: http://arxiv.org/abs/2301.11259v5
- Date: Mon, 2 Oct 2023 15:17:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-03 20:27:50.727274
- Title: Domain-Agnostic Molecular Generation with Self-feedback
- Title(参考訳): 自己フィードバックによるドメイン非依存的分子生成
- Authors: Yin Fang, Ningyu Zhang, Zhuo Chen, Lingbing Guo, Xiaohui Fan, Huajun
Chen
- Abstract要約: MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
MolGenは、深い構造的および文法的な洞察を内部化する。
私たちの自己フィードバックパラダイムは、分子幻覚からモデルを引き離す」
- 参考スコア(独自算出の注目度): 44.063584808910896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The generation of molecules with desired properties has gained tremendous
popularity, revolutionizing the way scientists design molecular structures and
providing valuable support for chemical and drug design. However, despite the
potential of language models in molecule generation, they face numerous
challenges such as the generation of syntactically or chemically flawed
molecules, narrow domain focus, and limitations in creating diverse and
directionally feasible molecules due to a dearth of annotated data or external
molecular databases. To tackle these challenges, we introduce MolGen, a
pre-trained molecular language model tailored specifically for molecule
generation. Through the reconstruction of over 100 million molecular SELFIES,
MolGen internalizes profound structural and grammatical insights. This is
further enhanced by domain-agnostic molecular prefix tuning, fostering robust
knowledge transfer across diverse domains. Importantly, our self-feedback
paradigm steers the model away from ``molecular hallucinations'', ensuring
alignment between the model's estimated probabilities and real-world chemical
preferences. Extensive experiments on well-known benchmarks underscore MolGen's
optimization capabilities in properties such as penalized logP, QED, and
molecular docking. Additional analyses affirm its proficiency in accurately
capturing molecule distributions, discerning intricate structural patterns, and
efficiently exploring the chemical space. Code is available at
https://github.com/zjunlp/MolGen.
- Abstract(参考訳): 望ましい性質を持つ分子の生成は、科学者が分子構造を設計する方法に革命をもたらし、化学や薬品の設計に価値ある支援を提供するという大きな人気を集めている。
しかし、分子生成における言語モデルの可能性にもかかわらず、構文的または化学的に欠陥のある分子の生成、狭い領域の焦点、そして注釈付きデータや外部の分子データベースによって多様で方向的に実現可能な分子を作成する際の制限など、多くの課題に直面している。
これらの課題に対処するために,分子生成に特化した分子言語モデルであるMolGenを紹介する。
1億以上の分子SELFIESを再構築することで、モルゲンは深い構造的および文法的な洞察を内包する。
これはドメインに依存しない分子プレフィックスチューニングによってさらに強化され、多様なドメイン間の堅牢な知識伝達を促進する。
重要なことに、私たちの自己フィードバックパラダイムは、モデルを‘分子幻覚’から遠ざけ、モデルの推定確率と実世界の化学選好の調整を確実にします。
良く知られたベンチマークに関する大規模な実験は、Penalized logP、QED、分子ドッキングなどの特性におけるMollGenの最適化能力を裏付けるものである。
さらなる分析により、分子の分布を正確に把握し、複雑な構造パターンを識別し、化学空間を効率的に探索する能力が確認された。
コードはhttps://github.com/zjunlp/molgenで入手できる。
関連論文リスト
- Navigating Chemical Space with Latent Flows [20.95884505685799]
本稿では,分子生成モデルによって学習された潜伏空間をフローを通して移動させることにより,化学空間を横断する新しいフレームワークであるChemFlowを提案する。
我々は,分子操作におけるChemFlowの有効性と,教師なしおよび教師なしの両方の分子発見条件下での単目的および多目的最適化タスクの有効性を検証した。
論文 参考訳(メタデータ) (2024-05-07T03:55:57Z) - Diffusing on Two Levels and Optimizing for Multiple Properties: A Novel
Approach to Generating Molecules with Desirable Properties [33.2976176283611]
本稿では,分子を望ましい性質で生成する新しい手法を提案する。
望ましい分子断片を得るため,我々は新しい電子効果に基づくフラグメンテーション法を開発した。
提案手法により生成する分子は, 従来のSOTAモデルより有効, 特異性, 新規性, Fr'echet ChemNet Distance (FCD), QED, PlogP を有することを示す。
論文 参考訳(メタデータ) (2023-10-05T11:43:21Z) - Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文 参考訳(メタデータ) (2023-06-21T02:05:48Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Fragment-based Sequential Translation for Molecular Optimization [23.152338167332374]
本稿では,分子断片を用いた分子生成のためのフレキシブルな編集パラダイムを提案する。
我々は変分オートエンコーダを用いて分子断片をコヒーレント潜在空間に符号化する。
そして、分子を編集して複雑な化学特性空間を探索する語彙として利用します。
論文 参考訳(メタデータ) (2021-10-26T21:20:54Z) - Graph Energy-based Model for Substructure Preserving Molecular Design [15.939981475281309]
グラフエネルギーベースのモデル(GEM)は、サブ構造を修正し、残りを生成することができます。
実験の結果、化学データセットから訓練されたGEMは、新しい分子を生成することに成功した。
論文 参考訳(メタデータ) (2021-02-09T01:46:12Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。