論文の概要: Domain-Agnostic Molecular Generation with Self-feedback
- arxiv url: http://arxiv.org/abs/2301.11259v4
- Date: Fri, 1 Sep 2023 07:50:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-04 17:09:25.474851
- Title: Domain-Agnostic Molecular Generation with Self-feedback
- Title(参考訳): 自己フィードバックによるドメイン非依存的分子生成
- Authors: Yin Fang, Ningyu Zhang, Zhuo Chen, Xiaohui Fan, Huajun Chen
- Abstract要約: MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
MolGenは1億以上の分子SELFIESを再構成することで、本質的な構造的および文法的な洞察を得る。
MolGenは分子の分布を正確に把握し、構造的特性を暗黙的に学習し、化学空間を効率的に探索することができる。
- 参考スコア(独自算出の注目度): 44.92977547608273
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The generation of molecules with desired properties has gained tremendous
popularity, revolutionizing the way scientists design molecular structures and
providing valuable support for chemical and drug design. However, despite the
potential of language models in molecule generation, they face numerous
challenges such as the generation of syntactically or chemically flawed
molecules, narrow domain focus, and limitations in creating diverse and
directionally feasible molecules due to a dearth of annotated data or external
molecular databases. To this end, we introduce MolGen, a pre-trained molecular
language model tailored specifically for molecule generation. MolGen acquires
intrinsic structural and grammatical insights by reconstructing over 100
million molecular SELFIES, while facilitating knowledge transfer between
different domains through domain-agnostic molecular prefix tuning. Moreover, we
present a self-feedback paradigm that inspires the pre-trained model to align
with the ultimate goal of producing molecules with desirable properties.
Extensive experiments on well-known benchmarks confirm MolGen's optimization
capabilities, encompassing penalized logP, QED, and molecular docking
properties. Further analysis shows that MolGen can accurately capture molecule
distributions, implicitly learn their structural characteristics, and
efficiently explore chemical space. The pre-trained model, codes, and datasets
are publicly available for future research at https://github.com/zjunlp/MolGen.
- Abstract(参考訳): 望ましい性質を持つ分子の生成は、科学者が分子構造を設計する方法に革命をもたらし、化学や薬品の設計に価値ある支援を提供するという大きな人気を集めている。
しかし、分子生成における言語モデルの可能性にもかかわらず、構文的または化学的に欠陥のある分子の生成、狭い領域の焦点、そして注釈付きデータや外部の分子データベースによって多様で方向的に実現可能な分子を作成する際の制限など、多くの課題に直面している。
そこで本研究では,分子生成に特化した分子言語モデルであるMollGenを紹介する。
MolGenは1億以上の分子SELFIESを再構成し、ドメインに依存しない分子プレフィックスチューニングを通じて異なるドメイン間の知識伝達を促進することによって、固有の構造的および文法的な洞察を得る。
さらに,事前学習モデルに刺激を与える自己フィードバックパラダイムを提案し,分子を望ましい性質で生成するという究極の目標と整合させる。
良く知られたベンチマークに関する大規模な実験は、Palalized logP、QED、分子ドッキング特性を含むMollGenの最適化能力を確認している。
さらなる分析により、分子分布を正確に捉え、その構造特性を暗黙的に学習し、効率的に化学空間を探索できることが示されている。
トレーニング済みのモデル、コード、データセットは、https://github.com/zjunlp/MolGen.comで公開されています。
関連論文リスト
- MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories [7.366789601705544]
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。
本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。
この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
論文 参考訳(メタデータ) (2024-11-10T22:00:55Z) - MolTRES: Improving Chemical Language Representation Learning for Molecular Property Prediction [14.353313239109337]
MolTRESは化学言語表現学習フレームワークである。
ジェネレータと識別器のトレーニングが組み込まれており、より難しい例からモデルを学習することができる。
我々のモデルは、一般的な分子特性予測タスクにおける既存の最先端モデルよりも優れています。
論文 参考訳(メタデータ) (2024-07-09T01:14:28Z) - Navigating Chemical Space with Latent Flows [20.95884505685799]
本稿では,分子生成モデルによって学習された潜伏空間をフローを通して移動させることにより,化学空間を横断する新しいフレームワークであるChemFlowを提案する。
我々は,分子操作におけるChemFlowの有効性と,教師なしおよび教師なしの両方の分子発見条件下での単目的および多目的最適化タスクの有効性を検証した。
論文 参考訳(メタデータ) (2024-05-07T03:55:57Z) - From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning [10.025809630976065]
本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。
提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文 参考訳(メタデータ) (2023-11-05T23:47:52Z) - Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文 参考訳(メタデータ) (2023-06-21T02:05:48Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。