論文の概要: Domain-Agnostic Molecular Generation with Self-feedback
- arxiv url: http://arxiv.org/abs/2301.11259v5
- Date: Mon, 2 Oct 2023 15:17:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-03 20:27:50.727274
- Title: Domain-Agnostic Molecular Generation with Self-feedback
- Title(参考訳): 自己フィードバックによるドメイン非依存的分子生成
- Authors: Yin Fang, Ningyu Zhang, Zhuo Chen, Lingbing Guo, Xiaohui Fan, Huajun
Chen
- Abstract要約: MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
MolGenは、深い構造的および文法的な洞察を内部化する。
私たちの自己フィードバックパラダイムは、分子幻覚からモデルを引き離す」
- 参考スコア(独自算出の注目度): 44.063584808910896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The generation of molecules with desired properties has gained tremendous
popularity, revolutionizing the way scientists design molecular structures and
providing valuable support for chemical and drug design. However, despite the
potential of language models in molecule generation, they face numerous
challenges such as the generation of syntactically or chemically flawed
molecules, narrow domain focus, and limitations in creating diverse and
directionally feasible molecules due to a dearth of annotated data or external
molecular databases. To tackle these challenges, we introduce MolGen, a
pre-trained molecular language model tailored specifically for molecule
generation. Through the reconstruction of over 100 million molecular SELFIES,
MolGen internalizes profound structural and grammatical insights. This is
further enhanced by domain-agnostic molecular prefix tuning, fostering robust
knowledge transfer across diverse domains. Importantly, our self-feedback
paradigm steers the model away from ``molecular hallucinations'', ensuring
alignment between the model's estimated probabilities and real-world chemical
preferences. Extensive experiments on well-known benchmarks underscore MolGen's
optimization capabilities in properties such as penalized logP, QED, and
molecular docking. Additional analyses affirm its proficiency in accurately
capturing molecule distributions, discerning intricate structural patterns, and
efficiently exploring the chemical space. Code is available at
https://github.com/zjunlp/MolGen.
- Abstract(参考訳): 望ましい性質を持つ分子の生成は、科学者が分子構造を設計する方法に革命をもたらし、化学や薬品の設計に価値ある支援を提供するという大きな人気を集めている。
しかし、分子生成における言語モデルの可能性にもかかわらず、構文的または化学的に欠陥のある分子の生成、狭い領域の焦点、そして注釈付きデータや外部の分子データベースによって多様で方向的に実現可能な分子を作成する際の制限など、多くの課題に直面している。
これらの課題に対処するために,分子生成に特化した分子言語モデルであるMolGenを紹介する。
1億以上の分子SELFIESを再構築することで、モルゲンは深い構造的および文法的な洞察を内包する。
これはドメインに依存しない分子プレフィックスチューニングによってさらに強化され、多様なドメイン間の堅牢な知識伝達を促進する。
重要なことに、私たちの自己フィードバックパラダイムは、モデルを‘分子幻覚’から遠ざけ、モデルの推定確率と実世界の化学選好の調整を確実にします。
良く知られたベンチマークに関する大規模な実験は、Penalized logP、QED、分子ドッキングなどの特性におけるMollGenの最適化能力を裏付けるものである。
さらなる分析により、分子の分布を正確に把握し、複雑な構造パターンを識別し、化学空間を効率的に探索する能力が確認された。
コードはhttps://github.com/zjunlp/molgenで入手できる。
関連論文リスト
- MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories [7.366789601705544]
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。
本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。
この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
論文 参考訳(メタデータ) (2024-11-10T22:00:55Z) - MolTRES: Improving Chemical Language Representation Learning for Molecular Property Prediction [14.353313239109337]
MolTRESは化学言語表現学習フレームワークである。
ジェネレータと識別器のトレーニングが組み込まれており、より難しい例からモデルを学習することができる。
我々のモデルは、一般的な分子特性予測タスクにおける既存の最先端モデルよりも優れています。
論文 参考訳(メタデータ) (2024-07-09T01:14:28Z) - Navigating Chemical Space with Latent Flows [20.95884505685799]
本稿では,分子生成モデルによって学習された潜伏空間をフローを通して移動させることにより,化学空間を横断する新しいフレームワークであるChemFlowを提案する。
我々は,分子操作におけるChemFlowの有効性と,教師なしおよび教師なしの両方の分子発見条件下での単目的および多目的最適化タスクの有効性を検証した。
論文 参考訳(メタデータ) (2024-05-07T03:55:57Z) - From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning [10.025809630976065]
本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。
提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文 参考訳(メタデータ) (2023-11-05T23:47:52Z) - Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文 参考訳(メタデータ) (2023-06-21T02:05:48Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。