論文の概要: MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories
- arxiv url: http://arxiv.org/abs/2411.06608v1
- Date: Sun, 10 Nov 2024 22:00:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:07:34.882301
- Title: MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories
- Title(参考訳): MolMiner: フラグメントベースの自己回帰生成のためのトランスフォーマーアーキテクチャ
- Authors: Raul Ortega Ochoa, Tejs Vegge, Jes Frellsen,
- Abstract要約: 生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。
本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。
この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
- 参考スコア(独自算出の注目度): 7.366789601705544
- License:
- Abstract: Deep generative models for molecular discovery have become a very popular choice in new high-throughput screening paradigms. These models have been developed inheriting from the advances in natural language processing and computer vision, achieving ever greater results. However, generative molecular modelling has unique challenges that are often overlooked. Chemical validity, interpretability of the generation process and flexibility to variable molecular sizes are among some of the remaining challenges for generative models in computational materials design. In this work, we propose an autoregressive approach that decomposes molecular generation into a sequence of discrete and interpretable steps using molecular fragments as units, a 'molecular story'. Enforcing chemical rules in the stories guarantees the chemical validity of the generated molecules, the discrete sequential steps of a molecular story makes the process transparent improving interpretability, and the autoregressive nature of the approach allows the size of the molecule to be a decision of the model. We demonstrate the validity of the approach in a multi-target inverse design of electroactive organic compounds, focusing on the target properties of solubility, redox potential, and synthetic accessibility. Our results show that the model can effectively bias the generation distribution according to the prompted multi-target objective.
- Abstract(参考訳): 分子発見のための深層生成モデルは、新しい高スループットスクリーニングパラダイムにおいて非常に一般的な選択肢となっている。
これらのモデルは自然言語処理とコンピュータビジョンの進歩から受け継がれ、さらに大きな成果を上げている。
しかし、生成分子モデリングには、しばしば見過ごされるユニークな課題がある。
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。
本研究では,分子の断片を単位として,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。
物語の中で化学規則を強制することで、生成された分子の化学的妥当性が保証され、分子の逐次的なステップによって、プロセスは解釈可能性を改善し、アプローチの自己回帰性により、分子のサイズがモデルの決定となる。
本研究では, 電気活性有機化合物の多目的逆設計におけるアプローチの有効性を実証し, 溶解度, 酸化還元電位, 合成アクセシビリティの標的特性に着目した。
この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
関連論文リスト
- Rethinking Molecular Design: Integrating Latent Variable and Auto-Regressive Models for Goal Directed Generation [0.6800113478497425]
我々は、分子の最も単純な表現に戻り、古典的生成的アプローチの見過ごされた制限を調査する。
本稿では, 分子配列の妥当性, 条件生成, スタイル伝達を改善するために, 両者の強みを生かした, 新規な正則化器の形でのハイブリッドモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T11:50:23Z) - LDMol: Text-to-Molecule Diffusion Model with Structurally Informative Latent Space [55.5427001668863]
テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
LDMolは、学習可能で構造的に有意な特徴空間を生成する分子オートエンコーダを含む。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文 参考訳(メタデータ) (2024-05-28T04:59:13Z) - Diffusing on Two Levels and Optimizing for Multiple Properties: A Novel
Approach to Generating Molecules with Desirable Properties [33.2976176283611]
本稿では,分子を望ましい性質で生成する新しい手法を提案する。
望ましい分子断片を得るため,我々は新しい電子効果に基づくフラグメンテーション法を開発した。
提案手法により生成する分子は, 従来のSOTAモデルより有効, 特異性, 新規性, Fr'echet ChemNet Distance (FCD), QED, PlogP を有することを示す。
論文 参考訳(メタデータ) (2023-10-05T11:43:21Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Domain-Agnostic Molecular Generation with Chemical Feedback [44.063584808910896]
MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。
我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
論文 参考訳(メタデータ) (2023-01-26T17:52:56Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Learning Neural Generative Dynamics for Molecular Conformation
Generation [89.03173504444415]
分子グラフから分子コンフォメーション(つまり3d構造)を生成する方法を検討した。
分子グラフから有効かつ多様なコンフォーメーションを生成する新しい確率論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-02-20T03:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。