論文の概要: A Deep Generative Model for Fragment-Based Molecule Generation
- arxiv url: http://arxiv.org/abs/2002.12826v1
- Date: Fri, 28 Feb 2020 15:55:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 01:38:16.603023
- Title: A Deep Generative Model for Fragment-Based Molecule Generation
- Title(参考訳): フラグメントに基づく分子生成のための深部生成モデル
- Authors: Marco Podda, Davide Bacciu, Alessio Micheli
- Abstract要約: フラグメントと呼ばれる小さな分子サブ構造のための言語モデルを開発した。
言い換えれば、原子のフラグメントではなく、フラグメントによって分子のフラグメントを生成します。
実験により、我々のモデルは、他の言語モデルベースの競合よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 21.258861822241272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecule generation is a challenging open problem in cheminformatics.
Currently, deep generative approaches addressing the challenge belong to two
broad categories, differing in how molecules are represented. One approach
encodes molecular graphs as strings of text, and learns their corresponding
character-based language model. Another, more expressive, approach operates
directly on the molecular graph. In this work, we address two limitations of
the former: generation of invalid and duplicate molecules. To improve validity
rates, we develop a language model for small molecular substructures called
fragments, loosely inspired by the well-known paradigm of Fragment-Based Drug
Design. In other words, we generate molecules fragment by fragment, instead of
atom by atom. To improve uniqueness rates, we present a frequency-based masking
strategy that helps generate molecules with infrequent fragments. We show
experimentally that our model largely outperforms other language model-based
competitors, reaching state-of-the-art performances typical of graph-based
approaches. Moreover, generated molecules display molecular properties similar
to those in the training sample, even in absence of explicit task-specific
supervision.
- Abstract(参考訳): 分子生成は化学情報学における挑戦的なオープン問題である。
現在、この課題に対するディープジェネレーティブなアプローチは、2つの幅広いカテゴリに属しており、分子の表現方法が異なる。
あるアプローチでは、分子グラフをテキストの文字列としてエンコードし、対応する文字ベースの言語モデルを学ぶ。
別の、より表現力のあるアプローチは、分子グラフ上で直接動作する。
本研究では、前者の2つの制限、すなわち無効分子と重複分子の生成に対処する。
本研究では, フラグメントに基づく医薬品設計のパラダイムに着想を得て, フラグメントと呼ばれる小さな分子サブ構造に対する言語モデルを構築した。
言い換えれば、原子による原子ではなく、断片による分子断片を生成する。
特異性率を改善するために、周波数ベースのマスキング戦略を提案し、少ないフラグメントを持つ分子の生成を支援する。
実験により、我々のモデルは、他の言語モデルベースの競合よりはるかに優れており、グラフベースのアプローチで典型的な最先端のパフォーマンスに達することを示した。
さらに、生成された分子は、明示的なタスク固有の監督がなくても、トレーニングサンプルと同様の分子特性を示す。
関連論文リスト
- MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories [7.366789601705544]
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。
本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。
この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
論文 参考訳(メタデータ) (2024-11-10T22:00:55Z) - LDMol: Text-to-Molecule Diffusion Model with Structurally Informative Latent Space [55.5427001668863]
テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
LDMolは、学習可能で構造的に有意な特徴空間を生成する分子オートエンコーダを含む。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文 参考訳(メタデータ) (2024-05-28T04:59:13Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - MAGNet: Motif-Agnostic Generation of Molecules from Shapes [16.188301768974]
MAGNetは、原子と結合の型を割り当てる前に抽象的な形状を生成するグラフベースのモデルである。
MAGNetの表現性の向上は、よりトポロジカルな構造を持つ分子に繋がることを示した。
論文 参考訳(メタデータ) (2023-05-30T15:29:34Z) - De Novo Molecular Generation via Connection-aware Motif Mining [197.97528902698966]
我々は、マイニングされた接続認識モチーフに基づいて分子を生成する新しい方法、MiCaMを提案する。
得られたモチーフ語彙は、分子モチーフ(頻繁な断片)だけでなく、それらの接続情報も含む。
マイニングされた接続対応モチーフに基づいて、MiCaMは接続対応ジェネレータを構築し、同時にモチーフをピックアップし、どのように接続されているかを決定する。
論文 参考訳(メタデータ) (2023-02-02T14:40:47Z) - Domain-Agnostic Molecular Generation with Chemical Feedback [44.063584808910896]
MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。
我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
論文 参考訳(メタデータ) (2023-01-26T17:52:56Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Fragment-based Sequential Translation for Molecular Optimization [23.152338167332374]
本稿では,分子断片を用いた分子生成のためのフレキシブルな編集パラダイムを提案する。
我々は変分オートエンコーダを用いて分子断片をコヒーレント潜在空間に符号化する。
そして、分子を編集して複雑な化学特性空間を探索する語彙として利用します。
論文 参考訳(メタデータ) (2021-10-26T21:20:54Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。