論文の概要: Fragment-based t-SMILES for de novo molecular generation
- arxiv url: http://arxiv.org/abs/2301.01829v1
- Date: Wed, 4 Jan 2023 21:41:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 13:42:04.043814
- Title: Fragment-based t-SMILES for de novo molecular generation
- Title(参考訳): デノボ分子生成のためのフラグメントに基づくt-SMILES
- Authors: Juan-Ni Wu, Tong Wang, Yue Chen, Li-Juan Tang, Hai-Long Wu, Ru-Qin Yu
- Abstract要約: t-SMILES (tree-based SMILES) は、断片化された分子グラフから形成された全二分分子木上でBFS(panth first search)を行ったSMILES型文字列を用いて分子を記述する。
JTVAEと化学反応に基づくBRICS分子分解アルゴリズムを用いた配列ベースオートレ生成モデルによる実験
- 参考スコア(独自算出の注目度): 11.9688828478865
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: At present, sequence-based and graph-based models are two of popular used
molecular generative models. In this study, we introduce a general-purposed,
fragment-based, hierarchical molecular representation named t-SMILES
(tree-based SMILES) which describes molecules using a SMILES-type string
obtained by doing breadth first search (BFS) on full binary molecular tree
formed from fragmented molecular graph. The proposed t-SMILES combines the
advantages of graph model paying more attention to molecular topology structure
and language model possessing powerful learning ability. Experiments with
feature tree rooted JTVAE and chemical reaction-based BRICS molecular
decomposing algorithms using sequence-based autoregressive generation models on
three popular molecule datasets including Zinc, QM9 and ChEMBL datasets
indicate that t-SMILES based models significantly outperform previously
proposed fragment-based models and being competitive with classical SMILES
based and graph-based approaches. Most importantly, we proposed a new
perspective for fragment based molecular designing. Hence, SOTA powerful
sequence-based solutions could be easily applied for fragment based molecular
tasks.
- Abstract(参考訳): 現在、シーケンスベースモデルとグラフベースモデルは、よく使われている2つの分子生成モデルである。
本研究では, フラグメント化された分子グラフから生成した全二分分子木上に, SMILES型文字列を用いて, 汎用的, 断片的, 階層的な分子表現 t-SMILES (tree-based SMILES) を導入する。
提案したt-SMILESは,分子トポロジ構造と強力な学習能力を有する言語モデルに注目するグラフモデルの利点を組み合わせたものである。
JTVAEと化学反応に基づくBRICS分子分解アルゴリズムを用いた実験は、Zinc、QM9、ChEMBLデータセットを含む3つの一般的な分子データセット上の配列ベースの自己回帰生成モデルを用いて、t-SMILESベースのモデルは、以前提案されたフラグメントベースのモデルよりも大幅に優れ、古典的なSMILESやグラフベースのアプローチと競合していることを示している。
最も重要なことは、フラグメントに基づく分子設計の新しい視点を提案することである。
したがって、SOTAの強力なシーケンスベースのソリューションは、フラグメントベースの分子タスクに容易に適用できる。
関連論文リスト
- DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。
我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。
実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Graph-based Molecular In-context Learning Grounded on Morgan Fingerprints [28.262593876388397]
In-context Learning (ICL) では、プロパティ予測や分子キャプションなどの分子タスクのための大規模言語モデル(LLM)を、慎重に選択された実演例を入力プロンプトに埋め込む。
しかし、現在の分子タスクのプロンプト検索法は、モーガン指紋のような分子の特徴的類似性に依存しており、これはグローバル分子と原子結合の関係を適切に捉えていない。
本稿では,グローバル分子構造をグラフニューラルネットワーク(GNN)とテキストキャプション(記述)に整合させ,モーガン指紋による局所的特徴類似性を活用する自己教師付き学習手法GAMICを提案する。
論文 参考訳(メタデータ) (2025-02-08T02:46:33Z) - RFL: Simplifying Chemical Structure Recognition with Ring-Free Language [66.47173094346115]
化学構造を階層的に記述する新しいリング自由言語(RFL)を提案する。
RFLは複雑な分子構造を複数の部分に分解し、特異性と簡潔性の両方を保証する。
分子骨格と個々の環を段階的に予測する骨格生成モジュールからなる普遍的な分子骨格デコーダ(MSD)を提案する。
論文 参考訳(メタデータ) (2024-12-10T15:29:32Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Adapting Differential Molecular Representation with Hierarchical Prompts for Multi-label Property Prediction [2.344198904343022]
HiPMは階層的に誘導される分子表現学習フレームワークである。
私たちのフレームワークは、分子表現(MRE)とタスク認識プロンプタ(TAP)の2つのコアコンポーネントで構成されています。
論文 参考訳(メタデータ) (2024-05-29T03:10:21Z) - Multi-Modal Representation Learning for Molecular Property Prediction:
Sequence, Graph, Geometry [6.049566024728809]
深層学習に基づく分子特性予測は、従来の手法の資源集約性に対する解決策として登場した。
本稿では,分子特性予測のための新しいマルチモーダル表現学習モデルSGGRLを提案する。
モダリティ間の整合性を確保するため、SGGRLは異なる分子の類似性を最小化しながら同じ分子の表現の類似性を最大化するように訓練される。
論文 参考訳(メタデータ) (2024-01-07T02:18:00Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。