論文の概要: Fragment-based t-SMILES for de novo molecular generation
- arxiv url: http://arxiv.org/abs/2301.01829v1
- Date: Wed, 4 Jan 2023 21:41:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 13:42:04.043814
- Title: Fragment-based t-SMILES for de novo molecular generation
- Title(参考訳): デノボ分子生成のためのフラグメントに基づくt-SMILES
- Authors: Juan-Ni Wu, Tong Wang, Yue Chen, Li-Juan Tang, Hai-Long Wu, Ru-Qin Yu
- Abstract要約: t-SMILES (tree-based SMILES) は、断片化された分子グラフから形成された全二分分子木上でBFS(panth first search)を行ったSMILES型文字列を用いて分子を記述する。
JTVAEと化学反応に基づくBRICS分子分解アルゴリズムを用いた配列ベースオートレ生成モデルによる実験
- 参考スコア(独自算出の注目度): 11.9688828478865
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: At present, sequence-based and graph-based models are two of popular used
molecular generative models. In this study, we introduce a general-purposed,
fragment-based, hierarchical molecular representation named t-SMILES
(tree-based SMILES) which describes molecules using a SMILES-type string
obtained by doing breadth first search (BFS) on full binary molecular tree
formed from fragmented molecular graph. The proposed t-SMILES combines the
advantages of graph model paying more attention to molecular topology structure
and language model possessing powerful learning ability. Experiments with
feature tree rooted JTVAE and chemical reaction-based BRICS molecular
decomposing algorithms using sequence-based autoregressive generation models on
three popular molecule datasets including Zinc, QM9 and ChEMBL datasets
indicate that t-SMILES based models significantly outperform previously
proposed fragment-based models and being competitive with classical SMILES
based and graph-based approaches. Most importantly, we proposed a new
perspective for fragment based molecular designing. Hence, SOTA powerful
sequence-based solutions could be easily applied for fragment based molecular
tasks.
- Abstract(参考訳): 現在、シーケンスベースモデルとグラフベースモデルは、よく使われている2つの分子生成モデルである。
本研究では, フラグメント化された分子グラフから生成した全二分分子木上に, SMILES型文字列を用いて, 汎用的, 断片的, 階層的な分子表現 t-SMILES (tree-based SMILES) を導入する。
提案したt-SMILESは,分子トポロジ構造と強力な学習能力を有する言語モデルに注目するグラフモデルの利点を組み合わせたものである。
JTVAEと化学反応に基づくBRICS分子分解アルゴリズムを用いた実験は、Zinc、QM9、ChEMBLデータセットを含む3つの一般的な分子データセット上の配列ベースの自己回帰生成モデルを用いて、t-SMILESベースのモデルは、以前提案されたフラグメントベースのモデルよりも大幅に優れ、古典的なSMILESやグラフベースのアプローチと競合していることを示している。
最も重要なことは、フラグメントに基づく分子設計の新しい視点を提案することである。
したがって、SOTAの強力なシーケンスベースのソリューションは、フラグメントベースの分子タスクに容易に適用できる。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Adapting Differential Molecular Representation with Hierarchical Prompts for Multi-label Property Prediction [2.344198904343022]
HiPMは階層的に誘導される分子表現学習フレームワークである。
私たちのフレームワークは、分子表現(MRE)とタスク認識プロンプタ(TAP)の2つのコアコンポーネントで構成されています。
論文 参考訳(メタデータ) (2024-05-29T03:10:21Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Multi-Modal Representation Learning for Molecular Property Prediction:
Sequence, Graph, Geometry [6.049566024728809]
深層学習に基づく分子特性予測は、従来の手法の資源集約性に対する解決策として登場した。
本稿では,分子特性予測のための新しいマルチモーダル表現学習モデルSGGRLを提案する。
モダリティ間の整合性を確保するため、SGGRLは異なる分子の類似性を最小化しながら同じ分子の表現の類似性を最大化するように訓練される。
論文 参考訳(メタデータ) (2024-01-07T02:18:00Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Few-Shot Graph Learning for Molecular Property Prediction [46.60746023179724]
分子特性予測の新しいモデルであるMeta-MGNNを提案する。
ラベルのない分子情報を利用するため、Meta-MGNNはさらに分子構造、属性ベースの自己監視モジュール、および自己注意のタスクウェイトを組み込む。
2つの公開マルチプロパティデータセットに関する広範な実験は、Meta-MGNNがさまざまな最先端のメソッドを上回っていることを示しています。
論文 参考訳(メタデータ) (2021-02-16T01:55:34Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。