Fugu-MT 論文翻訳(概要): Fragment-based t-SMILES for de novo molecular generation

論文の概要: Fragment-based t-SMILES for de novo molecular generation

arxiv url: http://arxiv.org/abs/2301.01829v1
Date: Wed, 4 Jan 2023 21:41:01 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-06 13:42:04.043814
Title: Fragment-based t-SMILES for de novo molecular generation
Title（参考訳）: デノボ分子生成のためのフラグメントに基づくt-SMILES
Authors: Juan-Ni Wu, Tong Wang, Yue Chen, Li-Juan Tang, Hai-Long Wu, Ru-Qin Yu
Abstract要約: t-SMILES (tree-based SMILES) は、断片化された分子グラフから形成された全二分分子木上でBFS(panth first search)を行ったSMILES型文字列を用いて分子を記述する。 JTVAEと化学反応に基づくBRICS分子分解アルゴリズムを用いた配列ベースオートレ生成モデルによる実験
参考スコア（独自算出の注目度）: 11.9688828478865
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: At present, sequence-based and graph-based models are two of popular used molecular generative models. In this study, we introduce a general-purposed, fragment-based, hierarchical molecular representation named t-SMILES (tree-based SMILES) which describes molecules using a SMILES-type string obtained by doing breadth first search (BFS) on full binary molecular tree formed from fragmented molecular graph. The proposed t-SMILES combines the advantages of graph model paying more attention to molecular topology structure and language model possessing powerful learning ability. Experiments with feature tree rooted JTVAE and chemical reaction-based BRICS molecular decomposing algorithms using sequence-based autoregressive generation models on three popular molecule datasets including Zinc, QM9 and ChEMBL datasets indicate that t-SMILES based models significantly outperform previously proposed fragment-based models and being competitive with classical SMILES based and graph-based approaches. Most importantly, we proposed a new perspective for fragment based molecular designing. Hence, SOTA powerful sequence-based solutions could be easily applied for fragment based molecular tasks.
Abstract（参考訳）: 現在、シーケンスベースモデルとグラフベースモデルは、よく使われている2つの分子生成モデルである。本研究では, フラグメント化された分子グラフから生成した全二分分子木上に, SMILES型文字列を用いて, 汎用的, 断片的, 階層的な分子表現 t-SMILES (tree-based SMILES) を導入する。提案したt-SMILESは,分子トポロジ構造と強力な学習能力を有する言語モデルに注目するグラフモデルの利点を組み合わせたものである。 JTVAEと化学反応に基づくBRICS分子分解アルゴリズムを用いた実験は、Zinc、QM9、ChEMBLデータセットを含む3つの一般的な分子データセット上の配列ベースの自己回帰生成モデルを用いて、t-SMILESベースのモデルは、以前提案されたフラグメントベースのモデルよりも大幅に優れ、古典的なSMILESやグラフベースのアプローチと競合していることを示している。最も重要なことは、フラグメントに基づく分子設計の新しい視点を提案することである。したがって、SOTAの強力なシーケンスベースのソリューションは、フラグメントベースの分子タスクに容易に適用できる。

関連論文リスト

Aligned Manifold Property and Topology Point Clouds for Learning Molecular Properties [55.2480439325792]
この研究は、局所量子由来のスカラー場とカスタムトポロジカルディスクリプタを組み合わせた分子表面表現であるAMPTCRを導入する。分子量については、AMPTCRが物理的に意味のあるデータをコードし、検証R2は0.87であることを確認した。細菌抑制タスクでは、AMPTCRは大腸菌阻害値の分類と直接回帰の両方を可能にする。
論文参考訳（メタデータ） (2025-07-22T04:35:50Z)
DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文参考訳（メタデータ） (2025-02-13T18:29:48Z)
Graph-based Molecular In-context Learning Grounded on Morgan Fingerprints [28.262593876388397]
In-context Learning (ICL) では、プロパティ予測や分子キャプションなどの分子タスクのための大規模言語モデル(LLM)を、慎重に選択された実演例を入力プロンプトに埋め込む。しかし、現在の分子タスクのプロンプト検索法は、モーガン指紋のような分子の特徴的類似性に依存しており、これはグローバル分子と原子結合の関係を適切に捉えていない。本稿では,グローバル分子構造をグラフニューラルネットワーク(GNN)とテキストキャプション(記述)に整合させ,モーガン指紋による局所的特徴類似性を活用する自己教師付き学習手法GAMICを提案する。
論文参考訳（メタデータ） (2025-02-08T02:46:33Z)
RFL: Simplifying Chemical Structure Recognition with Ring-Free Language [66.47173094346115]
化学構造を階層的に記述する新しいリング自由言語(RFL)を提案する。 RFLは複雑な分子構造を複数の部分に分解し、特異性と簡潔性の両方を保証する。分子骨格と個々の環を段階的に予測する骨格生成モジュールからなる普遍的な分子骨格デコーダ(MSD)を提案する。
論文参考訳（メタデータ） (2024-12-10T15:29:32Z)
Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文参考訳（メタデータ） (2024-11-03T01:56:15Z)
FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。 FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。 MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2024-10-02T23:04:58Z)
Adapting Differential Molecular Representation with Hierarchical Prompts for Multi-label Property Prediction [2.344198904343022]
HiPMは階層的に誘導される分子表現学習フレームワークである。私たちのフレームワークは、分子表現(MRE)とタスク認識プロンプタ(TAP)の2つのコアコンポーネントで構成されています。
論文参考訳（メタデータ） (2024-05-29T03:10:21Z)
Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。 HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文参考訳（メタデータ） (2024-05-05T08:35:23Z)
Multi-Modal Representation Learning for Molecular Property Prediction: Sequence, Graph, Geometry [6.049566024728809]
深層学習に基づく分子特性予測は、従来の手法の資源集約性に対する解決策として登場した。本稿では,分子特性予測のための新しいマルチモーダル表現学習モデルSGGRLを提案する。モダリティ間の整合性を確保するため、SGGRLは異なる分子の類似性を最小化しながら同じ分子の表現の類似性を最大化するように訓練される。
論文参考訳（メタデータ） (2024-01-07T02:18:00Z)
MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。両者の分子表現の強さを融合させる。ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文参考訳（メタデータ） (2023-11-28T10:28:35Z)
Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。 11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文参考訳（メタデータ） (2023-06-02T15:49:45Z)
Atomic and Subgraph-aware Bilateral Aggregation for Molecular Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。 ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文参考訳（メタデータ） (2023-05-22T00:56:00Z)
Few-Shot Graph Learning for Molecular Property Prediction [46.60746023179724]
分子特性予測の新しいモデルであるMeta-MGNNを提案する。ラベルのない分子情報を利用するため、Meta-MGNNはさらに分子構造、属性ベースの自己監視モジュール、および自己注意のタスクウェイトを組み込む。 2つの公開マルチプロパティデータセットに関する広範な実験は、Meta-MGNNがさまざまな最先端のメソッドを上回っていることを示しています。
論文参考訳（メタデータ） (2021-02-16T01:55:34Z)
MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文参考訳（メタデータ） (2020-10-05T20:18:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。