論文の概要: Improving Molecular Properties Prediction Through Latent Space Fusion
- arxiv url: http://arxiv.org/abs/2310.13802v1
- Date: Fri, 20 Oct 2023 20:29:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 05:20:24.465652
- Title: Improving Molecular Properties Prediction Through Latent Space Fusion
- Title(参考訳): 潜時宇宙融合による分子特性予測の改善
- Authors: Eduardo Soares, Akihiro Kishimoto, Emilio Vital Brazil, Seiji Takeda,
Hiroshi Kajino, Renato Cerqueira
- Abstract要約: 本稿では,最先端の化学モデルから導出した潜在空間を組み合わせた多視点手法を提案する。
分子構造をグラフとして表現するMHG-GNNの埋め込みと、化学言語に根ざしたMoLFormerの埋め込みである。
本稿では,既存の最先端手法と比較して,提案手法の優れた性能を示す。
- 参考スコア(独自算出の注目度): 9.912768918657354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pre-trained Language Models have emerged as promising tools for predicting
molecular properties, yet their development is in its early stages,
necessitating further research to enhance their efficacy and address challenges
such as generalization and sample efficiency. In this paper, we present a
multi-view approach that combines latent spaces derived from state-of-the-art
chemical models. Our approach relies on two pivotal elements: the embeddings
derived from MHG-GNN, which represent molecular structures as graphs, and
MoLFormer embeddings rooted in chemical language. The attention mechanism of
MoLFormer is able to identify relations between two atoms even when their
distance is far apart, while the GNN of MHG-GNN can more precisely capture
relations among multiple atoms closely located. In this work, we demonstrate
the superior performance of our proposed multi-view approach compared to
existing state-of-the-art methods, including MoLFormer-XL, which was trained on
1.1 billion molecules, particularly in intricate tasks such as predicting
clinical trial drug toxicity and inhibiting HIV replication. We assessed our
approach using six benchmark datasets from MoleculeNet, where it outperformed
competitors in five of them. Our study highlights the potential of latent space
fusion and feature integration for advancing molecular property prediction. In
this work, we use small versions of MHG-GNN and MoLFormer, which opens up an
opportunity for further improvement when our approach uses a larger-scale
dataset.
- Abstract(参考訳): 事前訓練された言語モデルは、分子特性を予測するための有望なツールとして登場したが、その開発はまだ初期段階にあり、その効果を高めるためにさらなる研究が必要である。
本稿では,最先端化学モデルから導出した潜在空間を組み合わせた多視点アプローチを提案する。
分子構造をグラフとして表現するMHG-GNNからの埋め込みと、化学言語に根ざしたMoLFormer埋め込みである。
MoLFormerの注意機構は、距離が遠くても2つの原子間の関係を識別でき、MHG-GNNのGNNはより正確に複数の原子間の関係を捉えることができる。
本研究は,薬毒性の予測やhiv複製の抑制など,特に複雑なタスクにおいて,11億分子で訓練された molformer-xl を含む既存の最先端手法と比較して,提案手法の優れた性能を示す。
MoleculeNetの6つのベンチマークデータセットを使用して、私たちのアプローチを評価しました。
本研究は,分子特性予測のための潜在空間融合と機能統合の可能性を明らかにする。
この作業では、MHG-GNNとMoLFormerの小さなバージョンを使用します。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Contrastive Dual-Interaction Graph Neural Network for Molecular Property Prediction [0.0]
本稿では,分子特性予測のための自己教師付きグラフニューラルネットワークフレームワークであるDIG-Molを紹介する。
DIG-Molは2つの相互接続ネットワークと運動量蒸留ネットワークを統合し、分子特性を効率的に改善する。
我々は,様々な分子特性予測タスクにおける広範囲な実験的評価により,DIG-Molの最先端性能を確立した。
論文 参考訳(メタデータ) (2024-05-04T10:09:27Z) - MolTC: Towards Molecular Relational Modeling In Language Models [28.960416816491392]
分子間相互作用予測のための新しい枠組みとして,分子間相互作用予測法(分子間相互作用予測法)を提案する。
我々の実験は4000,000以上の分子対を含む様々なデータセットで実施され、現在のGNNおよびLLMベースラインよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-02-06T07:51:56Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Improving Molecular Pretraining with Complementary Featurizations [20.86159731100242]
分子プレトレーニング(英: molecular pretraining)は、計算化学と薬物発見における様々な課題を解決するためのパラダイムである。
化学情報を異なる方法で伝達できることが示される。
我々は, 簡易で効果的な分子事前学習フレームワーク(MOCO)を提案する。
論文 参考訳(メタデータ) (2022-09-29T21:11:09Z) - Few-Shot Graph Learning for Molecular Property Prediction [46.60746023179724]
分子特性予測の新しいモデルであるMeta-MGNNを提案する。
ラベルのない分子情報を利用するため、Meta-MGNNはさらに分子構造、属性ベースの自己監視モジュール、および自己注意のタスクウェイトを組み込む。
2つの公開マルチプロパティデータセットに関する広範な実験は、Meta-MGNNがさまざまな最先端のメソッドを上回っていることを示しています。
論文 参考訳(メタデータ) (2021-02-16T01:55:34Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。