論文の概要: Multi-Modal Representation Learning for Molecular Property Prediction:
Sequence, Graph, Geometry
- arxiv url: http://arxiv.org/abs/2401.03369v1
- Date: Sun, 7 Jan 2024 02:18:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 19:13:59.297075
- Title: Multi-Modal Representation Learning for Molecular Property Prediction:
Sequence, Graph, Geometry
- Title(参考訳): 分子特性予測のためのマルチモーダル表現学習:シーケンス,グラフ,幾何学
- Authors: Zeyu Wang, Tianyi Jiang, Jinhuan Wang, Qi Xuan
- Abstract要約: 本稿では,分子グラフのトポロジを修飾して,原データと同じ分子接続指数を持つ拡張データを生成する新しいデータ拡張手法を提案する。
データ拡張技術と組み合わせた分子接続指数は、より多くのトポロジベースの分子特性情報を保持し、より信頼性の高いデータを生成するのに役立つ。
- 参考スコア(独自算出の注目度): 6.049566024728809
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years have seen a rapid growth of machine learning in cheminformatics
problems. In order to tackle the problem of insufficient training data in
reality, more and more researchers pay attention to data augmentation
technology. However, few researchers pay attention to the problem of
construction rules and domain information of data, which will directly impact
the quality of augmented data and the augmentation performance. While in
graph-based molecular research, the molecular connectivity index, as a critical
topological index, can directly or indirectly reflect the topology-based
physicochemical properties and biological activities. In this paper, we propose
a novel data augmentation technique that modifies the topology of the molecular
graph to generate augmented data with the same molecular connectivity index as
the original data. The molecular connectivity index combined with data
augmentation technology helps to retain more topology-based molecular
properties information and generate more reliable data. Furthermore, we adopt
five benchmark datasets to test our proposed models, and the results indicate
that the augmented data generated based on important molecular topology
features can effectively improve the prediction accuracy of molecular
properties, which also provides a new perspective on data augmentation in
cheminformatics studies.
- Abstract(参考訳): 近年、ケミノマティクス問題における機械学習の急速な成長が見られる。
実際のトレーニングデータ不足の問題に取り組むため、ますます多くの研究者がデータ拡張技術に注意を払っている。
しかし、構築規則やデータのドメイン情報の問題に注意を払う研究者はほとんどおらず、これは拡張データの品質と拡張性能に直接影響する。
グラフベースの分子研究において、臨界位相指数としての分子接続指数は、トポロジーに基づく物理化学的性質と生物活性を直接的または間接的に反映することができる。
本稿では,分子グラフのトポロジを修飾して,原データと同じ分子接続指数を持つ拡張データを生成する新しいデータ拡張手法を提案する。
データ拡張技術と組み合わされた分子接続指数は、トポロジーベースの分子特性情報を保持し、より信頼性の高いデータを生成するのに役立つ。
さらに,提案モデルをテストするために5つのベンチマークデータセットを導入し,重要な分子トポロジ特徴に基づく拡張データが分子特性の予測精度を効果的に向上することを示すとともに,ケミノフォマティクス研究におけるデータ拡張の新たな視点を提供する。
関連論文リスト
- Contrastive Dual-Interaction Graph Neural Network for Molecular Property Prediction [0.0]
本稿では,分子特性予測のための自己教師付きグラフニューラルネットワークフレームワークであるDIG-Molを紹介する。
DIG-Molは2つの相互接続ネットワークと運動量蒸留ネットワークを統合し、分子特性を効率的に改善する。
我々は,様々な分子特性予測タスクにおける広範囲な実験的評価により,DIG-Molの最先端性能を確立した。
論文 参考訳(メタデータ) (2024-05-04T10:09:27Z) - Graph Multi-Similarity Learning for Molecular Property Prediction [13.214794693837785]
本稿では,Graph Multi-Similarity Learning for Molecular Property Prediction (GraphMSL)フレームワークを紹介する。
まず、まず自己相似性計量(すなわち、アンカー分子と他の分子との類似性)を定義し、次にペア重み付け関数を通してアンカーの一般化多相性計量に変換する。
GraphMSLは、MoneculeNetデータセット間の多重相似性測定の有効性を検証する。
論文 参考訳(メタデータ) (2024-01-31T05:59:38Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Flexible dual-branched message passing neural network for quantum
mechanical property prediction with molecular conformation [16.08677447593939]
メッセージパッシングフレームワークに基づく分子特性予測のための二重分岐ニューラルネットワークを提案する。
本モデルでは,様々なスケールで異種分子の特徴を学習し,予測対象に応じて柔軟に学習する。
論文 参考訳(メタデータ) (2021-06-14T10:00:39Z) - Few-Shot Graph Learning for Molecular Property Prediction [46.60746023179724]
分子特性予測の新しいモデルであるMeta-MGNNを提案する。
ラベルのない分子情報を利用するため、Meta-MGNNはさらに分子構造、属性ベースの自己監視モジュール、および自己注意のタスクウェイトを組み込む。
2つの公開マルチプロパティデータセットに関する広範な実験は、Meta-MGNNがさまざまな最先端のメソッドを上回っていることを示しています。
論文 参考訳(メタデータ) (2021-02-16T01:55:34Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。