Fugu-MT 論文翻訳(概要): Unsupervised Learning of Molecular Embeddings for Enhanced Clustering and Emergent Properties for Chemical Compounds

論文の概要: Unsupervised Learning of Molecular Embeddings for Enhanced Clustering and Emergent Properties for Chemical Compounds

arxiv url: http://arxiv.org/abs/2310.18367v1
Date: Wed, 25 Oct 2023 18:00:24 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-05 13:40:58.363219
Title: Unsupervised Learning of Molecular Embeddings for Enhanced Clustering and Emergent Properties for Chemical Compounds
Title（参考訳）: 化合物のクラスタリングと創発性を高める分子埋め込みの教師なし学習
Authors: Jaiveer Gill, Ratul Chakraborty, Reetham Gubba, Amy Liu, Shrey Jain, Chirag Iyer, Obaid Khwaja, Saurav Kumar
Abstract要約: SMILESデータに基づく化合物の検出とクラスタリングのための様々な手法を提案する。埋め込みデータを用いて化合物のグラフィカルな構造を解析し, しきい値を満たすためにベクトル探索を用いる。また、GPT3.5を用いたベクトルデータベースに格納された自然言語記述埋め込みを用い、ベースモデルより優れていた。
参考スコア（独自算出の注目度）: 2.6803933204362336
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: The detailed analysis of molecular structures and properties holds great potential for drug development discovery through machine learning. Developing an emergent property in the model to understand molecules would broaden the horizons for development with a new computational tool. We introduce various methods to detect and cluster chemical compounds based on their SMILES data. Our first method, analyzing the graphical structures of chemical compounds using embedding data, employs vector search to meet our threshold value. The results yielded pronounced, concentrated clusters, and the method produced favorable results in querying and understanding the compounds. We also used natural language description embeddings stored in a vector database with GPT3.5, which outperforms the base model. Thus, we introduce a similarity search and clustering algorithm to aid in searching for and interacting with molecules, enhancing efficiency in chemical exploration and enabling future development of emergent properties in molecular property prediction models.
Abstract（参考訳）: 分子構造と性質の詳細な分析は、機械学習による薬物開発発見に大きな可能性を秘めている。分子を理解するためにモデルに創発的な特性を開発することは、新しい計算ツールで開発のための地平を広げる。 SMILESデータに基づく化合物の検出とクラスタリングのための様々な手法を提案する。組込みデータを用いて化学化合物のグラフィカル構造を分析する最初の方法は,しきい値を満たすためにベクトル探索を用いる。その結果, 高い濃度のクラスターが得られ, 化合物の問合せや理解において良好な結果が得られた。また、GPT3.5を用いたベクトルデータベースに格納された自然言語記述埋め込みを用い、ベースモデルより優れていた。そこで我々は,分子の探索と相互作用を支援する類似性探索とクラスタリングアルゴリズムを導入し,化学探索の効率を高め,分子特性予測モデルにおける創発的特性の今後の発展を可能にする。

関連論文リスト

Structure-Aware Compound-Protein Affinity Prediction via Graph Neural Network with Group Lasso Regularization [11.595051456139021]
我々は、複合特性予測のための構造活性関係(SAR)モデリングのためのエンドツーエンドで説明可能な機械学習モデルを構築した。グラフニューラルネットワーク (GNN) を用いて, 原子レベルの特徴情報を取得し, 複合タンパク質親和性を予測する。また, グループラッソとスパースグループラッソを用いて, 分子サブグラフのプーンとハイライトを行い, 構造特異的モデル説明可能性を高める。
論文参考訳（メタデータ） (2025-07-04T06:12:18Z)
Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。 KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文参考訳（メタデータ） (2025-02-17T11:53:58Z)
Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文参考訳（メタデータ） (2024-11-03T01:56:15Z)
FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。 FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。 MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2024-10-02T23:04:58Z)
MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文参考訳（メタデータ） (2024-06-13T02:50:23Z)
MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。両者の分子表現の強さを融合させる。ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文参考訳（メタデータ） (2023-11-28T10:28:35Z)
Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文参考訳（メタデータ） (2023-06-02T15:49:45Z)
Atomic and Subgraph-aware Bilateral Aggregation for Molecular Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。 ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文参考訳（メタデータ） (2023-05-22T00:56:00Z)
Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文参考訳（メタデータ） (2023-02-04T01:32:40Z)
Graph neural networks for the prediction of molecular structure-property relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。 GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文参考訳（メタデータ） (2022-07-25T11:30:44Z)
Semi-Supervised GCN for learning Molecular Structure-Activity Relationships [4.468952886990851]
そこで本稿では,半教師付き学習を用いたグラフ-グラフ間ニューラルネットワークの学習手法を提案する。最終目標として、我々のアプローチは、アクティビティ崖、リード最適化、デノボドラッグデザインといった問題に対処するための貴重なツールとなる可能性がある。
論文参考訳（メタデータ） (2022-01-25T09:09:43Z)
Improving VAE based molecular representations for compound property prediction [0.0]
機械学習モデルの化学特性予測性能を簡易に向上する手法を提案する。本稿では,プロパティ予測モデルの性能と,プロパティ予測データセットとより大きなラベル付きデータセットとの距離の関係を示す。
論文参考訳（メタデータ） (2022-01-13T12:57:11Z)
Do Large Scale Molecular Language Representations Capture Important Structural Information? [31.76876206167457]
本稿では,MoLFormerと呼ばれる効率的なトランスフォーマーエンコーダモデルのトレーニングにより得られた分子埋め込みについて述べる。実験の結果,グラフベースおよび指紋ベースによる教師付き学習ベースラインと比較して,学習された分子表現が競合的に機能することが確認された。
論文参考訳（メタデータ） (2021-06-17T14:33:55Z)
Advanced Graph and Sequence Neural Networks for Molecular Property Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文参考訳（メタデータ） (2020-12-02T02:09:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。