論文の概要: CL-MFAP: A Contrastive Learning-Based Multimodal Foundation Model for Molecular Property Prediction and Antibiotic Screening
- arxiv url: http://arxiv.org/abs/2502.11001v1
- Date: Sun, 16 Feb 2025 05:45:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:13:45.158740
- Title: CL-MFAP: A Contrastive Learning-Based Multimodal Foundation Model for Molecular Property Prediction and Antibiotic Screening
- Title(参考訳): CL-MFAP:分子特性予測と抗生物質スクリーニングのための対照的学習に基づくマルチモーダルファンデーションモデル
- Authors: Gen Zhou, Sugitha Janarthanan, Yutong Lu, Pingzhao Hu,
- Abstract要約: 非教師付きコントラスト学習(CL)ベースのマルチモーダル基礎(MF)モデルであるCL-MFAPを導入する。
このモデルは、ChEMBLデータセットから薬物のような性質を持つ1.6万の生物活性分子を用いて、3つのエンコーダを共同で事前訓練する。
CL-MFAPは、異なる分子モードを有効利用することにより、抗生物質特性予測におけるベースラインモデルより優れ、抗生物質関連特性予測タスクの微調整時に、ドメイン特異的性能が優れていることを示す。
- 参考スコア(独自算出の注目度): 9.162517838181683
- License:
- Abstract: Due to the rise in antimicrobial resistance, identifying novel compounds with antibiotic potential is crucial for combatting this global health issue. However, traditional drug development methods are costly and inefficient. Recognizing the pressing need for more effective solutions, researchers have turned to machine learning techniques to streamline the prediction and development of novel antibiotic compounds. While foundation models have shown promise in antibiotic discovery, current mainstream efforts still fall short of fully leveraging the potential of multimodal molecular data. Recent studies suggest that contrastive learning frameworks utilizing multimodal data exhibit excellent performance in representation learning across various domains. Building upon this, we introduce CL-MFAP, an unsupervised contrastive learning (CL)-based multimodal foundation (MF) model specifically tailored for discovering small molecules with potential antibiotic properties (AP) using three types of molecular data. This model employs 1.6 million bioactive molecules with drug-like properties from the ChEMBL dataset to jointly pretrain three encoders: (1) a transformer-based encoder with rotary position embedding for processing SMILES strings; (2) another transformer-based encoder, incorporating a novel bi-level routing attention mechanism to handle molecular graph representations; and (3) a Morgan fingerprint encoder using a multilayer perceptron, to achieve the contrastive learning purpose. The CL-MFAP outperforms baseline models in antibiotic property prediction by effectively utilizing different molecular modalities and demonstrates superior domain-specific performance when fine-tuned for antibiotic-related property prediction tasks.
- Abstract(参考訳): 抗生物質耐性の高まりにより、この世界的な健康問題に対処するためには、抗生物質の可能性を持つ新規化合物の同定が不可欠である。
しかし、従来の医薬品開発手法は高価で非効率である。
より効果的なソリューションの必要性を認識した研究者たちは、新しい抗生物質の予測と開発を効率化する機械学習技術に目を向けた。
基礎モデルは抗生物質発見の可能性を示してきたが、現在の主流の取り組みは、マルチモーダルな分子データの可能性を完全に活用するには至っていない。
近年の研究では、マルチモーダルデータを用いたコントラスト学習フレームワークは、様々な領域にわたる表現学習において優れた性能を示すことが示唆されている。
CL-MFAP(CL-MFAP)は3種類の分子データを用いて,抗生作用を有する小分子の発見に適した,教師なしコントラスト学習(CL)に基づくマルチモーダル基礎(MF)モデルである。
本モデルでは,ChEMBLデータセットの薬物様特性を持つ1.6万個の生物活性分子を用いて,(1)SMILES文字列処理のための回転位置埋め込みを有するトランスフォーマーベースのエンコーダ,(2)分子グラフ表現処理のための新規なバイレベルルーティングアテンション機構を組み込んだトランスフォーマーベースのエンコーダ,(3)多層パーセプトロンを用いたモーガン指紋エンコーダを用いて,コントラスト学習の目的を達成する。
CL-MFAPは、異なる分子モードを有効利用することにより、抗生物質特性予測におけるベースラインモデルより優れ、抗生物質関連特性予測タスクの微調整時に、ドメイン特異的性能が優れていることを示す。
関連論文リスト
- FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Contrastive Dual-Interaction Graph Neural Network for Molecular Property Prediction [0.0]
本稿では,分子特性予測のための自己教師付きグラフニューラルネットワークフレームワークであるDIG-Molを紹介する。
DIG-Molは2つの相互接続ネットワークと運動量蒸留ネットワークを統合し、分子特性を効率的に改善する。
我々は,様々な分子特性予測タスクにおける広範囲な実験的評価により,DIG-Molの最先端性能を確立した。
論文 参考訳(メタデータ) (2024-05-04T10:09:27Z) - Integrating Chemical Language and Molecular Graph in Multimodal Fused Deep Learning for Drug Property Prediction [9.388979080270103]
分子表現の異なる多モード深層学習モデルを構築した。
モノモーダルモデルと比較すると,マルチモーダルフューズドディープラーニング(MMFDL)モデルは単一モデルよりも精度,信頼性,耐雑音性に優れている。
論文 参考訳(メタデータ) (2023-12-29T07:19:42Z) - Multi-objective Molecular Optimization for Opioid Use Disorder Treatment
Using Generative Network Complex [5.33208055504216]
オピオイド・ユース障害(OUD)が世界的な健康問題として浮上している。
本研究では,微分方程式(SDE)に基づく拡散モデルと事前学習された自己エンコーダモデルの潜在空間を結合した深部生成モデルを提案する。
分子発生器は、複数の標的に有効である分子の効率的な生成を可能にする。
論文 参考訳(メタデータ) (2023-06-13T01:12:31Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Random Copolymer inverse design system orienting on Accurate discovering
of Antimicrobial peptide-mimetic copolymers [9.416757363901295]
我々は,多モデル共重合表現学習,知識蒸留,強化学習による共通ランダム共重合逆設計システムを開発した。
知識蒸留による足場・デコレータ生成モデルの事前学習により、コポリマー空間は、探索のための既存のデータに近い空間に大きく収縮する。
我々の強化学習アルゴリズムは、特定の足場とプロパティや構造に関する要件に基づいてカスタマイズされた生成に適応することができる。
論文 参考訳(メタデータ) (2022-11-30T14:29:50Z) - Improved Drug-target Interaction Prediction with Intermolecular Graph
Transformer [98.8319016075089]
本稿では,3方向トランスフォーマーアーキテクチャを用いて分子間情報をモデル化する手法を提案する。
分子間グラフ変換器(IGT)は、それぞれ、結合活性と結合ポーズ予測の2番目のベストに対して、最先端のアプローチを9.1%と20.5%で上回っている。
IGTはSARS-CoV-2に対して有望な薬物スクリーニング能力を示す。
論文 参考訳(メタデータ) (2021-10-14T13:28:02Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - Accelerating Antimicrobial Discovery with Controllable Deep Generative
Models and Molecular Dynamics [109.70543391923344]
CLaSS(Controlled Latent attribute Space Smpling)は、分子の属性制御のための効率的な計算手法である。
深層学習分類器と原子論シミュレーションから得られた新しい特徴を併用して, 生成分子を付加的なキー属性としてスクリーニングする。
提案手法は, 強い広帯域能を有する非毒性抗菌性ペプチド(AMP)を設計するためのものである。
論文 参考訳(メタデータ) (2020-05-22T15:57:58Z) - Ensemble Transfer Learning for the Prediction of Anti-Cancer Drug
Response [49.86828302591469]
本稿では,抗がん剤感受性の予測にトランスファーラーニングを適用した。
我々は、ソースデータセット上で予測モデルをトレーニングし、ターゲットデータセット上でそれを洗練する古典的な転送学習フレームワークを適用した。
アンサンブル転送学習パイプラインは、LightGBMと異なるアーキテクチャを持つ2つのディープニューラルネットワーク(DNN)モデルを使用して実装されている。
論文 参考訳(メタデータ) (2020-05-13T20:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。