論文の概要: Multi-view biomedical foundation models for molecule-target and property prediction
- arxiv url: http://arxiv.org/abs/2410.19704v1
- Date: Fri, 25 Oct 2024 17:22:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-28 13:33:29.747743
- Title: Multi-view biomedical foundation models for molecule-target and property prediction
- Title(参考訳): 分子標的の多視点バイオメディカル基礎モデルと特性予測
- Authors: Parthasarathy Suryanarayanan, Yunguang Qiu, Shreyans Sethi, Diwakar Mahajan, Hongyang Li, Yuxin Yang, Elif Eyigoz, Aldo Guzman Saenz, Daniel E. Platt, Timothy H. Rumbell, Kenney Ng, Sanjoy Dey, Myson Burch, Bum Chul Kwon, Pablo Meyer, Feixiong Cheng, Jianying Hu, Joseph A. Morrone,
- Abstract要約: グラフ,画像,テキストの分子ビューを統合する多視点基礎モデルアプローチを開発した。
マルチビューモデルが頑健に動作し、特定のビューの長所と短所のバランスをとることができることを示す。
次に、このモデルを用いて、Gタンパク質結合受容体(GPCR)の大きな(>100ターゲット)セットに対する化合物のスクリーニングを行う。
- 参考スコア(独自算出の注目度): 15.123866994468917
- License:
- Abstract: Foundation models applied to bio-molecular space hold promise to accelerate drug discovery. Molecular representation is key to building such models. Previous works have typically focused on a single representation or view of the molecules. Here, we develop a multi-view foundation model approach, that integrates molecular views of graph, image and text. Single-view foundation models are each pre-trained on a dataset of up to 200M molecules and then aggregated into combined representations. Our multi-view model is validated on a diverse set of 18 tasks, encompassing ligand-protein binding, molecular solubility, metabolism and toxicity. We show that the multi-view models perform robustly and are able to balance the strengths and weaknesses of specific views. We then apply this model to screen compounds against a large (>100 targets) set of G Protein-Coupled receptors (GPCRs). From this library of targets, we identify 33 that are related to Alzheimer's disease. On this subset, we employ our model to identify strong binders, which are validated through structure-based modeling and identification of key binding motifs.
- Abstract(参考訳): 生体分子空間に適用された基礎モデルは、薬物発見の加速を約束する。
分子表現はそのようなモデルを構築する上で鍵となる。
これまでの研究は、分子の単一の表現やビューに重点を置いてきた。
本稿では,グラフ,画像,テキストの分子ビューを統合する多視点基礎モデルを提案する。
単一ビュー基礎モデルは、それぞれ最大2億分子のデータセット上で事前訓練され、その後、組み合わせた表現に集約される。
マルチビューモデルは, リガンド-タンパク質結合, 分子溶解度, 代謝, 毒性を含む18のタスクの多様なセットで検証される。
マルチビューモデルが頑健に動作し、特定のビューの長所と短所のバランスをとることができることを示す。
次に、このモデルをGタンパク質結合受容体(GPCR)の大きな(>100ターゲット)セットに対する化合物のスクリーニングに適用する。
本研究の目的は,アルツハイマー病に関連する33の疾患を同定することである。
このサブセットでは、構造に基づくモデリングとキーバインディングモチーフの同定によって検証される強いバインダーを同定するために、我々のモデルを用いる。
関連論文リスト
- UniIF: Unified Molecule Inverse Folding [67.60267592514381]
全分子の逆折り畳みのための統一モデルUniIFを提案する。
提案手法は,全タスクにおける最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-05-29T10:26:16Z) - Multi-Modal Representation Learning for Molecular Property Prediction:
Sequence, Graph, Geometry [6.049566024728809]
深層学習に基づく分子特性予測は、従来の手法の資源集約性に対する解決策として登場した。
本稿では,分子特性予測のための新しいマルチモーダル表現学習モデルSGGRLを提案する。
モダリティ間の整合性を確保するため、SGGRLは異なる分子の類似性を最小化しながら同じ分子の表現の類似性を最大化するように訓練される。
論文 参考訳(メタデータ) (2024-01-07T02:18:00Z) - Integrating Chemical Language and Molecular Graph in Multimodal Fused Deep Learning for Drug Property Prediction [9.388979080270103]
分子表現の異なる多モード深層学習モデルを構築した。
モノモーダルモデルと比較すると,マルチモーダルフューズドディープラーニング(MMFDL)モデルは単一モデルよりも精度,信頼性,耐雑音性に優れている。
論文 参考訳(メタデータ) (2023-12-29T07:19:42Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Atom-Motif Contrastive Transformer for Molecular Property Prediction [68.85399466928976]
グラフトランス (GT) モデルは分子特性予測 (MPP) のタスクで広く利用されている。
本稿では,原子レベルの相互作用を探索し,モチーフレベルの相互作用を考慮した新しいAtom-Motif Contrastive Transformer(AMCT)を提案する。
提案したAMCTは,7つの一般的なベンチマークデータセットに対して広範囲に評価され,定量的および定性的な結果の両方が有効であることを示す。
論文 参考訳(メタデータ) (2023-10-11T10:03:10Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Structure-aware generation of drug-like molecules [2.449909275410288]
深部生成法は、新しい分子をスクラッチから提案する(デノボ設計)。
本稿では, 分子間空間における3次元ポーズと協調して分子グラフを生成する新しい教師付きモデルを提案する。
ドッキングベンチマークを用いて,ドッキングモデルの評価を行い,ドッキング生成によって予測される結合親和性が8%向上し,薬物類似度が10%向上することが確認された。
論文 参考訳(メタデータ) (2021-11-07T15:19:54Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。