論文の概要: How Molecules Impact Cells: Unlocking Contrastive PhenoMolecular Retrieval
- arxiv url: http://arxiv.org/abs/2409.08302v1
- Date: Tue, 10 Sep 2024 18:16:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-16 18:46:54.811834
- Title: How Molecules Impact Cells: Unlocking Contrastive PhenoMolecular Retrieval
- Title(参考訳): 分子が細胞にどのように影響するか:対照的な分子の検索を解き放つ
- Authors: Philip Fradkin, Puria Azadi, Karush Suri, Frederik Wenkel, Ali Bashashati, Maciej Sypetkowski, Dominique Beaini,
- Abstract要約: 分子構造と微視的表現実験の結合潜時空間を学習し、対のサンプルを対照的な学習と整列する。
我々は、これまでの最先端技術と比較して、ゼロショット分子の検索が8.1倍向上し、トップ1%の精度で77.33%に達したことを実証した。
これらの結果は、仮想フェノミクススクリーニングに機械学習を適用するための扉を開く。
- 参考スコア(独自算出の注目度): 6.77417215041515
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Predicting molecular impact on cellular function is a core challenge in therapeutic design. Phenomic experiments, designed to capture cellular morphology, utilize microscopy based techniques and demonstrate a high throughput solution for uncovering molecular impact on the cell. In this work, we learn a joint latent space between molecular structures and microscopy phenomic experiments, aligning paired samples with contrastive learning. Specifically, we study the problem ofContrastive PhenoMolecular Retrieval, which consists of zero-shot molecular structure identification conditioned on phenomic experiments. We assess challenges in multi-modal learning of phenomics and molecular modalities such as experimental batch effect, inactive molecule perturbations, and encoding perturbation concentration. We demonstrate improved multi-modal learner retrieval through (1) a uni-modal pre-trained phenomics model, (2) a novel inter sample similarity aware loss, and (3) models conditioned on a representation of molecular concentration. Following this recipe, we propose MolPhenix, a molecular phenomics model. MolPhenix leverages a pre-trained phenomics model to demonstrate significant performance gains across perturbation concentrations, molecular scaffolds, and activity thresholds. In particular, we demonstrate an 8.1x improvement in zero shot molecular retrieval of active molecules over the previous state-of-the-art, reaching 77.33% in top-1% accuracy. These results open the door for machine learning to be applied in virtual phenomics screening, which can significantly benefit drug discovery applications.
- Abstract(参考訳): 細胞機能に対する分子的影響を予測することは、治療設計における中核的な課題である。
細胞形態を捉えるために設計されたフェノミクス実験は、顕微鏡に基づく手法を用いて、細胞への分子的影響を明らかにするための高いスループットのソリューションを実証する。
本研究では,分子構造と微視的現象実験の結合潜時空間を学習し,対と対のサンプルを対比学習で整列する。
具体的には, 表現実験で条件付きゼロショット分子構造同定法であるContrastive PhenoMolecular Retrievalの問題について検討する。
実験バッチ効果,不活性な分子摂動,摂動濃度の符号化など,表現学と分子モードのマルチモーダル学習における課題を評価する。
我々は,(1)単モード事前学習表現モデル,(2)新しいサンプル間類似性認識損失モデル,(3)分子濃度の表現を条件としたモデルを用いて,改良されたマルチモーダル学習者検索を実証した。
本法に続いて分子フェノミクスモデルである MolPhenix を提案する。
MolPhenixは、トレーニング済みのフェノミクスモデルを利用して、摂動濃度、分子足場、活動しきい値間で大きなパフォーマンス向上を示す。
特に、これまでの最先端技術と比較して、ゼロショット分子による活性分子の検索が8.1倍向上し、トップ1%の精度で77.33%に達した。
これらの結果は、仮想フェノミクススクリーニングに機械学習を適用するための扉を開く。
関連論文リスト
- Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - D3MES: Diffusion Transformer with multihead equivariant self-attention for 3D molecule generation [1.3791394805787949]
本稿では,拡散モデルDiffusion Transformerとマルチヘッド同型自己アテンションを組み合わせた3次元分子生成のための拡散モデルを提案する。
この方法は、2つの主要な課題に対処する: 水素原子を除去した後、分子の表現を学ぶことによって生成分子に水素原子を正しく取り付けること; 同時に複数のクラスにまたがる分子を生成できない既存のモデルの限界を克服すること。
論文 参考訳(メタデータ) (2025-01-13T06:16:11Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - FREED++: Improving RL Agents for Fragment-Based Molecule Generation by
Thorough Reproduction [33.57089414199478]
強化学習(Reinforcement Learning, RL)はドッキングスコア(DS)を報奨として分子を生成するための有望なアプローチとして登場した。
我々はFREED(arXiv:2110.01219)と呼ばれる分子生成の最近のモデルを再現し、精査し、改善する
論文 参考訳(メタデータ) (2024-01-18T09:54:19Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Improving Molecular Contrastive Learning via Faulty Negative Mitigation
and Decomposed Fragment Contrast [17.142976840521264]
グラフニューラルネットワーク(GNN)を用いた表現の分子コントラスト学習の改善のためのiMolCLRを提案する。
実験の結果,提案手法はGNNモデルの性能を著しく向上させることがわかった。
iMolCLRは本質的に分子の類似性を推論できる足場や官能基を埋め込む。
論文 参考訳(メタデータ) (2022-02-18T18:33:27Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。