論文の概要: A Group Symmetric Stochastic Differential Equation Model for Molecule
Multi-modal Pretraining
- arxiv url: http://arxiv.org/abs/2305.18407v1
- Date: Sun, 28 May 2023 15:56:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 21:33:48.995287
- Title: A Group Symmetric Stochastic Differential Equation Model for Molecule
Multi-modal Pretraining
- Title(参考訳): 分子マルチモーダルプリトレーニングのための群対称確率微分方程式モデル
- Authors: Shengchao Liu, Weitao Du, Zhiming Ma, Hongyu Guo, Jian Tang
- Abstract要約: 分子プレトレーニングは、AIベースの薬物発見のパフォーマンスを高めるために、急速にゴーツースキーマになっている。
本稿では,2次元トポロジーから3次元反射を生成するMoleculeSDEを提案する。
プレトレーニングベースライン17点と比較することにより,32のダウンストリームタスク中26点において,MoleculeSDEが最先端のパフォーマンスを持つ表現表現を学習できることを実証的に検証する。
- 参考スコア(独自算出の注目度): 36.48602272037559
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecule pretraining has quickly become the go-to schema to boost the
performance of AI-based drug discovery. Naturally, molecules can be represented
as 2D topological graphs or 3D geometric point clouds. Although most existing
pertaining methods focus on merely the single modality, recent research has
shown that maximizing the mutual information (MI) between such two modalities
enhances the molecule representation ability. Meanwhile, existing molecule
multi-modal pretraining approaches approximate MI based on the representation
space encoded from the topology and geometry, thus resulting in the loss of
critical structural information of molecules. To address this issue, we propose
MoleculeSDE. MoleculeSDE leverages group symmetric (e.g., SE(3)-equivariant and
reflection-antisymmetric) stochastic differential equation models to generate
the 3D geometries from 2D topologies, and vice versa, directly in the input
space. It not only obtains tighter MI bound but also enables prosperous
downstream tasks than the previous work. By comparing with 17 pretraining
baselines, we empirically verify that MoleculeSDE can learn an expressive
representation with state-of-the-art performance on 26 out of 32 downstream
tasks.
- Abstract(参考訳): 分子事前トレーニングは、AIベースの薬物発見のパフォーマンスを高めるための、急速にゴーツースキーマになりつつある。
当然、分子は2次元トポロジカルグラフや3次元幾何学的点雲として表すことができる。
既存のほとんどの関連手法は単一のモダリティにのみ焦点をあてているが、最近の研究により、これらの2つのモダリティ間の相互情報(MI)の最大化は分子表現能力を高めることが示されている。
一方、既存の分子のマルチモーダル事前学習は、トポロジーと幾何学から符号化された表現空間に基づいて近似MIに近づき、分子の臨界構造情報が失われる。
この問題に対処するため,MoleculeSDEを提案する。
分子SDEは群対称(SE(3)-等変および反射反対称)確率微分方程式モデルを利用して、2Dトポロジーから3次元幾何学を生成する。
より厳密なMIバウンドを得るだけでなく、以前の作業よりも豊富な下流タスクを可能にする。
プレトレーニングベースライン17点と比較することにより,32のダウンストリームタスク中26点において,MoleculeSDEが最先端のパフォーマンスを持つ表現表現を学習できることを実証的に検証する。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Pre-training of Molecular GNNs via Conditional Boltzmann Generator [0.0]
分子配座のデータセットを用いた分子GNNの事前学習法を提案する。
本モデルは,既存の事前学習法よりも分子特性の予測性能がよいことを示す。
論文 参考訳(メタデータ) (2023-12-20T15:30:15Z) - Molecule Joint Auto-Encoding: Trajectory Pretraining with 2D and 3D
Diffusion [19.151643496588022]
分子ジョイントオートエンコーディング(分子JAE)の事前学習法を提案する。
MoleculeJAEは2D結合(トポロジー)と3D配座(幾何学)の両方の情報を学習することができる。
MoleculeJAEは、20タスク中15タスクで最先端のパフォーマンスに到達することで、その効果を実証している。
論文 参考訳(メタデータ) (2023-12-06T12:58:37Z) - Geometric Latent Diffusion Models for 3D Molecule Generation [172.15028281732737]
生成モデル、特に拡散モデル(DM)は、特徴豊富な測地を生成する上で有望な結果を得た。
我々はGeoLDM(Geometric Latent Diffusion Models)と呼ばれる新しい3次元分子生成法を提案する。
論文 参考訳(メタデータ) (2023-05-02T01:07:22Z) - MUDiff: Unified Diffusion for Complete Molecule Generation [104.7021929437504]
本稿では,原子の特徴,2次元離散分子構造,および3次元連続分子座標を含む分子の包括的表現を生成する新しいモデルを提案する。
拡散過程を認知するための新しいグラフトランスフォーマーアーキテクチャを提案する。
我々のモデルは、安定で多様な分子を設計するための有望なアプローチであり、分子モデリングの幅広いタスクに適用できる。
論文 参考訳(メタデータ) (2023-04-28T04:25:57Z) - Learning Harmonic Molecular Representations on Riemannian Manifold [18.49126496517951]
分子表現学習は、AIによる薬物発見研究において重要な役割を担っている。
本研究では,その分子表面のラプラス・ベルトラミ固有関数を用いた分子を表現する高調波分子表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-27T18:02:47Z) - Geometry-Complete Diffusion for 3D Molecule Generation and Optimization [3.8366697175402225]
3次元分子生成のための幾何-完全拡散モデル(GCDM)を導入する。
GCDMは、既存の3次元分子拡散モデルよりも条件および非条件設定間で大きなマージンで優れている。
また、GCDMの幾何学的特徴は、既存の3次元分子の幾何学的および化学組成を一貫して最適化するために再利用可能であることも示している。
論文 参考訳(メタデータ) (2023-02-08T20:01:51Z) - GeoMol: Torsional Geometric Generation of Molecular 3D Conformer
Ensembles [60.12186997181117]
分子グラフからの分子の3Dコンホメーラーアンサンブルの予測は、化学情報学と薬物発見の領域において重要な役割を担っている。
既存の生成モデルは、重要な分子幾何学的要素のモデリングの欠如を含むいくつかの欠点がある。
エンド・ツー・エンド、非自己回帰、SE(3)不変の機械学習手法であるGeoMolを提案し、3Dコンバータを生成する。
論文 参考訳(メタデータ) (2021-06-08T14:17:59Z) - An End-to-End Framework for Molecular Conformation Generation via
Bilevel Programming [71.82571553927619]
分子コンフォメーション予測のためのエンドツーエンドソリューションであるconfvaeを提案する。
具体的には、まず分子グラフを潜時空間に符号化し、3次元構造は原理化された二段階最適化プログラムを解くことによって生成される。
論文 参考訳(メタデータ) (2021-05-15T15:22:29Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。