Fugu-MT 論文翻訳(概要): Characterizing the Latent Space of Molecular Deep Generative Models with Persistent Homology Metrics

論文の概要: Characterizing the Latent Space of Molecular Deep Generative Models with Persistent Homology Metrics

arxiv url: http://arxiv.org/abs/2010.08548v2
Date: Mon, 7 Jun 2021 16:29:56 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-06 04:31:42.092351
Title: Characterizing the Latent Space of Molecular Deep Generative Models with Persistent Homology Metrics
Title（参考訳）: 持続的ホモロジー計量を用いた分子深部生成モデルの潜時空間のキャラクタリゼーション
Authors: Yair Schiff, Vijil Chenthamarakshan, Karthikeyan Natesan Ramamurthy, Payel Das
Abstract要約: 変分オート(VAE)は、エンコーダとデコーダのネットワークペアをトレーニングデータ分散の再構築のために訓練する生成モデルである。本研究では, 深部生成モデルの潜伏空間が, 構造的および化学的特徴をエンコードできるかどうかを計測する手法を提案する。
参考スコア（独自算出の注目度）: 21.95240820041655
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep generative models are increasingly becoming integral parts of the in silico molecule design pipeline and have dual goals of learning the chemical and structural features that render candidate molecules viable while also being flexible enough to generate novel designs. Specifically, Variational Auto Encoders (VAEs) are generative models in which encoder-decoder network pairs are trained to reconstruct training data distributions in such a way that the latent space of the encoder network is smooth. Therefore, novel candidates can be found by sampling from this latent space. However, the scope of architectures and hyperparameters is vast and choosing the best combination for in silico discovery has important implications for downstream success. Therefore, it is important to develop a principled methodology for distinguishing how well a given generative model is able to learn salient molecular features. In this work, we propose a method for measuring how well the latent space of deep generative models is able to encode structural and chemical features of molecular datasets by correlating latent space metrics with metrics from the field of topological data analysis (TDA). We apply our evaluation methodology to a VAE trained on SMILES strings and show that 3D topology information is consistently encoded throughout the latent space of the model.
Abstract（参考訳）: 深層生成モデルはインシリコ分子設計パイプラインの不可欠な部分となりつつあり、候補分子を存続させる化学的および構造的特徴を学習すると同時に、新しい設計を生み出すのに十分な柔軟性を持つという2つの目標を持っている。具体的には、変分オートエンコーダ(VAE)は、エンコーダ-デコーダネットワークペアを訓練して、エンコーダネットワークの潜伏空間が滑らかな方法でトレーニングデータ分散を再構築する生成モデルである。したがって、この潜在空間からサンプリングすることで新しい候補を見つけることができる。しかし、アーキテクチャとハイパーパラメータの範囲は広く、シリカ発見における最良の組み合わせを選択することは、下流の成功に重要な意味を持つ。したがって、与えられた生成モデルが正常な分子的特徴をいかに学べるかを識別するための原則的方法論を開発することが重要である。本研究では,TDA(トポロジカルデータ解析)分野のメトリクスと潜在空間のメトリクスを関連付けることにより,深部生成モデルの潜伏空間が分子データセットの構造的および化学的特徴をどの程度うまくエンコードできるかを測定する手法を提案する。 SMILES文字列で訓練されたVAEに対して評価手法を適用し、3次元トポロジ情報はモデルの潜在空間を通して一貫して符号化されていることを示す。

関連論文リスト

Next Generation Equation-Free Multiscale Modelling of Crowd Dynamics via Machine Learning [0.0]
本稿では,潜在空間における創発的群運動に対する離散的進化演算子を学習するために,多様体と機械学習を組み合わせた手法を提案する。我々のアプローチは4段階であり、高次元空間における再構成された力学の質量を明示的に保存する。
論文参考訳（メタデータ） (2025-08-05T21:39:18Z)
Aligned Manifold Property and Topology Point Clouds for Learning Molecular Properties [55.2480439325792]
この研究は、局所量子由来のスカラー場とカスタムトポロジカルディスクリプタを組み合わせた分子表面表現であるAMPTCRを導入する。分子量については、AMPTCRが物理的に意味のあるデータをコードし、検証R2は0.87であることを確認した。細菌抑制タスクでは、AMPTCRは大腸菌阻害値の分類と直接回帰の両方を可能にする。
論文参考訳（メタデータ） (2025-07-22T04:35:50Z)
DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文参考訳（メタデータ） (2025-02-13T18:29:48Z)
Exploring Discrete Flow Matching for 3D De Novo Molecule Generation [0.0]
フローマッチングは、最近提案されたジェネレーティブモデリングフレームワークで、様々なタスクにおいて印象的なパフォーマンスを実現している。本稿では,既存の手法よりも学習可能なパラメータが少ない3D de novo設計における技術性能の状態を達成した,オープンソースのFlowMol-CTMCを提案する。
論文参考訳（メタデータ） (2024-11-25T18:27:39Z)
Pullback Flow Matching on Data Manifolds [10.187244125099479]
プルバックフローマッチング(Pullback Flow Matching、PFM)は、データ多様体上の生成モデリングのためのフレームワークである。 PFMの有効性を、合成、データダイナミクス、タンパク質配列データに適用し、特定の性質を持つ新規なタンパク質を生成することによって実証する。本手法は, 創薬・材料科学に強い可能性を示し, 特定の性質を持つ新規試料の生成に大きな関心を寄せている。
論文参考訳（メタデータ） (2024-10-06T16:41:26Z)
geom2vec: pretrained GNNs as geometric featurizers for conformational dynamics [0.0]
我々はGeom2vecを紹介し、トレーニング済みグラフニューラルネットワーク(GNN)を普遍的なデファクトライザとして利用する。さらに微調整することなく分子幾何学的パターンを捉えた伝達可能な構造表現を学習する。
論文参考訳（メタデータ） (2024-09-30T00:36:06Z)
Generative Modeling of Molecular Dynamics Trajectories [12.255021091552441]
データからMDの柔軟なマルチタスクサロゲートモデルを学ぶためのパラダイムとして,分子軌道の生成モデルを提案する。このような生成モデルは,前方シミュレーションや遷移経路サンプリング,軌道上アップサンプリングといった多様なタスクに適応可能であることを示す。
論文参考訳（メタデータ） (2024-09-26T13:02:28Z)
Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文参考訳（メタデータ） (2023-05-28T06:30:29Z)
Geometric Latent Diffusion Models for 3D Molecule Generation [172.15028281732737]
生成モデル、特に拡散モデル(DM)は、特徴豊富な測地を生成する上で有望な結果を得た。我々はGeoLDM(Geometric Latent Diffusion Models)と呼ばれる新しい3次元分子生成法を提案する。
論文参考訳（メタデータ） (2023-05-02T01:07:22Z)
VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文参考訳（メタデータ） (2023-04-03T13:13:19Z)
Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文参考訳（メタデータ） (2023-02-04T01:32:40Z)
Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文参考訳（メタデータ） (2022-10-07T17:56:53Z)
Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文参考訳（メタデータ） (2022-08-23T17:01:16Z)
Semi-Supervised Manifold Learning with Complexity Decoupled Chart Autoencoders [45.29194877564103]
本研究は、クラスラベルなどの半教師付き情報を付加できる非対称符号化復号プロセスを備えたチャートオートエンコーダを導入する。このようなネットワークの近似力を議論し、周囲空間の次元ではなく、本質的にデータ多様体の内在次元に依存する境界を導出する。
論文参考訳（メタデータ） (2022-08-22T19:58:03Z)
Augmenting Molecular Deep Generative Models with Topological Data Analysis Representations [21.237758981760784]
分子のトポロジカルデータ解析(TDA)表現を付加したSMILES変分自動エンコーダ(VAE)を提案する。実験の結果, このTDA拡張により, SMILES VAEは3次元幾何学と電子特性の複雑な関係を捉えることができることがわかった。
論文参考訳（メタデータ） (2021-06-08T15:49:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。