論文の概要: Are VAEs Bad at Reconstructing Molecular Graphs?
- arxiv url: http://arxiv.org/abs/2305.03041v1
- Date: Thu, 4 May 2023 17:58:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 14:17:13.306485
- Title: Are VAEs Bad at Reconstructing Molecular Graphs?
- Title(参考訳): VAEは分子グラフの再構築に不向きか?
- Authors: Hagen Muenkler, Hubert Misztela, Michal Pikusa, Marwin Segler, Nadine
Schneider, Krzysztof Maziarz
- Abstract要約: また,複数の最先端生成モデルが同一条件下で評価された場合,その再現精度は驚くほど低いことを示す。
再現性の向上は直接的にサンプリングや最適化のパフォーマンス向上につながるものではないことを示す。
- 参考スコア(独自算出の注目度): 0.8738116412366389
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many contemporary generative models of molecules are variational
auto-encoders of molecular graphs. One term in their training loss pertains to
reconstructing the input, yet reconstruction capabilities of state-of-the-art
models have not yet been thoroughly compared on a large and chemically diverse
dataset. In this work, we show that when several state-of-the-art generative
models are evaluated under the same conditions, their reconstruction accuracy
is surprisingly low, worse than what was previously reported on seemingly
harder datasets. However, we show that improving reconstruction does not
directly lead to better sampling or optimization performance. Failed
reconstructions from the MoLeR model are usually similar to the inputs,
assembling the same motifs in a different way, and possess similar chemical
properties such as solubility. Finally, we show that the input molecule and its
failed reconstruction are usually mapped by the different encoders to
statistically distinguishable posterior distributions, hinting that posterior
collapse may not fully explain why VAEs are bad at reconstructing molecular
graphs.
- Abstract(参考訳): 分子の現代の生成モデルは、分子グラフの変分オートエンコーダである。
トレーニング損失の1つの期間は、入力の再構築に関連するが、最先端モデルの再構築能力は、大規模で化学的に多様なデータセットで完全に比較されていない。
本研究は,複数の最先端生成モデルが同一条件下で評価された場合,その復元精度は従来報告されていたより驚くほど低く,より難しいデータセットで報告されていたものより劣っていることを示す。
しかし,リコンストラクションの改善は,直接サンプリングや最適化性能の向上につながるものではない。
MoLeRモデルからの欠損した再構成は通常、入力と似ており、同じモチーフを異なる方法で組み立て、溶解度などの類似した化学的性質を有する。
最後に, 入力分子とその欠損した再構成が, 異なるエンコーダによって, 統計的に識別可能な後方分布にマッピングされていることを示し, 後方崩壊がvaesが分子グラフの再構成に悪影響を与える理由を完全に説明できないことを示唆する。
関連論文リスト
- Deconstructing equivariant representations in molecular systems [6.841858294458366]
本稿では,QM9データセット上での単純な同変グラフ畳み込みモデルを用いた実験について報告する。
我々の重要な発見は、スカラー予測タスクでは、多くの既約表現はトレーニング中に単純に無視されることである。
経験的に,未使用の球面高調波の除去がモデル性能を向上させることを示す。
論文 参考訳(メタデータ) (2024-10-10T17:15:46Z) - Self-Consuming Generative Models with Curated Data Provably Optimize Human Preferences [20.629333587044012]
本研究では,データキュレーションが生成モデルの反復的再学習に与える影響について検討する。
報奨モデルに従ってデータをキュレートすると、反復的再訓練手順の期待報酬が最大になることを示す。
論文 参考訳(メタデータ) (2024-06-12T21:28:28Z) - Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models [71.39421638547164]
本稿では,入力分子と再構成グラフの類似性を比較する補助拡散モデルに基づくフレームワークを用いてOOD分子を検出することを提案する。
IDトレーニングサンプルの再構成に向けた生成バイアスのため、OOD分子の類似度スコアは検出を容易にするためにはるかに低い。
本研究は,PGR-MOOD(PGR-MOOD)とよばれる分子OOD検出のためのプロトタイプグラフ再構成のアプローチを開拓し,3つのイノベーションを生かした。
論文 参考訳(メタデータ) (2024-04-24T03:25:53Z) - Is Model Collapse Inevitable? Breaking the Curse of Recursion by Accumulating Real and Synthetic Data [49.73114504515852]
各世代の合成データによって元の実データを置き換えることは、モデル崩壊の傾向にあることを示す。
生成した実データと連続する合成データの蓄積は,モデル崩壊を回避することを実証する。
論文 参考訳(メタデータ) (2024-04-01T18:31:24Z) - A novel molecule generative model of VAE combined with Transformer for unseen structure generation [0.0]
トランスフォーマーとVAEは強力なモデルとして広く使われているが、構造的ミスマッチと性能的ミスマッチのために組み合わせて使われることは滅多にない。
本研究では, この2つのモデルを組み合わせて, 多様な分子の処理における構造とパラメータの最適化を行うモデルを提案する。
提案モデルでは, 既存の分子生成モデルに匹敵する性能を示し, 未知の構造を持つ分子生成モデルにおいて, はるかに優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-19T08:46:04Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Explicitly Minimizing the Blur Error of Variational Autoencoders [7.902207366910121]
変分オートエンコーダ(VAE)は強力な生成モデリング手法である。
VAEは、訓練された画像と比較してぼやけたサンプルや復元に苦しむ。
本稿では,ぼやけた画像の生成を特に罰するVOEの再構成項の新たな定式化を提案する。
論文 参考訳(メタデータ) (2023-04-12T16:03:36Z) - Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。
我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。
CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-05-18T15:13:00Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z) - Conditional Constrained Graph Variational Autoencoders for Molecule
Design [70.59828655929194]
本稿では、このキーイデアを最先端のモデルで実装した、条件制約付きグラフ変分オートエンコーダ(CCGVAE)を提案する。
分子生成のために広く採用されている2つのデータセットについて、いくつかの評価指標について改善した結果を示す。
論文 参考訳(メタデータ) (2020-09-01T21:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。