論文の概要: Graph VQ-Transformer (GVT): Fast and Accurate Molecular Generation via High-Fidelity Discrete Latents
- arxiv url: http://arxiv.org/abs/2512.02667v1
- Date: Tue, 02 Dec 2025 11:44:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.848344
- Title: Graph VQ-Transformer (GVT): Fast and Accurate Molecular Generation via High-Fidelity Discrete Latents
- Title(参考訳): グラフVQ変換器(GVT):高速かつ高精度な分子生成
- Authors: Haozhuo Zheng, Cheng Wang, Yang Liu,
- Abstract要約: 本稿では,グラフVQ変換器(Graph VQ-Transformer,GVT)について述べる。
我々のアプローチの核となるのは、分子グラフを高忠実な離散潜在配列に圧縮する新しいグラフベクトル量子変分オートコーダ(VQ-VAE)である。
GVTは、ZINC250k、MOSES、GuacaMolといった主要なベンチマークに対して、最先端または高い競争性能を達成する。
- 参考スコア(独自算出の注目度): 6.5389217759933125
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The de novo generation of molecules with desirable properties is a critical challenge, where diffusion models are computationally intensive and autoregressive models struggle with error propagation. In this work, we introduce the Graph VQ-Transformer (GVT), a two-stage generative framework that achieves both high accuracy and efficiency. The core of our approach is a novel Graph Vector Quantized Variational Autoencoder (VQ-VAE) that compresses molecular graphs into high-fidelity discrete latent sequences. By synergistically combining a Graph Transformer with canonical Reverse Cuthill-McKee (RCM) node ordering and Rotary Positional Embeddings (RoPE), our VQ-VAE achieves near-perfect reconstruction rates. An autoregressive Transformer is then trained on these discrete latents, effectively converting graph generation into a well-structured sequence modeling problem. Crucially, this mapping of complex graphs to high-fidelity discrete sequences bridges molecular design with the powerful paradigm of large-scale sequence modeling, unlocking potential synergies with Large Language Models (LLMs). Extensive experiments show that GVT achieves state-of-the-art or highly competitive performance across major benchmarks like ZINC250k, MOSES, and GuacaMol, and notably outperforms leading diffusion models on key distribution similarity metrics such as FCD and KL Divergence. With its superior performance, efficiency, and architectural novelty, GVT not only presents a compelling alternative to diffusion models but also establishes a strong new baseline for the field, paving the way for future research in discrete latent-space molecular generation.
- Abstract(参考訳): 望ましい性質を持つde novo分子の生成は、拡散モデルが計算集約的であり、自己回帰モデルがエラーの伝播に苦しむ重要な課題である。
本稿では,グラフVQ変換器(Graph VQ-Transformer,GVT)について述べる。
我々のアプローチの核となるのは、分子グラフを高忠実な離散潜在配列に圧縮する新しいグラフベクトル量子変分オートコーダ(VQ-VAE)である。
グラフ変換器と標準逆カットヒル・マッキー(RCM)ノードの順序付けとロータリー位置埋め込み(RoPE)を相乗的に組み合わせることで、VQ-VAEはほぼ完璧な復元率が得られる。
自己回帰変換器はこれらの離散潜伏器で訓練され、グラフ生成を十分に構造化されたシーケンスモデリング問題に効果的に変換する。
重要なことに、複雑なグラフから高忠実度離散配列へのマッピングは、大規模シーケンスモデリングの強力なパラダイムで分子設計を橋渡しし、Large Language Models (LLMs) との潜在的なシナジーを解き放つ。
大規模な実験により、GVTはZINC250k、MOSES、GuacaMolのような主要なベンチマークで最先端または高い競争性能を達成し、特にFCDやKL Divergenceのような主要な分布類似性メトリクスに関する主要な拡散モデルよりも優れていることが示されている。
優れた性能、効率、アーキテクチャの新規性により、GVTは拡散モデルに代わる魅力的な選択肢を提供するだけでなく、この分野の強力な新しいベースラインを確立し、離散潜在空間分子生成における将来の研究の道を開く。
関連論文リスト
- A Comparative Study on Dynamic Graph Embedding based on Mamba and Transformers [0.29687381456164]
本研究では,変圧器と最近提案されたMambaアーキテクチャを用いた動的グラフ埋め込み手法の比較解析を行った。
グラフ畳み込みネットワークを用いたTransformerG2G Augment、グラフ同型ネットワークエッジ畳み込みを用いたmathcalDG-Mamba、mathcalGDG-Mambaの3つの新しいモデルを紹介した。
複数のベンチマークデータセットに対する実験により,Mambaベースのモデルが,リンク予測タスクにおけるトランスフォーマーベースのアプローチに匹敵する,あるいは優れた性能を達成できることが示されている。
論文 参考訳(メタデータ) (2024-12-15T19:56:56Z) - Improving Molecular Graph Generation with Flow Matching and Optimal Transport [8.2504828891983]
GGFlowは分子グラフの最適輸送を取り入れた離散フローマッチング生成モデルである。
エッジ拡張グラフ変換器を内蔵し、化学結合間の直接通信を可能にする。
GGFlowは無条件および条件付き分子生成タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-11-08T16:27:27Z) - SeaDAG: Semi-autoregressive Diffusion for Conditional Directed Acyclic Graph Generation [83.52157311471693]
方向性非巡回グラフ(DAG)の条件生成のための半自己回帰拡散モデルSeaDAGを紹介する。
グローバルグラフ構造を欠いた従来の自己回帰生成とは異なり,本手法は拡散ステップ毎に完全なグラフ構造を保持する。
本研究では,現実的なDAGを生成する拡散モデルの能力を高めるために,条件損失を伴うグラフ条件学習を明示的に訓練する。
論文 参考訳(メタデータ) (2024-10-21T15:47:03Z) - DeFoG: Discrete Flow Matching for Graph Generation [45.037260759871124]
DeFoGは、トレーニングからサンプリングをアンタングルするグラフ生成フレームワークである。
本稿では,性能を著しく向上し,必要な精錬工程数を削減できる新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-10-05T18:52:54Z) - IFH: a Diffusion Framework for Flexible Design of Graph Generative Models [53.219279193440734]
グラフ生成モデルは,1行にグラフを生成するワンショットモデルと,ノードとエッジの連続的な付加によるグラフを生成するシーケンシャルモデルという,2つの顕著なファミリーに分類される。
本稿では,逐次度を規定するグラフ生成モデルであるInsert-Fill-Halt(IFH)を提案する。
論文 参考訳(メタデータ) (2024-08-23T16:24:40Z) - Advancing Graph Generation through Beta Diffusion [49.49740940068255]
Graph Beta Diffusion (GBD)は、グラフデータの多様な性質を扱うために特別に設計された生成モデルである。
本稿では, 臨界グラフトポロジを安定化させることにより, 生成グラフの現実性を高める変調手法を提案する。
論文 参考訳(メタデータ) (2024-06-13T17:42:57Z) - Supercharging Graph Transformers with Advective Diffusion [28.40109111316014]
本稿では,この課題に対処するために,物理に着想を得たグラフトランスモデルであるAdvDIFFormerを提案する。
本稿では,AdvDIFFormerが位相シフトによる一般化誤差を制御できることを示す。
経験的に、このモデルは情報ネットワーク、分子スクリーニング、タンパク質相互作用の様々な予測タスクにおいて優位性を示す。
論文 参考訳(メタデータ) (2023-10-10T08:40:47Z) - Score-based Generative Modeling of Graphs via the System of Stochastic
Differential Equations [57.15855198512551]
本稿では,連続時間フレームワークを用いたグラフのスコアベース生成モデルを提案する。
本手法は, トレーニング分布に近い分子を生成できるが, 化学価数則に違反しないことを示す。
論文 参考訳(メタデータ) (2022-02-05T08:21:04Z) - Heterogeneous Graph Transformer [49.675064816860505]
Webスケールの不均一グラフモデリングのための不均一グラフ変換器(HGT)アーキテクチャ
動的ヘテロジニアスグラフを扱うために、HGTに相対時間符号化手法を導入する。
Web スケールのグラフデータを扱うため,ヘテロジニアスなミニバッチグラフサンプリングアルゴリズム--HGSampling--を設計し,効率的かつスケーラブルなトレーニングを行う。
論文 参考訳(メタデータ) (2020-03-03T04:49:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。