論文の概要: Representation-Guided Discrete Molecular Graph Retrosynthesis
- arxiv url: http://arxiv.org/abs/2605.24428v1
- Date: Sat, 23 May 2026 06:49:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.052767
- Title: Representation-Guided Discrete Molecular Graph Retrosynthesis
- Title(参考訳): Representation-Guided Discrete Molecular Graph Retro synthesis
- Authors: Jiahai Huang, Anjie Qiao, Zhen Wang, Defu Lian, Yutong Lu,
- Abstract要約: GRGは58.6 / 77.2 / 83.4 / 87.1 top-1 / 3 / 5 / 10 accuracy on USPTO-50k。
GRGは、アウト・オブ・ディストリビューション設定ですべてのトップkメトリクスを一貫して改善する。
GRGはエポックの数を35%減らし、ウォールクロックの時間を30%減らして同等のパフォーマンスを得る。
- 参考スコア(独自算出の注目度): 50.11269464321367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stochastic process-based molecular graph generators have become the state of the art for template-free single-step retrosynthesis. However, these models are typically trained only on product-reactant pairs, thereby acquiring chemistry-relevant representations in an indirect and implicit manner. Meanwhile, recent advances in computer vision demonstrate that offering representation guidance to a generator can effectively distill semantics from pretrained encoders into DiTs, substantially improving both convergence and generation quality. Whether similar gains extend to the retrosynthesis task, and what graph-specific design choices can make them work, remains an open question. To address these questions, we conduct a systematic empirical study over a unified design space spanning teacher molecular representations, endpoint and granularity choices, injection depths in the denoiser, correspondence strategies and guidance scheme. Guided by these considerations, we develop Graph-oriented Representation Guidance (GRG), which achieves 58.6 / 77.2 / 83.4 / 87.1 top-1 / 3 / 5 / 10 accuracy on USPTO-50k, while increasing diversity to 15.5, both substantially outperforming the adopted base generator. Notably, GRG consistently improves all top-k metrics in out-of-distribution settings, suggesting that representation guidance facilitates the acquisition of intrinsic chemical semantics. Meanwhile, the introduced representation guidance reduces the number of epochs by 35% and the wall-clock time by 30% to reach comparable performance. In addition, we introduce a simple yet effective representation-similarity-based reranking mechanism, which further improves the top of the ranked list without training an additional verifier.
- Abstract(参考訳): 確率過程に基づく分子グラフ生成器は、テンプレートのない単一ステップの逆合成の最先端となった。
しかしながら、これらのモデルは通常、生成反応対のみに基づいて訓練され、したがって間接的かつ暗黙的に化学関連表現を得る。
一方、近年のコンピュータビジョンの進歩により、ジェネレータに表現指導を提供することで、事前学習したエンコーダのセマンティクスをDiTに効果的に蒸留することができ、コンバージェンスと生成品質の両方を大幅に改善できることが示されている。
同様の利益がレトロシンセシスタスクにまで拡大するかどうか、グラフ固有の設計選択が機能するかは、未解決の問題である。
これらの課題に対処するため,教師の分子表現,エンドポイントと粒度選択,デノイザ内の注入深度,対応戦略,指導スキームにまたがる統一設計空間について,系統的な実証的研究を行った。
これらの考察を参考に、58.6 / 77.2 / 83.4 / 87.1 top-1 / 3 / 5 / 10 accuracy on USPTO-50k、多様性は15.5まで増加し、いずれも採用されているベースジェネレータを大幅に上回っているグラフ指向表現誘導(GRG)を開発した。
特にGRGは、分配外設定ですべてのトップkメトリクスを一貫して改善し、表現指導が本質的な化学意味論の獲得を促進することを示唆している。
一方、表現指導を導入することで、エポックの回数を35%減らし、ウォールクロック時間を30%減らし、同等のパフォーマンスを得ることができる。
さらに,簡易かつ効果的な表現類似性に基づくランク付け機構を導入し,さらなる検証を行なわずにランクリストの上位部をさらに改善する。
関連論文リスト
- Toward Better Geometric Representations for Molecule Generative Models [34.04020604759628]
LENSEsは、表現条件付き生成法における分子表現の可能性をうまく活用するフレームワークである。
分子生成タスクによるこれらの改善の有効性を実証する。
論文 参考訳(メタデータ) (2026-05-08T13:02:58Z) - Molecular Identifier Visual Prompt and Verifiable Reinforcement Learning for Chemical Reaction Diagram Parsing [52.825281124618535]
反応図解析(RxnDP)は、文献から化学合成情報を抽出するために重要である。
近年の視覚言語モデル(VLM)はこの複雑な視覚的推論タスクを自動化するための有望なパラダイムとして登場した。
この研究はVLMベースのRxnDPを2つの相補的視点、すなわち表現の促進と学習パラダイムから強化する。
論文 参考訳(メタデータ) (2026-03-16T09:17:05Z) - Think-on-Graph 3.0: Efficient and Adaptive LLM Reasoning on Heterogeneous Graphs via Multi-Agent Dual-Evolving Context Retrieval [35.65907480060404]
Think-on-Graph 3.0 (ToG-3) は、制約を克服するためにMulti-Agent Context Evolution and Retrieval (MACER) メカニズムを導入した新しいフレームワークである。
我々の中心となる革新は、チャンク・トリプレット・コミュニティ・ヘテロジニアスグラフ指数の動的構築と洗練である。
マルチエージェントシステムは、エビデンス検索、回答生成、十分性、そして決定的に進化するクエリとサブグラフの反復的なプロセスに関与する。
論文 参考訳(メタデータ) (2025-09-26T00:13:10Z) - UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment [51.49238426241974]
本稿では,テンプレートのないグラフ・ツー・シーケンスパイプラインであるUAlignを紹介した。
グラフニューラルネットワークとトランスフォーマーを組み合わせることで、分子固有のグラフ構造をより効果的に活用することができる。
論文 参考訳(メタデータ) (2024-03-25T03:23:03Z) - Similarity-aware Positive Instance Sampling for Graph Contrastive
Pre-training [82.68805025636165]
トレーニングセット内の既存グラフから直接正のグラフインスタンスを選択することを提案する。
私たちの選択は、特定のドメイン固有のペアワイズ類似度測定に基づいています。
さらに,ノードを動的にマスキングしてグラフ上に均等に分配する適応ノードレベルの事前学習手法を開発した。
論文 参考訳(メタデータ) (2022-06-23T20:12:51Z) - G2GT: Retrosynthesis Prediction with Graph to Graph Attention Neural
Network and Self-Training [0.0]
再合成予測は有機化学および関連分野における基本的な課題の1つである。
本稿では,グラフエンコーダとグラフデコーダを標準トランス構造上に構築した新しいグラフ-グラフ変換モデルG2GTを提案する。
本稿では,データ拡張手法である自己学習が,モデルの性能を著しく向上させることを示す。
論文 参考訳(メタデータ) (2022-04-19T01:55:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。