論文の概要: FlashMol: High-Quality Molecule Generation in as Few as Four Steps
- arxiv url: http://arxiv.org/abs/2605.07020v1
- Date: Thu, 07 May 2026 23:04:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.66349
- Title: FlashMol: High-Quality Molecule Generation in as Few as Four Steps
- Title(参考訳): FlashMol:4ステップで高品質な分子生成
- Authors: Xinyuan Wei, Zian Li, Shaoheng Yan, Cai Zhou, Muhan Zhang,
- Abstract要約: FlashMolは、高品質な分子配座を4段階で生成する超高速な分子生成モデルである。
QM9とGEOM-DRUGデータセットの実験は、FlashMolが最初の1000ステップの教師にマッチし、さらに上回っていることを示している。
- 参考スコア(独自算出の注目度): 33.25994871049577
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating chemically valid 3D molecular conformations is critical for computational drug discovery. Classical diffusion-based models like GeoLDM perform well but require hundreds of steps, making large-scale in silico screening impractical. Recent efforts on few-step molecular generation have accelerated this process to 12-50 steps, but they often largely sacrifice sample stability. In this work, we present FlashMol, an ultra-fast molecule generative model producing high-quality molecular conformations in as few as 4 steps. To achieve this, we adapt distribution matching distillation (DMD) - a reverse KL-divergence minimization objective - to the molecular domain for effective distillation. Considering the local minimization behavior of DMD, we respace the molecule generation timesteps, providing the generator with much better initialization and enables effective distillation. Additionally, to mitigate the mode-seeking behavior of DMD and improve diversity, we further regularize it with a Jensen-Shannon divergence term, which incorporates the mean-seeking behavior of the forward KL divergence. Extensive experiments on QM9 and GEOM-DRUG datasets demonstrate that FlashMol matches and even surpasses the original 1000-step teacher, achieving up to 250$\times$ acceleration in sampling speed while maintaining high molecular quality.
- Abstract(参考訳): 化学的に有効な3次元分子配座の生成は、計算薬の発見に不可欠である。
GeoLDMのような古典的な拡散ベースのモデルはよく機能するが、数百のステップを必要とする。
数段階の分子生成に関する最近の研究は、この過程を12-50段階に加速させたが、しばしばサンプル安定性を犠牲にした。
本稿では,超高速分子生成モデルであるFlashMolについて述べる。
そこで我々は, 分子領域に分散マッチング蒸留(DMD) (逆KL分割最小化目標) を適用し, 有効蒸留を行う。
DMDの局所的な最小化挙動を考慮すると、分子生成の時間ステップを再配置し、より優れた初期化を提供し、有効蒸留を可能にする。
さらに, DMDのモード探索挙動を緩和し, 多様性の向上を図るため, 前方KL分岐の平均探索挙動を取り入れたジェンセン・シャノン分岐項を用いて, さらに規則化を行う。
QM9とGEOM-DRUGデータセットの大規模な実験により、FlashMolは1000ステップの教師に匹敵し、高い分子品質を維持しながらサンプリング速度を最大250$\times$で加速することを示した。
関連論文リスト
- Straight-Line Diffusion Model for Efficient 3D Molecular Generation [25.63489191042975]
この問題に対処するために, SLDM(Straight-Line Diffusion Model)を提案する。
提案法は, 分子構造のノイズ感度特性とよく一致し, 再生過程全体にわたって再構成作業の均一な分散を行う。
SLDMは3次元分子生成ベンチマークの最先端性能を実現し,サンプリング効率を100倍に向上させる。
論文 参考訳(メタデータ) (2025-03-04T13:23:58Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。