論文の概要: FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching
- arxiv url: http://arxiv.org/abs/2502.15805v2
- Date: Wed, 04 Jun 2025 02:15:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 16:24:48.881907
- Title: FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching
- Title(参考訳): FragFM: フラグメントレベル離散フローマッチングによる効率的な分子生成のための階層的フレームワーク
- Authors: Joongwon Lee, Seonghwan Kim, Seokhyun Moon, Hyunwoo Kim, Woo Youn Kim,
- Abstract要約: 分子グラフ生成のためのフラグメントレベル離散フローマッチングによる新しい階層型フレームワークであるFragFMを紹介する。
FragFMはフラグメントレベルで分子を生成し、原子レベルで詳細を再構築するために粗いオートエンコーダを利用する。
また,現代分子グラフ生成モデルの天然物様分子生成能力を評価するための天然物生成ベンチマークも提案する。
- 参考スコア(独自算出の注目度): 3.0684068038799728
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce FragFM, a novel hierarchical framework via fragment-level discrete flow matching for efficient molecular graph generation. FragFM generates molecules at the fragment level, leveraging a coarse-to-fine autoencoder to reconstruct details at the atom level. Together with a stochastic fragment bag strategy to effectively handle an extensive fragment space, our framework enables more efficient and scalable molecular generation. We demonstrate that our fragment-based approach achieves better property control than the atom-based method and additional flexibility through conditioning the fragment bag. We also propose a Natural Product Generation benchmark (NPGen) to evaluate modern molecular graph generative models' ability to generate natural product-like molecules. Since natural products are biologically prevalidated and differ from typical drug-like molecules, our benchmark provides a more challenging yet meaningful evaluation relevant to drug discovery. We conduct a FragFM comparative study against various models on diverse molecular generation benchmarks, including NPGen, demonstrating superior performance. The results highlight the potential of fragment-based generative modeling for large-scale, property-aware molecular design, paving the way for more efficient exploration of chemical space.
- Abstract(参考訳): 分子グラフ生成のためのフラグメントレベル離散フローマッチングによる新しい階層型フレームワークであるFragFMを紹介する。
FragFMはフラグメントレベルで分子を生成し、原子レベルで詳細を再構築するために粗いオートエンコーダを利用する。
広範囲なフラグメント空間を効果的に扱うための確率的フラグメントバッグ戦略とともに、我々のフレームワークはより効率的でスケーラブルな分子生成を可能にする。
フラグメントベースアプローチは,原子ベースの手法よりも優れた特性制御と,フラグメントバッグの条件付けによる柔軟性を実現することを実証した。
また,現代分子グラフ生成モデルの天然物様分子生成能力を評価するため,NPGen(Natural Product Generation benchmark)を提案する。
天然物は生物学的に有病率が高く、典型的薬物様分子と異なるため、我々のベンチマークは薬物発見に関するより困難だが有意義な評価を提供する。
NPGenを含む多種多様な分子生成ベンチマークにおけるFragFMの比較実験を行い,優れた性能を示した。
この結果は、大規模で特性に配慮した分子設計のためのフラグメントベースの生成モデルの可能性を強調し、より効率的な化学空間探索の道を開いた。
関連論文リスト
- DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。
我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。
実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - GenMol: A Drug Discovery Generalist with Discrete Diffusion [43.29814519270451]
Generalist Molecular Generative Model (GenMol) は、薬物発見パイプラインの様々な側面に対処する汎用的なフレームワークである。
離散拡散フレームワークでは、フラグメントをマスク付きトークンに置き換えることで分子を最適化するフラグメントリマッシングを導入する。
GenMolは、デノボ生成およびフラグメント制約生成においてSAFE表現に基づいてトレーニングされた以前のGPTベースのモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2025-01-10T18:30:05Z) - MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories [7.366789601705544]
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。
本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。
この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
論文 参考訳(メタデータ) (2024-11-10T22:00:55Z) - Conditional Latent Space Molecular Scaffold Optimization for Accelerated Molecular Design [17.175846006359674]
初期入力と類似性を保ちながら分子を戦略的に修飾するための条件付き遅延空間分子スカフォールド最適化(CLaSMO)を導入する。
我々のLSBO設定は、最適化のサンプル効率を向上し、我々の修正アプローチは、実世界の適用可能性の高い分子を得るのに役立ちます。
我々はまた、化学の専門家がCLaSMOをHuman-in-the-Loop設定で適用できるオープンソースのWebアプリケーションも提供する。
論文 参考訳(メタデータ) (2024-11-03T03:17:38Z) - LDMol: Text-to-Molecule Diffusion Model with Structurally Informative Latent Space [55.5427001668863]
テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
LDMolは、学習可能で構造的に有意な特徴空間を生成する分子オートエンコーダを含む。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文 参考訳(メタデータ) (2024-05-28T04:59:13Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Diffusing on Two Levels and Optimizing for Multiple Properties: A Novel
Approach to Generating Molecules with Desirable Properties [33.2976176283611]
本稿では,分子を望ましい性質で生成する新しい手法を提案する。
望ましい分子断片を得るため,我々は新しい電子効果に基づくフラグメンテーション法を開発した。
提案手法により生成する分子は, 従来のSOTAモデルより有効, 特異性, 新規性, Fr'echet ChemNet Distance (FCD), QED, PlogP を有することを示す。
論文 参考訳(メタデータ) (2023-10-05T11:43:21Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。