論文の概要: Pretraining Generative Flow Networks with Inexpensive Rewards for Molecular Graph Generation
- arxiv url: http://arxiv.org/abs/2503.06337v2
- Date: Tue, 25 Mar 2025 19:56:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 20:08:04.217717
- Title: Pretraining Generative Flow Networks with Inexpensive Rewards for Molecular Graph Generation
- Title(参考訳): 分子グラフ生成のための逆流を伴う生成フローネットワークの事前学習
- Authors: Mohit Pandey, Gopeshh Subbaraj, Artem Cherkasov, Martin Ester, Emmanuel Bengio,
- Abstract要約: Generative Flow Networks (GFlowNets) は、多種多様な高品質な分子構造を生成するのに適したフレームワークとして最近登場した。
本稿では,個々の原子を構成要素として活用する基本生成モデルであるAtomic GFlowNets(A-GFNs)を紹介する。
医薬品のような分子データセットを用いた教師なし事前学習手法を提案し,A-GFNに安価で情報伝達性の高い分子記述子について教える。
- 参考スコア(独自算出の注目度): 6.495442425890008
- License:
- Abstract: Generative Flow Networks (GFlowNets) have recently emerged as a suitable framework for generating diverse and high-quality molecular structures by learning from rewards treated as unnormalized distributions. Previous works in this framework often restrict exploration by using predefined molecular fragments as building blocks, limiting the chemical space that can be accessed. In this work, we introduce Atomic GFlowNets (A-GFNs), a foundational generative model leveraging individual atoms as building blocks to explore drug-like chemical space more comprehensively. We propose an unsupervised pre-training approach using drug-like molecule datasets, which teaches A-GFNs about inexpensive yet informative molecular descriptors such as drug-likeliness, topological polar surface area, and synthetic accessibility scores. These properties serve as proxy rewards, guiding A-GFNs towards regions of chemical space that exhibit desirable pharmacological properties. We further implement a goal-conditioned finetuning process, which adapts A-GFNs to optimize for specific target properties. In this work, we pretrain A-GFN on a subset of ZINC dataset, and by employing robust evaluation metrics we show the effectiveness of our approach when compared to other relevant baseline methods for a wide range of drug design tasks.
- Abstract(参考訳): 生成フローネットワーク(GFlowNets)は,非正規分布として扱われる報酬から学習することで,多種多様な高品質な分子構造を生成するのに適したフレームワークとして最近登場した。
この枠組みの以前の研究は、事前に定義された分子断片を構造ブロックとして使用することで探索を制限し、アクセス可能な化学空間を制限することが多かった。
本研究では、個々の原子をビルディングブロックとして活用し、薬物のような化学空間をより包括的に探索する基盤生成モデルであるAtomic GFlowNets(A-GFNs)を紹介する。
薬物様分子データセットを用いた教師なし事前学習手法を提案し, 薬物様線, 位相極面面積, 合成アクセシビリティスコアなど, A-GFN に安価で有益な分子記述子について教える。
これらの性質は、A-GFNを好ましい薬理学的性質を示す化学空間の領域へと誘導するプロキシ報酬として機能する。
さらに、目標条件付き微調整プロセスを実装し、A-GFNを適応させて特定の目標特性に最適化する。
本研究では、ZINCデータセットのサブセットにA-GFNをプリトレーニングし、ロバストな評価指標を用いて、薬物設計タスクにおける他の関連するベースライン手法と比較して、アプローチの有効性を示す。
関連論文リスト
- DrugImproverGPT: A Large Language Model for Drug Optimization with Fine-Tuning via Structured Policy Optimization [53.27954325490941]
大規模言語モデル(LLM)の微調整は、特定の目的に向けて結果を生成するために不可欠である。
本研究は,薬物最適化LSMに基づく生成モデルを微調整するための新しい強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-11T04:00:21Z) - GenMol: A Drug Discovery Generalist with Discrete Diffusion [43.29814519270451]
Generalist Molecular Generative Model (GenMol) は、薬物発見パイプラインの様々な側面に対処する汎用的なフレームワークである。
離散拡散フレームワークでは、フラグメントをマスク付きトークンに置き換えることで分子を最適化するフラグメントリマッシングを導入する。
GenMolは、デノボ生成およびフラグメント制約生成においてSAFE表現に基づいてトレーニングされた以前のGPTベースのモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2025-01-10T18:30:05Z) - GFlowNet Pretraining with Inexpensive Rewards [2.924067540644439]
A-GFN(Atomic GFlowNets)は、個々の原子をビルディングブロックとして活用し、薬物のような化学空間をより包括的に探索する基礎的な生成モデルである。
オフラインな薬物様分子データセットを用いた教師なし事前学習手法を提案する。
我々は、目標条件付き微調整プロセスを実装し、A-GFNを適応させて特定の目標特性に最適化する手法をさらに強化する。
論文 参考訳(メタデータ) (2024-09-15T11:42:17Z) - Aligning Target-Aware Molecule Diffusion Models with Exact Energy Optimization [147.7899503829411]
AliDiffは、事前訓練されたターゲット拡散モデルと望ましい機能特性を整合させる新しいフレームワークである。
最先端の結合エネルギーを持つ分子を最大7.07 Avg. Vina Scoreで生成することができる。
論文 参考訳(メタデータ) (2024-07-01T06:10:29Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - HiGNN: Hierarchical Informative Graph Neural Networks for Molecular
Property Prediction Equipped with Feature-Wise Attention [5.735627221409312]
分子特性を予測するための階層型情報グラフニューラルネットワークフレームワーク(HiGNN)を提案する。
実験により、HiGNNは、多くの挑戦的な薬物発見関連ベンチマークデータセットに対して最先端の予測性能を達成することが示された。
論文 参考訳(メタデータ) (2022-08-30T05:16:15Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Target-aware Molecular Graph Generation [37.937378787812264]
そこで我々は,SiamFlowを提案する。これはフローが潜在空間内のターゲットシーケンス埋め込みの分布に適合するように強制する。
具体的には、アライメント損失と一様損失を用いて、ターゲットシーケンスの埋め込みと薬物グラフの埋め込みを合意に導く。
実験により,提案手法は,分子グラフ生成に向けた潜在空間における有意な表現を定量的に学習することを示す。
論文 参考訳(メタデータ) (2022-02-10T04:31:14Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。