論文の概要: FragmentGPT: A Unified GPT Model for Fragment Growing, Linking, and Merging in Molecular Design
- arxiv url: http://arxiv.org/abs/2509.11044v1
- Date: Sun, 14 Sep 2025 02:17:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.88321
- Title: FragmentGPT: A Unified GPT Model for Fragment Growing, Linking, and Merging in Molecular Design
- Title(参考訳): FragmentGPT:分子設計におけるフラグメント成長・リンク・マージのための統一GPTモデル
- Authors: Xuefeng Liu, Songhao Jiang, Qinan Huang, Tinson Xu, Ian Foster, Mengdi Wang, Hening Lin, Jinbo Xu, Rick Stevens,
- Abstract要約: FragmentGPTは、切断された分子断片を化学的および薬理学的に有効な候補に結合するリンカーを生成する。
また、重複フラグメントのような構造的冗長性、すなわちインテリジェントなマージの解決も学んでいる。
実世界のがんデータセットの実験とアブレーション研究は、化学的に有効な高品質な分子を生成する能力を示している。
- 参考スコア(独自算出の注目度): 41.569088533365274
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fragment-Based Drug Discovery (FBDD) is a popular approach in early drug development, but designing effective linkers to combine disconnected molecular fragments into chemically and pharmacologically viable candidates remains challenging. Further complexity arises when fragments contain structural redundancies, like duplicate rings, which cannot be addressed by simply adding or removing atoms or bonds. To address these challenges in a unified framework, we introduce FragmentGPT, which integrates two core components: (1) a novel chemically-aware, energy-based bond cleavage pre-training strategy that equips the GPT-based model with fragment growing, linking, and merging capabilities, and (2) a novel Reward Ranked Alignment with Expert Exploration (RAE) algorithm that combines expert imitation learning for diversity enhancement, data selection and augmentation for Pareto and composite score optimality, and Supervised Fine-Tuning (SFT) to align the learner policy with multi-objective goals. Conditioned on fragment pairs, FragmentGPT generates linkers that connect diverse molecular subunits while simultaneously optimizing for multiple pharmaceutical goals. It also learns to resolve structural redundancies-such as duplicated fragments-through intelligent merging, enabling the synthesis of optimized molecules. FragmentGPT facilitates controlled, goal-driven molecular assembly. Experiments and ablation studies on real-world cancer datasets demonstrate its ability to generate chemically valid, high-quality molecules tailored for downstream drug discovery tasks.
- Abstract(参考訳): FBDD (Fragment-Based Drug Discovery) は、初期の医薬品開発において一般的なアプローチであるが、解離した分子断片を化学的および薬理学的に有効な候補に結合させる効果的なリンカーを設計することは、依然として困難である。
さらに複雑なものは、原子や結合の追加や除去によって対処できない重複環のような構造的冗長性を含むときである。
統合フレームワークにおけるこれらの課題に対処するため,(1)GPTモデルにフラグメント成長,リンク,マージ機能を備えた新規な化学知識・エネルギーベースのボンド切断事前学習戦略,(2)多様性向上のための専門的模倣学習とパレートと合成スコアの最適性のためのデータ選択・拡張を組み合わせたReward Ranked Alignment with Expert Exploration(RAE)アルゴリズム,および、学習者ポリシーを多目的目標に整合させるSupervised Fine-Tuning(SFT)という,2つのコアコンポーネントを統合したFragmentGPTを導入する。
FragmentGPTはフラグメントペアを条件に、様々な分子サブユニットを結合するリンカーを生成し、同時に複数の医薬品の目標を最適化する。
また、複製された断片のような構造的冗長性(インテリジェントな融合)を解決し、最適化された分子の合成を可能にする。
FragmentGPTは制御されたゴール駆動分子組み立てを促進する。
実世界のがんデータセットの実験とアブレーション研究は、下流の薬物発見タスクに適した化学的に有効な高品質な分子を生成する能力を示している。
関連論文リスト
- GenMol: A Drug Discovery Generalist with Discrete Diffusion [43.29814519270451]
Generalist Molecular Generative Model (GenMol) は、多種多様な薬物発見シナリオを扱うために単一の離散拡散モデルのみを使用する汎用的なフレームワークである。
GenMolは、非自己回帰的双方向並列デコードにより、シーケンスアタッチメントベースのフラグメント埋め込みシーケンスを生成する。
GenMol は、de novo 生成とフラグメント制約生成において、以前の GPT ベースモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2025-01-10T18:30:05Z) - Molecule Generation with Fragment Retrieval Augmentation [41.95947899013865]
Fragment Retrieval-Augmented Generation (f-RAG) は、新しい分子の完成と生成のための新たなフラグメントを提案する事前訓練された分子生成モデルに基づいている。
既存のフラグメントを超えて外挿するために、f-RAGは、反復的な洗練プロセスを通じて生成されたフラグメントでフラグメント語彙を更新する。
論文 参考訳(メタデータ) (2024-11-18T21:43:52Z) - Drug Discovery with Dynamic Goal-aware Fragments [76.10700304803177]
GEAM (Goal-aware fragment extract, Assembly and Modification) という薬物発見のための分子生成フレームワークを提案する。
GEAMは3つのモジュールから構成されており、それぞれがゴール対応のフラグメント抽出、フラグメントアセンブリ、フラグメント修正を担当している。
GEAMは3つのモジュールの生成サイクルを通じて薬物候補を効果的に発見できることを実験的に実証した。
論文 参考訳(メタデータ) (2023-10-02T01:30:42Z) - Equivariant 3D-Conditional Diffusion Models for Molecular Linker Design [82.23006955069229]
分子リンカ設計のためのE(3)等価な3次元拡散モデルDiffLinkerを提案する。
我々のモデルは、欠落した原子を中間に配置し、初期フラグメントを全て組み込んだ分子を設計する。
DiffLinkerは、より多種多様な合成可能な分子を生成する標準データセット上で、他の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T09:13:37Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。