論文の概要: Auxiliary Discrminator Sequence Generative Adversarial Networks (ADSeqGAN) for Few Sample Molecule Generation
- arxiv url: http://arxiv.org/abs/2502.16446v1
- Date: Sun, 23 Feb 2025 05:22:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:56:09.896102
- Title: Auxiliary Discrminator Sequence Generative Adversarial Networks (ADSeqGAN) for Few Sample Molecule Generation
- Title(参考訳): サンプル分子生成のための補助ディスクリネータシーケンス生成用ネットワーク(ADSeqGAN)
- Authors: Haocheng Tang, Jing Long, Junmei Wang,
- Abstract要約: Auxiliary Discriminator Sequence Generative Adversarial Networks (ADSeqGAN) は、小さなサンプルデータセットにおける分子生成の新しいアプローチである。
本手法は, 予訓練発電機とワッサースタイン距離を組み, 訓練安定性と多様性を向上させる。
我々は,ADSeqGANの合成核酸ターゲティングおよびCNS薬物生成への応用を実証した。
- 参考スコア(独自算出の注目度): 0.6339750087526286
- License:
- Abstract: In this work, we introduce Auxiliary Discriminator Sequence Generative Adversarial Networks (ADSeqGAN), a novel approach for molecular generation in small-sample datasets. Traditional generative models often struggle with limited training data, particularly in drug discovery, where molecular datasets for specific therapeutic targets, such as nucleic acids binders and central nervous system (CNS) drugs, are scarce. ADSeqGAN addresses this challenge by integrating an auxiliary random forest classifier as an additional discriminator into the GAN framework, significantly improves molecular generation quality and class specificity. Our method incorporates pretrained generator and Wasserstein distance to enhance training stability and diversity. We evaluate ADSeqGAN on a dataset comprising nucleic acid-targeting and protein-targeting small molecules, demonstrating its superior ability to generate nucleic acid binders compared to baseline models such as SeqGAN, ORGAN, and MolGPT. Through an oversampling strategy, ADSeqGAN also significantly improves CNS drug generation, achieving a higher yield than traditional de novo models. Critical assessments, including docking simulations and molecular property analysis, confirm that ADSeqGAN-generated molecules exhibit strong binding affinities, enhanced chemical diversity, and improved synthetic feasibility. Overall, ADSeqGAN presents a novel framework for generative molecular design in data-scarce scenarios, offering potential applications in computational drug discovery. We have demonstrated the successful applications of ADSeqGAN in generating synthetic nucleic acid-targeting and CNS drugs in this work.
- Abstract(参考訳): 本稿では,小サンプルデータセットにおける分子生成の新しいアプローチであるAuxiliary Discriminator Sequence Generative Adversarial Networks (ADSeqGAN)を紹介する。
伝統的な生成モデルは、特に薬物発見において、核酸結合体や中枢神経系(CNS)薬物のような特定の治療標的のための分子データセットが不足している限られた訓練データに苦しむことが多い。
ADSeqGANは、補助的なランダム森林分類器をGANフレームワークに追加の識別器として組み込むことでこの問題に対処し、分子生成の品質とクラス特異性を大幅に改善する。
本手法は, 予訓練発電機とワッサースタイン距離を組み, 訓練安定性と多様性を向上させる。
核酸標的およびタンパク質標的小分子からなるデータセット上でADSeqGANを評価し、SeqGAN, ORGAN, MolGPTなどのベースラインモデルと比較して、核酸結合体を生成する優れた能力を示した。
オーバーサンプリング戦略により、ADSeqGANはCNSの薬物生成を著しく改善し、従来のデノボモデルよりも高い収率を達成する。
ドッキングシミュレーションや分子特性解析を含む批判的な評価は、ADSeqGAN生成分子が強い結合親和性を示し、化学的多様性が向上し、合成可能性が改善されていることを確認する。
全体として、ADSeqGANは、データスカースシナリオにおける生成分子設計のための新しいフレームワークを示し、計算薬物発見の潜在的応用を提供する。
本研究は,ADSeqGANの合成核酸ターゲティングおよびCNS薬物生成への応用を実証した。
関連論文リスト
- Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - GFlowNet Pretraining with Inexpensive Rewards [2.924067540644439]
A-GFN(Atomic GFlowNets)は、個々の原子をビルディングブロックとして活用し、薬物のような化学空間をより包括的に探索する基礎的な生成モデルである。
オフラインな薬物様分子データセットを用いた教師なし事前学習手法を提案する。
我々は、目標条件付き微調整プロセスを実装し、A-GFNを適応させて特定の目標特性に最適化する手法をさらに強化する。
論文 参考訳(メタデータ) (2024-09-15T11:42:17Z) - Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Aligning Target-Aware Molecule Diffusion Models with Exact Energy Optimization [147.7899503829411]
AliDiffは、事前訓練されたターゲット拡散モデルと望ましい機能特性を整合させる新しいフレームワークである。
最先端の結合エネルギーを持つ分子を最大7.07 Avg. Vina Scoreで生成することができる。
論文 参考訳(メタデータ) (2024-07-01T06:10:29Z) - TAGMol: Target-Aware Gradient-guided Molecule Generation [19.977071499171903]
3次元生成モデルは、構造ベースドラッグデザイン(SBDD)において大きな可能性を秘めている。
問題を分子生成と特性予測に分離する。
後者は相乗的に拡散サンプリング過程を導出し、誘導拡散を促進し、所望の性質を持つ有意義な分子を創出する。
この誘導分子生成過程をTAGMolと呼ぶ。
論文 参考訳(メタデータ) (2024-06-03T14:43:54Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - Latent Chemical Space Searching for Plug-in Multi-objective Molecule Generation [9.442146563809953]
本研究では, 標的親和性, 薬物類似性, 合成性に関連する目的を組み込んだ, 汎用的な「プラグイン」分子生成モデルを構築した。
我々はPSO-ENPを多目的分子生成と最適化のための最適変種として同定する。
論文 参考訳(メタデータ) (2024-04-10T02:37:24Z) - Molecular De Novo Design through Transformer-based Reinforcement
Learning [38.803770968809225]
分子デノボ設計のためのトランスフォーマーを用いた生成モデルを微調整する手法を提案する。
提案手法は, 種々の生物標的に対して活性を示すと予測された化合物の生成において, 優れた性能を示す。
本手法は, 足場ホッピング, 単一分子からのライブラリ拡張, 生物標的に対する高い活性の化合物の生成に有効である。
論文 参考訳(メタデータ) (2023-10-09T02:51:01Z) - Energy-based Generative Models for Target-specific Drug Discovery [7.509129971169722]
我々は, 目標特異的な薬物発見のためのエネルギーベース確率モデルを開発した。
その結果,提案したTagMolは実分子と類似の結合親和性を持つ分子を生成できることが示唆された。
論文 参考訳(メタデータ) (2022-12-05T16:41:36Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - CogMol: Target-Specific and Selective Drug Design for COVID-19 Using
Deep Generative Models [74.58583689523999]
新規なウイルスタンパク質を標的とした新規な薬物様小分子を設計するためのエンド・ツー・エンドのフレームワークであるCogMolを提案する。
CogMolは、分子SMILES変分オートエンコーダ(VAE)の適応事前学習と、効率的なマルチ属性制御サンプリングスキームを組み合わせる。
CogMolは、高目標特異性と選択性を有する合成可能で低毒性な薬物様分子の多制約設計を扱う。
論文 参考訳(メタデータ) (2020-04-02T18:17:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。