論文の概要: Gx2Mol: De Novo Generation of Hit-like Molecules from Gene Expression Profiles via Deep Learning
- arxiv url: http://arxiv.org/abs/2412.19422v1
- Date: Fri, 27 Dec 2024 03:16:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:27:33.691272
- Title: Gx2Mol: De Novo Generation of Hit-like Molecules from Gene Expression Profiles via Deep Learning
- Title(参考訳): Gx2Mol:ディープラーニングによる遺伝子発現プロファイルからのヒッチライク分子のデノボ生成
- Authors: Chen Li, Yuki Matsukiyo, Yoshihiro Yamanishi,
- Abstract要約: 本稿では、遺伝子発現プロファイルを利用して、任意の標的タンパク質に好適な表現型を持つ分子構造を生成する、深層生成モデルGx2Molを提案する。
本アルゴリズムでは、変異オートエンコーダを特徴抽出器として使用して、遺伝子発現プロファイルの潜在特徴分布を学習する。
ケミカルジェネレータとして長期記憶を利用して、特徴抽出器によって抽出された遺伝子発現プロファイルの特徴条件を満たす構文的に有効なSMILES文字列を生成する。
- 参考スコア(独自算出の注目度): 3.5161606704829214
- License:
- Abstract: De novo generation of hit-like molecules is a challenging task in the drug discovery process. Most methods in previous studies learn the semantics and syntax of molecular structures by analyzing molecular graphs or simplified molecular input line entry system (SMILES) strings; however, they do not take into account the drug responses of the biological systems consisting of genes and proteins. In this study we propose a deep generative model, Gx2Mol, which utilizes gene expression profiles to generate molecular structures with desirable phenotypes for arbitrary target proteins. In the algorithm, a variational autoencoder is employed as a feature extractor to learn the latent feature distribution of the gene expression profiles. Then, a long short-term memory is leveraged as the chemical generator to produce syntactically valid SMILES strings that satisfy the feature conditions of the gene expression profile extracted by the feature extractor. Experimental results and case studies demonstrate that the proposed Gx2Mol model can produce new molecules with potential bioactivities and drug-like properties.
- Abstract(参考訳): ヒットライクな分子のデノボ生成は、薬物発見プロセスにおいて難しい課題である。
これまでの研究では、分子グラフの解析や単純な分子インプットライン・エントリー・システム(SMILES)の文字列を解析することで、分子構造のセマンティクスと構文を学ぶ方法がほとんどであったが、遺伝子とタンパク質からなる生物学的システムの薬物応答を考慮に入れていない。
本研究では、遺伝子発現プロファイルを利用して、任意の標的タンパク質に好適な表現型を持つ分子構造を生成する、深層生成モデルGx2Molを提案する。
本アルゴリズムでは、変異オートエンコーダを特徴抽出器として使用して、遺伝子発現プロファイルの潜在特徴分布を学習する。
そして、化学発電機として長期記憶を利用して、特徴抽出器によって抽出された遺伝子発現プロファイルの特徴条件を満たす構文的に有効なSMILES文字列を生成する。
実験結果とケーススタディにより、提案されたGx2Molモデルが、潜在的な生物活性と薬物様の性質を持つ新しい分子を生成できることが示されている。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - ChemSpaceAL: An Efficient Active Learning Methodology Applied to
Protein-Specific Molecular Generation [0.0]
本稿では,生成したデータのサブセットのみを評価することを必要とする,計算効率のよい能動的学習手法を提案する。
FDAが承認した小分子インヒビターc-Ablキナーゼを用いたタンパク質に対するGPT分子ジェネレータの微調整による標的分子生成への本手法の適用性を実証した。
興味深いことに、このモデルは、その存在を事前に知ることなく、インヒビターに似た分子を生成することを学び、それらのうち2つを正確に再現する。
論文 参考訳(メタデータ) (2023-09-11T22:28:36Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - SemanticCAP: Chromatin Accessibility Prediction Enhanced by Features
Learning from a Language Model [3.0643865202019698]
本稿では、ゲノムのアクセス可能な領域を特定するためのSemanticCAPという新しいソリューションを提案する。
遺伝子配列のコンテキストをモデル化する遺伝子モデルを導入し、遺伝子配列の効果的な表現を提供する。
公開ベンチマークによる他のシステムと比較すると,我々のモデルは性能が向上することが判明した。
論文 参考訳(メタデータ) (2022-04-05T11:47:58Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - MGCVAE: Multi-objective Inverse Design via Molecular Graph Conditional
Variational Autoencoder [0.0]
本研究では,デノボ設計のためのオートエンコーダに基づく分子グラフ生成モデルを提案する。
結果: MGCVAEでは25.89%の最適化された分子が生成され, MGVAEでは0.66%であった。
論文 参考訳(メタデータ) (2022-02-14T14:33:33Z) - De Novo Molecular Generation with Stacked Adversarial Model [24.83456726428956]
近年, ド・ノボの薬物設計に期待できるアプローチとして, 条件付き生成逆数モデルが提案されている。
本稿では、2つのモデルを重ね合わせることで、既存の対向オートエンコーダモデルを拡張する新しい生成モデルを提案する。
我々の積み重ねられたアプローチは、既知の薬物とより類似した分子と同様に、より有効な分子を生成する。
論文 参考訳(メタデータ) (2021-10-24T14:23:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。