論文の概要: Gx2Mol: De Novo Generation of Hit-like Molecules from Gene Expression Profiles via Deep Learning
- arxiv url: http://arxiv.org/abs/2412.19422v1
- Date: Fri, 27 Dec 2024 03:16:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:27:33.691272
- Title: Gx2Mol: De Novo Generation of Hit-like Molecules from Gene Expression Profiles via Deep Learning
- Title(参考訳): Gx2Mol:ディープラーニングによる遺伝子発現プロファイルからのヒッチライク分子のデノボ生成
- Authors: Chen Li, Yuki Matsukiyo, Yoshihiro Yamanishi,
- Abstract要約: 本稿では、遺伝子発現プロファイルを利用して、任意の標的タンパク質に好適な表現型を持つ分子構造を生成する、深層生成モデルGx2Molを提案する。
本アルゴリズムでは、変異オートエンコーダを特徴抽出器として使用して、遺伝子発現プロファイルの潜在特徴分布を学習する。
ケミカルジェネレータとして長期記憶を利用して、特徴抽出器によって抽出された遺伝子発現プロファイルの特徴条件を満たす構文的に有効なSMILES文字列を生成する。
- 参考スコア(独自算出の注目度): 3.5161606704829214
- License:
- Abstract: De novo generation of hit-like molecules is a challenging task in the drug discovery process. Most methods in previous studies learn the semantics and syntax of molecular structures by analyzing molecular graphs or simplified molecular input line entry system (SMILES) strings; however, they do not take into account the drug responses of the biological systems consisting of genes and proteins. In this study we propose a deep generative model, Gx2Mol, which utilizes gene expression profiles to generate molecular structures with desirable phenotypes for arbitrary target proteins. In the algorithm, a variational autoencoder is employed as a feature extractor to learn the latent feature distribution of the gene expression profiles. Then, a long short-term memory is leveraged as the chemical generator to produce syntactically valid SMILES strings that satisfy the feature conditions of the gene expression profile extracted by the feature extractor. Experimental results and case studies demonstrate that the proposed Gx2Mol model can produce new molecules with potential bioactivities and drug-like properties.
- Abstract(参考訳): ヒットライクな分子のデノボ生成は、薬物発見プロセスにおいて難しい課題である。
これまでの研究では、分子グラフの解析や単純な分子インプットライン・エントリー・システム(SMILES)の文字列を解析することで、分子構造のセマンティクスと構文を学ぶ方法がほとんどであったが、遺伝子とタンパク質からなる生物学的システムの薬物応答を考慮に入れていない。
本研究では、遺伝子発現プロファイルを利用して、任意の標的タンパク質に好適な表現型を持つ分子構造を生成する、深層生成モデルGx2Molを提案する。
本アルゴリズムでは、変異オートエンコーダを特徴抽出器として使用して、遺伝子発現プロファイルの潜在特徴分布を学習する。
そして、化学発電機として長期記憶を利用して、特徴抽出器によって抽出された遺伝子発現プロファイルの特徴条件を満たす構文的に有効なSMILES文字列を生成する。
実験結果とケーススタディにより、提案されたGx2Molモデルが、潜在的な生物活性と薬物様の性質を持つ新しい分子を生成できることが示されている。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - ChemSpaceAL: An Efficient Active Learning Methodology Applied to
Protein-Specific Molecular Generation [0.0]
本稿では,生成したデータのサブセットのみを評価することを必要とする,計算効率のよい能動的学習手法を提案する。
FDAが承認した小分子インヒビターc-Ablキナーゼを用いたタンパク質に対するGPT分子ジェネレータの微調整による標的分子生成への本手法の適用性を実証した。
興味深いことに、このモデルは、その存在を事前に知ることなく、インヒビターに似た分子を生成することを学び、それらのうち2つを正確に再現する。
論文 参考訳(メタデータ) (2023-09-11T22:28:36Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - SemanticCAP: Chromatin Accessibility Prediction Enhanced by Features
Learning from a Language Model [3.0643865202019698]
本稿では、ゲノムのアクセス可能な領域を特定するためのSemanticCAPという新しいソリューションを提案する。
遺伝子配列のコンテキストをモデル化する遺伝子モデルを導入し、遺伝子配列の効果的な表現を提供する。
公開ベンチマークによる他のシステムと比較すると,我々のモデルは性能が向上することが判明した。
論文 参考訳(メタデータ) (2022-04-05T11:47:58Z) - Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。
既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。
本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T08:35:56Z) - MGCVAE: Multi-objective Inverse Design via Molecular Graph Conditional
Variational Autoencoder [0.0]
本研究では,デノボ設計のためのオートエンコーダに基づく分子グラフ生成モデルを提案する。
結果: MGCVAEでは25.89%の最適化された分子が生成され, MGVAEでは0.66%であった。
論文 参考訳(メタデータ) (2022-02-14T14:33:33Z) - De Novo Molecular Generation with Stacked Adversarial Model [24.83456726428956]
近年, ド・ノボの薬物設計に期待できるアプローチとして, 条件付き生成逆数モデルが提案されている。
本稿では、2つのモデルを重ね合わせることで、既存の対向オートエンコーダモデルを拡張する新しい生成モデルを提案する。
我々の積み重ねられたアプローチは、既知の薬物とより類似した分子と同様に、より有効な分子を生成する。
論文 参考訳(メタデータ) (2021-10-24T14:23:16Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。