論文の概要: Language model driven: a PROTAC generation pipeline with dual constraints of structure and property
- arxiv url: http://arxiv.org/abs/2412.09661v1
- Date: Thu, 12 Dec 2024 10:15:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-16 15:02:07.337129
- Title: Language model driven: a PROTAC generation pipeline with dual constraints of structure and property
- Title(参考訳): 言語モデル駆動:構造と特性の二重制約を持つPTAC生成パイプライン
- Authors: Jinsong Shao, Qineng Gong, Zeyu Yin, Yu Chen, Yajie Hao, Lei Zhang, Linlin Jiang, Min Yao, Jinlong Li, Fubo Wang, Li Wang,
- Abstract要約: LM-PROTACパイプラインは、Wnt3aを阻害できるPRTAC分子を正常に生成する。
その結果, DCT は Wnt3a を標的とし加水分解する PROTAC を効率的に生成できることがわかった。
- 参考スコア(独自算出の注目度): 13.438107015508246
- License:
- Abstract: The imperfect modeling of ternary complexes has limited the application of computer-aided drug discovery tools in PROTAC research and development. In this study, an AI-assisted approach for PROTAC molecule design pipeline named LM-PROTAC was developed, which stands for language model driven Proteolysis Targeting Chimera, by embedding a transformer-based generative model with dual constraints on structure and properties, referred to as the DCT. This study utilized the fragmentation representation of molecules and developed a language model driven pipeline. Firstly, a language model driven affinity model for protein compounds to screen molecular fragments with high affinity for the target protein. Secondly, structural and physicochemical properties of these fragments were constrained during the generation process to meet specific scenario requirements. Finally, a two-round screening of the preliminary generated molecules using a multidimensional property prediction model to generate a batch of PROTAC molecules capable of degrading disease-relevant target proteins for validation in vitro experiments, thus achieving a complete solution for AI-assisted PROTAC drug generation. Taking the tumor key target Wnt3a as an example, the LM-PROTAC pipeline successfully generated PROTAC molecules capable of inhibiting Wnt3a. The results show that DCT can efficiently generate PROTAC that targets and hydrolyses Wnt3a.
- Abstract(参考訳): 三元錯体の不完全なモデリングは、PTACの研究・開発におけるコンピュータ支援薬物発見ツールの適用を制限している。
本研究では, 言語モデル駆動型プロテオリシスターゲットキメラ(Proteolysis Targeting Chimera)を, トランスフォーマーを用いた生成モデルにDCTと呼ばれる構造と特性の2つの制約を組み込むことにより, LM-PROTAC(ProTAC molecule design pipeline)のAI支援手法を開発した。
本研究では,分子の断片化表現を利用し,言語モデル駆動パイプラインを開発した。
第一に、タンパク質化合物に対する言語モデルによる親和性モデルにより、標的タンパク質に対する親和性が高い分子断片をスクリーニングする。
第2に、これらのフラグメントの構造的および物理化学的性質は、特定のシナリオ要求を満たすために生成過程中に制限された。
最後に、多次元特性予測モデルを用いて、予備生成分子の2ラウンドのスクリーニングを行い、疾患関連標的タンパク質を分解してin vitro実験を行い、AIによるPlataC創薬のための完全なソリューションを実現する。
腫瘍鍵標的Wnt3aを例として、LM-PROTACパイプラインはWnt3aを阻害できるPlatC分子を正常に生成した。
その結果, DCT は Wnt3a を標的とし加水分解する PROTAC を効率的に生成できることがわかった。
関連論文リスト
- A Comprehensive Review of Emerging Approaches in Machine Learning for De Novo PROTAC Design [1.534667887016089]
標的タンパク質分解(TPD)は、細胞の自然分解経路を利用して細胞内のタンパク質レベルを調節することを目的としている。
プロテオリシス標的キメラ(PROTAC)はPD戦略の中心にある。
このような複雑な分子を設計するための伝統的な手法には限界がある。
論文 参考訳(メタデータ) (2024-06-24T14:42:27Z) - PROflow: An iterative refinement model for PROTAC-induced structure prediction [4.113597666007784]
キメラを標的とするプロテオリシス (PROTACs) は、標的と分解関連タンパク質を同時に結合することで、従来のアンドラッグタンパク質の分解を引き起こす小さな分子である。
合理的設計における重要な課題は、活動の構造的基盤を理解することである。
既存の PROTAC ドッキング法では, 距離制限されたタンパク質-タンパク質ドッキングタスクに問題を単純化することを余儀なくされている。
二元タンパク質-タンパク質複合体のみを必要とする新しい擬似データ生成手法を開発した。
この新たなデータセットは、制約下での完全なPROTACの柔軟性をモデル化する、PROTACによる構造予測の反復的改善モデルであるPROflowを実現する。
論文 参考訳(メタデータ) (2024-04-10T05:29:35Z) - Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文 参考訳(メタデータ) (2024-03-20T02:15:55Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [74.64101864289572]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Cross-Gate MLP with Protein Complex Invariant Embedding is A One-Shot
Antibody Designer [58.97153056120193]
抗体の特異性は、その相補性決定領域(CDR)によって決定される
従来の研究では、複雑な技術を使ってCDRを生成するが、不適切な幾何学的モデリングに悩まされている。
本稿では,CDRの1次元配列と3次元構造を1ショットで共設計できるテクスタイスシンプルで効果的なモデルを提案する。
論文 参考訳(メタデータ) (2023-04-21T13:24:26Z) - De novo PROTAC design using graph-based deep generative models [2.566673015346446]
グラフに基づく生成モデルを用いて,空グラフから PROTAC 様の構造を提案する。
我々は, 予測分解活性の高い化合物に対する生成モデルを構築した。
微調整後、難易度の高いPOIに対する予測活性は50%から80%に増加し、ほぼ完全な化学的妥当性が得られた。
論文 参考訳(メタデータ) (2022-11-04T15:34:45Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Benchmarking Deep Graph Generative Models for Optimizing New Drug
Molecules for COVID-19 [11.853524110656991]
ターゲット特性を持つ新規薬物化合物の設計は、生成モデル研究の鍵となる分野である。
本稿では、グラフ生成モデルに基づく小さな薬物分子設計パイプラインと、新型コロナウイルスの標的薬物候補を設計するための2つの最先端グラフ生成モデルの比較研究について述べる。
論文 参考訳(メタデータ) (2021-02-09T17:49:26Z) - CogMol: Target-Specific and Selective Drug Design for COVID-19 Using
Deep Generative Models [74.58583689523999]
新規なウイルスタンパク質を標的とした新規な薬物様小分子を設計するためのエンド・ツー・エンドのフレームワークであるCogMolを提案する。
CogMolは、分子SMILES変分オートエンコーダ(VAE)の適応事前学習と、効率的なマルチ属性制御サンプリングスキームを組み合わせる。
CogMolは、高目標特異性と選択性を有する合成可能で低毒性な薬物様分子の多制約設計を扱う。
論文 参考訳(メタデータ) (2020-04-02T18:17:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。