論文の概要: De novo generation of functional terpene synthases using TpsGPT
- arxiv url: http://arxiv.org/abs/2512.08772v2
- Date: Mon, 15 Dec 2025 05:09:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 15:10:29.142898
- Title: De novo generation of functional terpene synthases using TpsGPT
- Title(参考訳): TpsGPTを用いた機能性テルペン合成酵素のデノボ生成
- Authors: Hamsini Ramanathan, Roman Bushuiev, Matouš Soldát, Jirí Kohout, Téo Hebra, Joshua David Smith, Josef Sivic, Tomáš Pluskal,
- Abstract要約: テルペン合成酵素(terpene synthases、TPS)は、多くの天然物を支える様々なテルペンの足場を生産する酵素のキーファミリーである。
タンパク質言語モデルProtGPT2をUniProtから抽出した79kのTPS配列上に微調整して構築した,スケーラブルなTPSタンパク質設計のための生成モデルであるTpsGPTを紹介する。
- 参考スコア(独自算出の注目度): 14.65546198539368
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Terpene synthases (TPS) are a key family of enzymes responsible for generating the diverse terpene scaffolds that underpin many natural products, including front-line anticancer drugs such as Taxol. However, de novo TPS design through directed evolution is costly and slow. We introduce TpsGPT, a generative model for scalable TPS protein design, built by fine-tuning the protein language model ProtGPT2 on 79k TPS sequences mined from UniProt. TpsGPT generated de novo enzyme candidates in silico and we evaluated them using multiple validation metrics, including EnzymeExplorer classification, ESMFold structural confidence (pLDDT), sequence diversity, CLEAN classification, InterPro domain detection, and Foldseek structure alignment. From an initial pool of 28k generated sequences, we identified seven putative TPS enzymes that satisfied all validation criteria. Experimental validation confirmed TPS enzymatic activity in at least two of these sequences. Our results show that fine-tuning of a protein language model on a carefully curated, enzyme-class-specific dataset, combined with rigorous filtering, can enable the de novo generation of functional, evolutionarily distant enzymes.
- Abstract(参考訳): テルペン合成酵素(terpene synthases、TPS)は、タキソールなどのフロントライン抗がん剤を含む多くの天然物を支える様々なテルペンの足場を産生する酵素のキーファミリーである。
しかし、デ・ノボのTPS設計は、進化の方向性によってコストがかかり、遅くなっている。
タンパク質言語モデルProtGPT2をUniProtから抽出した79kのTPS配列上に微調整して構築した,スケーラブルなTPSタンパク質設計のための生成モデルであるTpsGPTを紹介する。
PLDDT, ESMFold 構造信頼度, CLEAN 分類, InterPro ドメイン検出, Foldseek 構造アライメントなど, 様々な評価指標を用いてノボ酵素候補をシリコで生成し, 評価を行った。
28k塩基配列の初期プールから, 検証基準を満たす7つのTPS酵素を同定した。
実験により、これらの配列のうち少なくとも2つでTPS酵素活性が確認された。
本研究は, タンパク質言語モデルと酵素クラス特異的データセットの微調整と厳密なフィルタリングを併用することにより, 機能的, 進化的, 遠隔的な酵素のデノボ生成を可能にすることを示す。
関連論文リスト
- A Standardized Benchmark for Multilabel Antimicrobial Peptide Classification [2.327827051373412]
検証された27のレポジトリから8万個以上のペプチドを統合する実験フレームワークであるESCAPEについて述べる。
本データセットは,抗微生物ペプチドを負の配列から分離し,その機能的アノテーションを生物学的にコヒーレントなマルチラベル階層に組み込む。
ESCAPEに基づいて,配列と構造情報を利用してペプチドの複数の機能活性を予測するトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2025-11-06T21:10:48Z) - Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction [65.33218256339151]
翻訳後修飾(PTM)はプロテオームの複雑さと機能を大幅に拡張する。
既存の計算手法は主に、配列依存的なモチーフの認識によって引き起こされる、PTM部位を予測するタンパク質配列に焦点を当てている。
本稿では,各酸のマイクロ環境をトークン化し,シーケンス情報と構造情報を統一された離散トークンに統合するMeTokenモデルを提案する。
論文 参考訳(メタデータ) (2024-11-04T07:14:28Z) - Peptide-GPT: Generative Design of Peptides using Generative Pre-trained Transformers and Bio-informatic Supervision [7.275932354889042]
異なる性質を持つタンパク質配列を生成するのに適したタンパク質言語モデルを導入する。
生成した配列をそれらの難易度スコアに基づいてランク付けし、タンパク質の許容凸殻の外にある配列をフィルタリングする。
溶血率76.26%, 非溶血率72.46%, 非溶血率78.84%, 溶血率68.06%であった。
論文 参考訳(メタデータ) (2024-10-25T00:15:39Z) - PROflow: An iterative refinement model for PROTAC-induced structure prediction [4.113597666007784]
キメラを標的とするプロテオリシス (PROTACs) は、標的と分解関連タンパク質を同時に結合することで、従来のアンドラッグタンパク質の分解を引き起こす小さな分子である。
合理的設計における重要な課題は、活動の構造的基盤を理解することである。
既存の PROTAC ドッキング法では, 距離制限されたタンパク質-タンパク質ドッキングタスクに問題を単純化することを余儀なくされている。
二元タンパク質-タンパク質複合体のみを必要とする新しい擬似データ生成手法を開発した。
この新たなデータセットは、制約下での完全なPROTACの柔軟性をモデル化する、PROTACによる構造予測の反復的改善モデルであるPROflowを実現する。
論文 参考訳(メタデータ) (2024-04-10T05:29:35Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - AbDiffuser: Full-Atom Generation of in vitro Functioning Antibodies [44.149969082612486]
AbDiffuserは、抗体3D構造と配列の同変および物理インフォームド拡散モデルである。
我々のアプローチは、ドメイン知識と物理に基づく制約を生かして、タンパク質の拡散を改善する。
数値実験では、AbDiffuserが参照集合の配列と構造を綿密に追跡する抗体を生成する能力を示している。
論文 参考訳(メタデータ) (2023-07-28T11:57:44Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - Machine learning modeling of family wide enzyme-substrate specificity
screens [2.276367922551686]
バイオ触媒は、医薬品、複雑な天然物、商品化学物質を大規模に合成するための有望なアプローチである。
生体触媒の導入は、非天然基質上での化学的変換を触媒する酵素の選択能力によって制限される。
論文 参考訳(メタデータ) (2021-09-08T19:44:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。