論文の概要: AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting
- arxiv url: http://arxiv.org/abs/2602.18915v1
- Date: Sat, 21 Feb 2026 17:46:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.394286
- Title: AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting
- Title(参考訳): AAVGen:腎選択的ターゲットのためのアデノ関連ウイルスカプシドの精密エンジニアリング
- Authors: Mohammadreza Ghaffarzadeh-Esfahani, Yousof Gheisari,
- Abstract要約: AAVGenは、マルチトレイプロファイルが強化されたAAVキャプシドのデノボ設計のための生成人工知能フレームワークである。
AAVGenは、タンパク質言語モデル(PLM)と、教師付き微調整(SFT)と、グループシーケンスポリシー最適化(GSPO)と呼ばれる強化学習技術を統合する。
AAVGenは新規なVP1タンパク質配列の多種多様なライブラリーを産生することを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Adeno-associated viruses (AAVs) are promising vectors for gene therapy, but their native serotypes face limitations in tissue tropism, immune evasion, and production efficiency. Engineering capsids to overcome these hurdles is challenging due to the vast sequence space and the difficulty of simultaneously optimizing multiple functional properties. The complexity also adds when it comes to the kidney, which presents unique anatomical barriers and cellular targets that require precise and efficient vector engineering. Here, we present AAVGen, a generative artificial intelligence framework for de novo design of AAV capsids with enhanced multi-trait profiles. AAVGen integrates a protein language model (PLM) with supervised fine-tuning (SFT) and a reinforcement learning technique termed Group Sequence Policy Optimization (GSPO). The model is guided by a composite reward signal derived from three ESM-2-based regression predictors, each trained to predict a key property: production fitness, kidney tropism, and thermostability. Our results demonstrate that AAVGen produces a diverse library of novel VP1 protein sequences. In silico validations revealed that the majority of the generated variants have superior performance across all three employed indices, indicating successful multi-objective optimization. Furthermore, structural analysis via AlphaFold3 confirms that the generated sequences preserve the canonical capsid folding despite sequence diversification. AAVGen establishes a foundation for data-driven viral vector engineering, accelerating the development of next-generation AAV vectors with tailored functional characteristics.
- Abstract(参考訳): アデノ関連ウイルス(AAV)は遺伝子治療に有望なベクターであるが、それらの血清型は組織トロピズム、免疫回避、生産効率の制限に直面している。
これらのハードルを克服するエンジニアリングキャプシドは、広範囲なシーケンス空間と、同時に複数の機能特性を最適化することの難しさのために困難である。
腎臓は独自の解剖学的障壁と、正確で効率的なベクター工学を必要とする細胞標的を呈する。
本稿では,AAVキャプシドのデノボ設計のための汎用人工知能フレームワークであるAAVGenについて述べる。
AAVGenは、タンパク質言語モデル(PLM)と、教師付き微調整(SFT)と、グループシーケンスポリシー最適化(GSPO)と呼ばれる強化学習技術を統合する。
このモデルは、3つのESM-2ベースの回帰予測器から導かれる複合報酬信号で導かれ、それぞれが生産適合性、腎臓のトロピズム、熱安定性といった重要な特性を予測するように訓練されている。
AAVGenは新規なVP1タンパク質配列の多種多様なライブラリーを産生することを示した。
サイリコの検証では、生成された変種の大部分は、採用されている3つの指標に比較して優れた性能を示し、多目的最適化が成功したことを示している。
さらに、AlphaFold3による構造解析により、生成した配列は、配列の多様化にもかかわらず正準カプシドの折り畳みを保っていることを確認した。
AAVGenは、データ駆動のバイラルベクター工学の基礎を確立し、機能特性をカスタマイズした次世代のAVベクターの開発を加速する。
関連論文リスト
- Bidirectional Representations Augmented Autoregressive Biological Sequence Generation:Application in De Novo Peptide Sequencing [51.12821379640881]
自己回帰(AR)モデルは、全体的な双方向表現を提供するが、生成的コヒーレンスとスケーラビリティに関する課題に直面している。
非自己回帰機構からリッチなコンテキスト情報を動的に統合することにより、AR生成を向上するハイブリッドフレームワークを提案する。
新しいクロスデコーダアテンションモジュールにより、ARデコーダは、これらの双方向機能を反復的にクエリし、統合することができる。
論文 参考訳(メタデータ) (2025-10-09T12:52:55Z) - UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials [62.72989417755985]
自然系における関数の統一生成モデルUniGenXを提案する。
UniGenXはシンボルトークンと数値トークンの混合ストリームとして異種入力を表す。
ドメイン間のファンクション・アウェア・ジェネレーションに対して、最先端または競合的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - AAVDiff: Experimental Validation of Enhanced Viability and Diversity in Recombinant Adeno-Associated Virus (AAV) Capsids through Diffusion Generation [7.8254313735368255]
そこで本研究では,キャプシド列を生成するエンドツーエンド拡散モデルを提案する。
38,000種類のAAV2ウイルスタンパク質 (VP) 配列を生成し, 8000のウイルス選択性について検討した。
AAV9キャプシドデータがない場合には、1つの野生型配列を除いて、我々は同じモデルを用いて最大9つの変異を持つ複数の生存可能な配列を直接生成した。
論文 参考訳(メタデータ) (2024-04-16T13:51:43Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [74.64101864289572]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Unsupervisedly Prompting AlphaFold2 for Few-Shot Learning of Accurate
Folding Landscape and Protein Structure Prediction [28.630603355510324]
そこで我々は,メタ生成モデルであるEvoGenを提案し,貧弱なMSAターゲットに対するAlphaFold2のアンダーパフォーマンスを改善する。
EvoGenは、キャリブレーションまたは実質的に生成されたホモログシーケンスでモデルにプロンプトすることで、AlphaFold2を低データで正確に折り畳むのに役立つ。
論文 参考訳(メタデータ) (2022-08-20T10:23:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。