論文の概要: PETRA: Pretrained Evolutionary Transformer for SARS-CoV-2 Mutation Prediction
- arxiv url: http://arxiv.org/abs/2511.03976v1
- Date: Thu, 06 Nov 2025 01:58:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.266991
- Title: PETRA: Pretrained Evolutionary Transformer for SARS-CoV-2 Mutation Prediction
- Title(参考訳): PETRA:SARS-CoV-2変異予測のための事前訓練された進化変換器
- Authors: Xu Zou,
- Abstract要約: SARS-CoV-2は急速に予測不可能な進化軌道を示した。
これは公衆衛生とワクチン開発に永続的な課題をもたらす。
系統樹由来の進化的軌跡に基づく新しいトランスフォーマーであるPETRAを紹介する。
- 参考スコア(独自算出の注目度): 6.649916450582501
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Since its emergence, SARS-CoV-2 has demonstrated a rapid and unpredictable evolutionary trajectory, characterized by the continual emergence of immune-evasive variants. This poses persistent challenges to public health and vaccine development. While large-scale generative pre-trained transformers (GPTs) have revolutionized the modeling of sequential data, their direct applications to noisy viral genomic sequences are limited. In this paper, we introduce PETRA(Pretrained Evolutionary TRAnsformer), a novel transformer approach based on evolutionary trajectories derived from phylogenetic trees rather than raw RNA sequences. This method effectively mitigates sequencing noise and captures the hierarchical structure of viral evolution. With a weighted training framework to address substantial geographical and temporal imbalances in global sequence data, PETRA excels in predicting future SARS-CoV-2 mutations, achieving a weighted recall@1 of 9.45% for nucleotide mutations and 17.10\% for spike amino-acid mutations, compared to 0.49% and 6.64% respectively for the best baseline. PETRA also demonstrates its ability to aid in the real-time mutation prediction of major clades like 24F(XEC) and 25A(LP.8.1). The code is open sourced on https://github.com/xz-keg/PETra
- Abstract(参考訳): SARS-CoV-2は、その出現以来、迅速かつ予測不可能な進化軌道を示し、免疫回避変異の継続的な出現を特徴としている。
これは公衆衛生とワクチン開発に永続的な課題をもたらす。
大規模生成前訓練型トランスフォーマー(GPT)はシーケンシャルデータのモデリングに革命をもたらしたが、ノイズの多いウイルスゲノム配列への直接的応用は限られている。
本稿では、生のRNA配列ではなく系統樹から派生した進化軌道に基づく新しいトランスフォーマーであるPETRA(Pretrained Evolutionary TRAnsformer)を紹介する。
この方法は、シークエンシングノイズを効果的に軽減し、ウイルス進化の階層構造を捕捉する。
グローバルシーケンスデータにおける地理的および時間的不均衡に対処するための重み付きトレーニングフレームワークにより、PETRAは将来のSARS-CoV-2変異を予測し、それぞれ最高のベースラインで0.49%と6.64%に対して、ヌクレオチド変異で9.45%、スパイクアミノ酸変異で17.10\%の重み付きリコール@1を達成する。
PETRAはまた、24F(XEC)や25A(LP.8.1)のような主要なクレードのリアルタイム突然変異予測を支援する能力も示している。
コードはhttps://github.com/xz-keg/PETraで公開されている。
関連論文リスト
- A Simple yet Effective DDG Predictor is An Unsupervised Antibody Optimizer and Explainer [53.85265022754878]
高速な突然変異スクリーニングのための軽量DDG予測器(Light-DDG)を提案する。
また、Light-DDGを事前学習するための数百万の突然変異データを含む大規模データセットもリリースした。
対象抗体について,変異選好を学習するための新しい変異説明器を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:26:57Z) - VirusT5: Harnessing Large Language Models to Predicting SARS-CoV-2 Evolution [0.0]
我々は,SARS-CoV-2の進化を予測するために,大規模言語モデルの力を利用した。
我々は、SARS-CoV-2進化の根底にある変異パターンを捉えるために、VrusT5と呼ばれるトランスフォーマーモデルを訓練した。
論文 参考訳(メタデータ) (2024-12-20T08:46:42Z) - ADIOS: Antibody Development via Opponent Shaping [49.26728828005039]
抗ウイルス療法は通常、ウイルスの現在の株のみを標的とするように設計されている。
しかし、治療によって誘導される選択的圧力は、新しいウイルス株の出現を引き起こす。
私たちの治療法はウイルスの進化を防御し、積極的に影響を及ぼすことができます。
論文 参考訳(メタデータ) (2024-09-16T14:56:27Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - Using Deep Learning Sequence Models to Identify SARS-CoV-2 Divergence [1.9573380763700707]
SARS-CoV-2は上層呼吸器系RNAウイルスで、2021年5月時点で300万人以上が死亡し、全世界で1億5000万人以上が感染している。
本稿では、繰り返しおよび畳み込み単位を利用してスパイクタンパク質のアミノ酸配列を取り込み、対応するクレードを分類するニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2021-11-12T07:52:11Z) - PhyloTransformer: A Discriminative Model for Mutation Prediction Based
on a Multi-head Self-attention Mechanism [10.468453827172477]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)は10/19/21で219万人が感染し、死亡率は3.6%となっている。
そこで我々は,トランスフォーマーを用いた識別モデルであるPhylo Transformerを開発した。
論文 参考訳(メタデータ) (2021-11-03T01:30:57Z) - Effective and scalable clustering of SARS-CoV-2 sequences [0.41998444721319206]
SARS-CoV-2は進化過程に従って変異し続けている。
GISAIDなどの公開データベースで現在利用可能なSARS-CoV-2のシーケンス数は数百万である。
本稿では,現在のSARS-CoV-2変種をクラスタリングシーケンスに基づいて同定する手法を提案する。
論文 参考訳(メタデータ) (2021-08-18T13:32:43Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - Finetuning Pretrained Transformers into RNNs [81.72974646901136]
トランスフォーマーは自然言語生成においてリカレントニューラルネットワーク(RNN)を上回っている。
線形複雑リカレント変種は自己回帰生成に適していることが証明されている。
この研究は、事前訓練された変換器を効率の良い再帰変換器に変換することを目的としている。
論文 参考訳(メタデータ) (2021-03-24T10:50:43Z) - MutaGAN: A Seq2seq GAN Framework to Predict Mutations of Evolving
Protein Populations [0.0]
このディープラーニングフレームワークの理想的なテストケースとしてインフルエンザウイルス配列が同定された。
MutaGANは、中央のレベンシュテイン距離が2.00アミノ酸である与えられた「親」タンパク質配列から「子」配列を生成した。
結果は, 病原体予測を補助する MutaGAN フレームワークの能力が, タンパク質集団の進化予測に広く有用であることを示すものである。
論文 参考訳(メタデータ) (2020-08-26T20:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。