論文の概要: ViroGym: Realistic Large-Scale Benchmarks for Evaluating Viral Proteins
- arxiv url: http://arxiv.org/abs/2603.06740v1
- Date: Fri, 06 Mar 2026 08:38:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.011652
- Title: ViroGym: Realistic Large-Scale Benchmarks for Evaluating Viral Proteins
- Title(参考訳): ViroGym:ウイルスタンパク質評価のための現実的な大規模ベンチマーク
- Authors: Yichen Zhou, Jonathan Golob, Amir Karimi, Stefan Bauer, Patrick Schwab,
- Abstract要約: ViroGymはウイルスタンパク質の変異効果予測を評価するために設計された包括的なベンチマークである。
552,937変異アミノ酸配列を含むウイルスを包含する79種類の深部突然変異スキャン法(DMS)を施行した。
本研究は, フィットネスランドスケープ, 抗原多様性, パンデミック予測について, 確立されたpLMをベンチマークし, ワクチン選択の枠組みを提供する。
- 参考スコア(独自算出の注目度): 19.053135993322897
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein language models (pLMs) have shown strong potential in prediction of the functional effects of missense variants in zero-shot settings. Despite this progress, benchmarking pLMs for viral proteins remains limited and systematic strategies for integrating in silico metrics with in vitro validation to guide antigen and target selection are underdeveloped. Here, we introduce ViroGym, a comprehensive benchmark designed to evaluate variant effect prediction in viral proteins and to facilitate selecting rational antigen candidates. We curated 79 deep mutational scanning (DMS) assays encompassing eukaryotic viruses, collectively comprising 552,937 mutated amino acid sequences across 7 distinct phenotypic readouts, and 21 influenza virus neutralisation tasks and a real-world predictive task for SARS-CoV-2. We benchmark well-established pLMs on fitness landscapes, antigenic diversity, and pandemic forecasting to provide a framework for vaccine selection, and show that pLMs selected using in vitro experimental data excel at predicting dominant circulating mutations in real world.
- Abstract(参考訳): タンパク質言語モデル(pLM)は、ゼロショット設定におけるミスセンス変異の機能的効果の予測に強い可能性を示している。
この進歩にもかかわらず、ウイルスタンパク質のpLMのベンチマークは限定的であり、抗原を誘導するためのin vitroバリデーションとシリコメトリクスを統合するための体系的な戦略は未開発である。
本稿ではウイルスタンパク質の変異効果予測と合理的抗原候補の選択を容易にするために設計された総合的なベンチマークであるViroGymを紹介する。
真核生物ウイルスを包含する79種類の深部突然変異スキャン(DMS)を,7つの異なる表現型読解項目にわたる552,937個の変異アミノ酸配列,21個のインフルエンザウイルス中和タスク,SARS-CoV-2の現実的予測タスクから収集した。
本研究は, 適合性景観, 抗原多様性, パンデミック予測に関する確立したpLMをベンチマークし, ワクチン選択のための枠組みを提供するとともに, 実世界における主要な循環変異を予測するために, 試験管内データを用いて選択したpLMが優れていることを示す。
関連論文リスト
- Open-weight genome language model safeguards: Assessing robustness via adversarial fine-tuning [5.053164256829132]
我々は、最先端のgLMであるEvo 2を評価し、110の有害ヒト感染ウイルスの配列を用いて微調整を行う。
我々は、gLMの安全フレームワークの必要性を強調し、gLMの安全な配置を可能にするために必要な作業の概要を述べる。
論文 参考訳(メタデータ) (2025-11-24T16:46:44Z) - ADIOS: Antibody Development via Opponent Shaping [49.26728828005039]
抗ウイルス療法は通常、ウイルスの現在の株のみを標的とするように設計されている。
しかし、治療によって誘導される選択的圧力は、新しいウイルス株の出現を引き起こす。
私たちの治療法はウイルスの進化を防御し、積極的に影響を及ぼすことができます。
論文 参考訳(メタデータ) (2024-09-16T14:56:27Z) - Machine Learning-Based Analysis of Ebola Virus' Impact on Gene
Expression in Nonhuman Primates [3.842863644161241]
本研究では,エボラウイルス (EBOV) に感染した非ヒト霊長類 (NHP) から得られた遺伝子発現データを解析するために,機械学習に基づく手法である Supervised Magnitude-Altitude Scoring (SMAS) 手法を提案する。
我々は,エボラ感染NHPのNanoString遺伝子発現プロファイルの包括的データセットを用いて,宿主-病原体間相互作用解析のためのSMASシステムをデプロイした。
IFI6とIFI27を重要なバイオマーカーとして同定し、100%精度で例外的な予測性能を示し、AUC(Area Under the Curve)測定値を用いて様々な段階の分類を行った。
論文 参考訳(メタデータ) (2024-01-16T18:31:23Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - PhyloTransformer: A Discriminative Model for Mutation Prediction Based
on a Multi-head Self-attention Mechanism [10.468453827172477]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)は10/19/21で219万人が感染し、死亡率は3.6%となっている。
そこで我々は,トランスフォーマーを用いた識別モデルであるPhylo Transformerを開発した。
論文 参考訳(メタデータ) (2021-11-03T01:30:57Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - PaccMann$^{RL}$ on SARS-CoV-2: Designing antiviral candidates with
conditional generative models [2.0750380105212116]
新型コロナウイルス(COVID-19)の世界的なパンデミックへの急速な発展に伴い、世界中の科学者が、効果的な抗ウイルス治療薬を必死に探している。
タンパク質標的に適合した抗ウイルス候補薬の条件付きデノボ設計のための深層学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-27T11:30:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。