論文の概要: VirusT5: Harnessing Large Language Models to Predicting SARS-CoV-2 Evolution
- arxiv url: http://arxiv.org/abs/2412.16262v1
- Date: Fri, 20 Dec 2024 08:46:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:56:56.917560
- Title: VirusT5: Harnessing Large Language Models to Predicting SARS-CoV-2 Evolution
- Title(参考訳): VirusT5:SARS-CoV-2進化を予測するための大規模言語モデル
- Authors: Vishwajeet Marathe, Deewan Bajracharya, Changhui Yan,
- Abstract要約: 我々は,SARS-CoV-2の進化を予測するために,大規模言語モデルの力を利用した。
我々は、SARS-CoV-2進化の根底にある変異パターンを捉えるために、VrusT5と呼ばれるトランスフォーマーモデルを訓練した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: During a virus's evolution,various regions of the genome are subjected to distinct levels of functional constraints.Combined with factors like codon bias and DNA repair efficiency,these constraints contribute to unique mutation patterns within the genome or a specific gene. In this project, we harnessed the power of Large Language Models(LLMs) to predict the evolution of SARS-CoV-2. By treating the mutation process from one generation to the next as a translation task, we trained a transformer model, called VirusT5, to capture the mutation patterns underlying SARS-CoV-2 evolution. We evaluated the VirusT5's ability to detect these mutation patterns including its ability to identify mutation hotspots and explored the potential of using VirusT5 to predict future virus variants. Our findings demonstrate the feasibility of using a large language model to model viral evolution as a translation process. This study establishes the groundbreaking concept of "mutation-as-translation," paving the way for new methodologies and tools for combating virus threats
- Abstract(参考訳): ウイルスの進化の間、ゲノムの様々な領域は異なるレベルの機能的制約を受けており、コドンバイアスやDNA修復効率などの要因が組み合わさって、これらの制約はゲノムまたは特定の遺伝子内のユニークな突然変異パターンに寄与する。
本稿では,SARS-CoV-2の進化を予測するために,Large Language Models(LLMs)のパワーを利用した。
1世代から次の世代への突然変異過程を翻訳タスクとして扱うことで、私たちは、SARS-CoV-2進化の根底にある突然変異パターンを捉えるために、VrusT5と呼ばれるトランスフォーマーモデルを訓練した。
我々は、変異ホットスポットを同定する機能を含む、これらの変異パターンを検出できるウイルスT5の機能を評価し、将来のウイルス変異を予測するためにウイルスT5を使用することの可能性を探った。
本研究は、ウイルスの進化を翻訳プロセスとしてモデル化するために、大きな言語モデルを使用することの可能性を示した。
本研究は「突然変異・翻訳」という画期的な概念を確立し、ウイルスの脅威と戦うための新しい方法とツールの道を開くものである。
関連論文リスト
- Explainable convolutional neural network model provides an alternative genome-wide association perspective on mutations in SARS-CoV-2 [12.507142100136464]
我々は、Variants of Concern(VOC)へのゲノム配列を予測できるCNN分類モデルを訓練した。
比較のために,従来のゲノムワイド・アソシエーション研究(GWAS)を行い,VOCに関連する変異を同定した。
以上の結果から,ゲノム配列に対する説明可能なニューラルネットワークは,従来のゲノムワイド解析手法の代替となる可能性が示唆された。
論文 参考訳(メタデータ) (2024-10-29T18:35:40Z) - Opponent Shaping for Antibody Development [49.26728828005039]
抗ウイルス療法は通常、ウイルスの現在の株のみを標的とするように設計されている。
治療によって誘導される選択的圧力はウイルスに作用し、変異株の出現を誘導し、初期治療が効果を低下させる。
我々は、ウイルスの進化的脱出の遺伝的シミュレーションを実装するために、抗体とウイルス抗原の結合の計算モデルを構築した。
論文 参考訳(メタデータ) (2024-09-16T14:56:27Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - PhyloTransformer: A Discriminative Model for Mutation Prediction Based
on a Multi-head Self-attention Mechanism [10.468453827172477]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)は10/19/21で219万人が感染し、死亡率は3.6%となっている。
そこで我々は,トランスフォーマーを用いた識別モデルであるPhylo Transformerを開発した。
論文 参考訳(メタデータ) (2021-11-03T01:30:57Z) - Effective and scalable clustering of SARS-CoV-2 sequences [0.41998444721319206]
SARS-CoV-2は進化過程に従って変異し続けている。
GISAIDなどの公開データベースで現在利用可能なSARS-CoV-2のシーケンス数は数百万である。
本稿では,現在のSARS-CoV-2変種をクラスタリングシーケンスに基づいて同定する手法を提案する。
論文 参考訳(メタデータ) (2021-08-18T13:32:43Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - Epigenetic evolution of deep convolutional models [81.21462458089142]
我々は、より深い畳み込みモデルを進化させるために、これまで提案されていた神経進化の枠組みを構築した。
異なる形状と大きさのカーネルを同一層内に共存させる畳み込み層配置を提案する。
提案したレイアウトにより、畳み込み層内の個々のカーネルのサイズと形状を、対応する新しい突然変異演算子で進化させることができる。
論文 参考訳(メタデータ) (2021-04-12T12:45:16Z) - MutaGAN: A Seq2seq GAN Framework to Predict Mutations of Evolving
Protein Populations [0.0]
このディープラーニングフレームワークの理想的なテストケースとしてインフルエンザウイルス配列が同定された。
MutaGANは、中央のレベンシュテイン距離が2.00アミノ酸である与えられた「親」タンパク質配列から「子」配列を生成した。
結果は, 病原体予測を補助する MutaGAN フレームワークの能力が, タンパク質集団の進化予測に広く有用であることを示すものである。
論文 参考訳(メタデータ) (2020-08-26T20:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。