論文の概要: An Investigation of Hepatitis B Virus Genome using Markov Models
- arxiv url: http://arxiv.org/abs/2311.06699v1
- Date: Sun, 12 Nov 2023 00:46:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 17:18:23.073233
- Title: An Investigation of Hepatitis B Virus Genome using Markov Models
- Title(参考訳): マルコフモデルを用いたB型肝炎ウイルスゲノムの検討
- Authors: Khadijeh (Hoda) Jahanian, Elnaz Shalbafian, Morteza Saberi, Roohallah
Alizadehsani, Iman Dehzangi
- Abstract要約: ヒトゲノムはAPOBEC3として知られる編集酵素のファミリーをコードしている。
APO-BEC3G、APOBEC3F、APOBEC3H haplotype IIなどの家族はHIVなどのウイルスに対して活性を示す。
我々はHBVゲノム中のAPOBEC3酵素の変異フットプリントを同定することを目的とする。
- 参考スコア(独自算出の注目度): 3.2311303453753033
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The human genome encodes a family of editing enzymes known as APOBEC3
(apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like 3). Several
family members, such as APO-BEC3G, APOBEC3F, and APOBEC3H haplotype II, exhibit
activity against viruses such as HIV. These enzymes induce C-to-U mutations in
the negative strand of viral genomes, resulting in multiple G-to-A changes,
commonly referred to as 'hypermutation.' Mutations catalyzed by these enzymes
are sequence context-dependent in the HIV genome; for instance, APOBEC3G
preferen-tially mutates G within GG, TGG, and TGGG contexts, while other
members mutate G within GA, TGA, and TGAA contexts. However, the same sequence
context has not been explored in relation to these enzymes and HBV. In this
study, our objective is to identify the mutational footprint of APOBEC3 enzymes
in the HBV genome. To achieve this, we employ a multivariable data analytics
technique to investigate motif preferences and potential sequence hierarchies
of mutation by APOBEC3 enzymes using full genome HBV sequences from a diverse
range of naturally infected patients. This approach allows us to distinguish
between normal and hypermutated sequences based on the representation of mono-
to tetra-nucleotide motifs. Additionally, we aim to identify motifs associated
with hypermutation induced by different APOBEC3 enzymes in HBV genomes. Our
analyses reveal that either APOBEC3 enzymes are not active against HBV, or the
induction of G-to-A mutations by these enzymes is not sequence
context-dependent in the HBV genome.
- Abstract(参考訳): ヒトゲノムはAPOBEC3 (apolipoprotein B mRNA editing enzyme, Catalyst polypeptide-like 3)として知られる編集酵素のファミリーをコードする。
APO-BEC3G、APOBEC3F、APOBEC3H haplotype IIなどの家族はHIVなどのウイルスに対して活性を示す。
これらの酵素はウイルスゲノムの負の鎖にC-to-U変異を誘導し、複数のG-to-A変異をもたらす。
例えば、apobec3gはgg、tgg、tgggコンテキスト内でgを優先的に変異させ、他のメンバーはga、tga、tgaaコンテキスト内でgを変異させる。
しかし、これらの酵素とHBVに関して、同じ配列の文脈は研究されていない。
本研究の目的は,HBVゲノム中のAPOBEC3酵素の変異足跡を同定することである。
そこで本研究では,APOBEC3酵素による変異のモチーフ選好と潜在的配列階層を,様々な自然感染患者からの全ゲノムHBV配列を用いて解析するために多変量データ解析手法を用いた。
このアプローチにより,モノトテトラヌクレオチドモチーフの表現に基づいて,正規配列と過変化配列を区別できる。
さらに,HBVゲノム中の異なるAPOBEC3酵素によって誘導される過剰変異に関連するモチーフを同定することを目的とする。
解析の結果,APOBEC3酵素はHBVに対して活性がないか,あるいはこれらの酵素によるG-to-A変異の誘導はHBVゲノムの配列に依存しないことがわかった。
関連論文リスト
- A Simple yet Effective DDG Predictor is An Unsupervised Antibody Optimizer and Explainer [53.85265022754878]
高速な突然変異スクリーニングのための軽量DDG予測器(Light-DDG)を提案する。
また、Light-DDGを事前学習するための数百万の突然変異データを含む大規模データセットもリリースした。
対象抗体について,変異選好を学習するための新しい変異説明器を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:26:57Z) - Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。
表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。
ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文 参考訳(メタデータ) (2025-01-30T23:03:03Z) - VirusT5: Harnessing Large Language Models to Predicting SARS-CoV-2 Evolution [0.0]
我々は,SARS-CoV-2の進化を予測するために,大規模言語モデルの力を利用した。
我々は、SARS-CoV-2進化の根底にある変異パターンを捉えるために、VrusT5と呼ばれるトランスフォーマーモデルを訓練した。
論文 参考訳(メタデータ) (2024-12-20T08:46:42Z) - Explainable convolutional neural network model provides an alternative genome-wide association perspective on mutations in SARS-CoV-2 [12.507142100136464]
我々は、Variants of Concern(VOC)へのゲノム配列を予測できるCNN分類モデルを訓練した。
比較のために,従来のゲノムワイド・アソシエーション研究(GWAS)を行い,VOCに関連する変異を同定した。
以上の結果から,ゲノム配列に対する説明可能なニューラルネットワークは,従来のゲノムワイド解析手法の代替となる可能性が示唆された。
論文 参考訳(メタデータ) (2024-10-29T18:35:40Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Generative Enzyme Design Guided by Functionally Important Sites and Small-Molecule Substrates [16.5169461287914]
本稿では,酵素をすべての官能基にまたがって設計する統一モデルを学ぶためのアプローチであるEnzyGenを提案する。
我々のキーとなるアイデアは、酵素のアミノ酸配列とその3D座標を、所望の触媒機能に対応する機能的に重要な部位と基質に基づいて生成することである。
論文 参考訳(メタデータ) (2024-05-13T21:48:48Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - AVIDa-hIL6: A Large-Scale VHH Dataset Produced from an Immunized Alpaca
for Predicting Antigen-Antibody Interactions [1.1381826108737396]
重鎖抗体(VHHs)の変異領域における抗原と抗体の相互作用を予測するための大規模データセットを開発した。
AVIDa-hIL6は、アミノ酸配列と573,891の抗原-VHHペアを含む。
機械学習モデルを用いたAVIDa-hIL6のベンチマーク結果について報告する。
論文 参考訳(メタデータ) (2023-06-06T00:42:36Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Analysis of Coronavirus Envelope Protein with Cellular Automata (CA)
Model [0.0]
SARS Covid(2019 CoV-2)とSARS Covid(2003 CoV)とMERS Covid(2012 MERS)は、構造タンパク質で報告された突然変異に起因する。
CoV-2の69位にあるアミノ酸Rの代わりにCoVの69-70位にあるアミノ酸対EGが、現在の調査の主要な決定要因として同定されている。
論文 参考訳(メタデータ) (2022-01-15T19:07:18Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。