論文の概要: XVir: A Transformer-Based Architecture for Identifying Viral Reads from
Cancer Samples
- arxiv url: http://arxiv.org/abs/2308.14769v1
- Date: Mon, 28 Aug 2023 05:15:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 17:18:03.828349
- Title: XVir: A Transformer-Based Architecture for Identifying Viral Reads from
Cancer Samples
- Title(参考訳): XVir: がんサンプルからウイルスの読みを識別するトランスフォーマーベースのアーキテクチャ
- Authors: Shorya Consul, John Robertson, Haris Vikalo
- Abstract要約: 世界中で約15%のがんがウイルス感染と関連していると推定されている。
XVirは、ヒト腫瘍に存在するウイルスDNAを確実に識別するために、トランスフォーマーベースのディープラーニングアーキテクチャに依存するデータパイプラインである。
- 参考スコア(独自算出の注目度): 13.918375272852607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is estimated that approximately 15% of cancers worldwide can be linked to
viral infections. The viruses that can cause or increase the risk of cancer
include human papillomavirus, hepatitis B and C viruses, Epstein-Barr virus,
and human immunodeficiency virus, to name a few. The computational analysis of
the massive amounts of tumor DNA data, whose collection is enabled by the
recent advancements in sequencing technologies, have allowed studies of the
potential association between cancers and viral pathogens. However, the high
diversity of oncoviral families makes reliable detection of viral DNA difficult
and thus, renders such analysis challenging. In this paper, we introduce XVir,
a data pipeline that relies on a transformer-based deep learning architecture
to reliably identify viral DNA present in human tumors. In particular, XVir is
trained on genomic sequencing reads from viral and human genomes and may be
used with tumor sequence information to find evidence of viral DNA in human
cancers. Results on semi-experimental data demonstrate that XVir is capable of
achieving high detection accuracy, generally outperforming state-of-the-art
competing methods while being more compact and less computationally demanding.
- Abstract(参考訳): 世界のがんの約15%はウイルス感染と関連していると推定されている。
ヒトパピローマウイルス、b型肝炎ウイルス、c型肝炎ウイルス、エプスタイン・バールウイルス、ヒト免疫不全ウイルスなど、がんのリスクを惹起または増加させるウイルスがいくつかある。
近年のシークエンシング技術の進歩によって収集された大量の腫瘍DNAデータの計算分析により、がんとウイルス病原体の潜在的な関連についての研究が可能となった。
しかし、oncoviral familyの多様性が高いため、信頼できるウイルスdnaの検出は困難であり、このような分析は困難である。
本稿では,人間の腫瘍に存在するウイルスdnaを確実に同定するトランスフォーマーベースのディープラーニングアーキテクチャを活用したデータパイプラインであるxvirを紹介する。
特に、XVirは、ウイルスおよびヒトゲノムからのゲノムシークエンシングを訓練しており、ヒト癌におけるウイルスDNAの証拠を見つけるために、腫瘍の配列情報と共に使用されることがある。
半実験データの結果、XVirは高い検出精度を達成でき、一般に最先端の競合手法より優れ、よりコンパクトで計算量も少ない。
関連論文リスト
- Virus2Vec: Viral Sequence Classification Using Machine Learning [48.40285316053593]
本稿では,バイラル・シークエンスのための特徴ベクトル表現であるVrus2Vecを提案する。
コロナウイルス科の実際のスパイク配列と狂犬病ウイルスのシークエンスデータに基づいてウイルス2Vecを実験的に評価し、宿主を予測した。
以上の結果から, Virus2Vecはベースラインおよび最先端手法の予測精度よりも優れていた。
論文 参考訳(メタデータ) (2023-04-24T08:17:16Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Scalable Pathogen Detection from Next Generation DNA Sequencing with
Deep Learning [3.8175773487333857]
本稿ではトランスフォーマーネットワークをバックボーンとして利用するディープラーニングベースのソリューションMG2Vecを提案する。
提案手法は,未治療の実際の臨床サンプルから病原体を検出するのに有効であることを示す。
本稿では,メタジェノムをベースとした深層学習による疾患診断のための新しい表現学習フレームワークの包括的評価を行う。
論文 参考訳(メタデータ) (2022-11-30T00:13:59Z) - Accurate Virus Identification with Interpretable Raman Signatures by
Machine Learning [12.184128048998906]
本稿では,ヒトおよび鳥のRamanスペクトルを機械学習で解析する手法を提案する。
スペクトルデータ用に特別に設計された畳み込みニューラルネットワーク(CNN)分類器は、様々なウイルスタイプやサブタイプの識別タスクに対して非常に高い精度を達成する。
論文 参考訳(メタデータ) (2022-06-05T22:31:14Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - In-Line Image Transformations for Imbalanced, Multiclass Computer Vision
Classification of Lung Chest X-Rays [91.3755431537592]
本研究は、COVID-19 LCXRデータ不足のバランスをとるために画像変換を適用するために、文献の体系を活用することを目的としている。
convolutional neural networks(cnns)のようなディープラーニング技術は、健康状態と疾患状態を区別する特徴を選択することができる。
本研究は,CNNアーキテクチャを用いて高速多クラスLCXR分類を94%精度で行う。
論文 参考訳(メタデータ) (2021-04-06T02:01:43Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - Machine Learning Against Cancer: Accurate Diagnosis of Cancer by Machine
Learning Classification of the Whole Genome Sequencing Data [0.0]
我々は,MLAC(Machine Learning Against Cancer)の新たな手法を開発し,完全精度,感度,特異性を実現した。
The Cancer Genome Atlas and Genotype-Tissue Expression project for cancerous and healthy tissues。
論文 参考訳(メタデータ) (2020-09-12T18:51:47Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Genome Sequence Classification for Animal Diagnostics with Graph
Representations and Deep Neural Networks [4.339839287869652]
ウシ呼吸器疾患複合体(英: Bovine Respiratory Disease Complex, BRDC)は、ウシに細菌やウイルスを含む複数の病因を持つ複雑な呼吸器疾患である。
現在の動物疾患診断は、細菌培養、血清分析、PCR(PCR)検査などの従来の検査に基づいている。
ネットワークベースの機械学習アプローチは、最大89.7%の精度で病原体シグネチャを検出することができる。
論文 参考訳(メタデータ) (2020-07-24T22:30:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。