論文の概要: MutaGAN: A Seq2seq GAN Framework to Predict Mutations of Evolving
Protein Populations
- arxiv url: http://arxiv.org/abs/2008.11790v1
- Date: Wed, 26 Aug 2020 20:20:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 21:19:57.524408
- Title: MutaGAN: A Seq2seq GAN Framework to Predict Mutations of Evolving
Protein Populations
- Title(参考訳): MutaGAN: 進化するタンパク質集団の変異を予測するSeq2seq GANフレームワーク
- Authors: Daniel S. Berman (1), Craig Howser (1), Thomas Mehoke (1), Jared D.
Evans (1) ((1) Johns Hopkins Applied Physics Laboratory, Laurel, United
States)
- Abstract要約: このディープラーニングフレームワークの理想的なテストケースとしてインフルエンザウイルス配列が同定された。
MutaGANは、中央のレベンシュテイン距離が2.00アミノ酸である与えられた「親」タンパク質配列から「子」配列を生成した。
結果は, 病原体予測を補助する MutaGAN フレームワークの能力が, タンパク質集団の進化予測に広く有用であることを示すものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The ability to predict the evolution of a pathogen would significantly
improve the ability to control, prevent, and treat disease. Despite significant
progress in other problem spaces, deep learning has yet to contribute to the
issue of predicting mutations of evolving populations. To address this gap, we
developed a novel machine learning framework using generative adversarial
networks (GANs) with recurrent neural networks (RNNs) to accurately predict
genetic mutations and evolution of future biological populations. Using a
generalized time-reversible phylogenetic model of protein evolution with
bootstrapped maximum likelihood tree estimation, we trained a
sequence-to-sequence generator within an adversarial framework, named MutaGAN,
to generate complete protein sequences augmented with possible mutations of
future virus populations. Influenza virus sequences were identified as an ideal
test case for this deep learning framework because it is a significant human
pathogen with new strains emerging annually and global surveillance efforts
have generated a large amount of publicly available data from the National
Center for Biotechnology Information's (NCBI) Influenza Virus Resource (IVR).
MutaGAN generated "child" sequences from a given "parent" protein sequence with
a median Levenshtein distance of 2.00 amino acids. Additionally, the generator
was able to augment the majority of parent proteins with at least one mutation
identified within the global influenza virus population. These results
demonstrate the power of the MutaGAN framework to aid in pathogen forecasting
with implications for broad utility in evolutionary prediction for any protein
population.
- Abstract(参考訳): 病原体の進化を予測する能力は、病気を制御、予防、治療する能力を大幅に向上させる。
他の問題空間での著しい進歩にもかかわらず、深層学習は進化する集団の突然変異を予測する問題にはまだ貢献していない。
このギャップに対処するため, GAN(Generative Adversarial Network)とリカレントニューラルネットワーク(Recurrent Neural Network, RNN)を用いた機械学習フレームワークを開発し, 遺伝的変異と将来の生物個体群の進化を正確に予測した。
タンパク質進化の時間的可逆的系統モデルとブートストラップによる最大木推定を用いて,MutaGANと命名された敵対的枠組みの中で配列から配列へのジェネレータを訓練し,将来的なウイルス集団の突然変異で増強されたタンパク質配列を生成する。
インフルエンザウイルスの配列は、毎年新しい株が出現する重要なヒト病原体であり、世界的な監視活動によって国立バイオテクノロジー情報センター(ncbi)のインフルエンザウイルス資源(ivr)から大量の公開データを生み出しているため、このディープラーニングフレームワークの理想的なテストケースとして同定された。
MutaGANは、中央のレベンシュテイン距離が2.00アミノ酸である与えられた「親」タンパク質配列から「子」配列を生成する。
さらに、ジェネレータは、世界的なインフルエンザウイルス集団内で少なくとも1つの変異で、親タンパク質の大部分を増強することができた。
これらの結果は、ミュータGANフレームワークが病原体予測を補助し、あらゆるタンパク質集団の進化予測に幅広い有用性をもたらすことを示す。
関連論文リスト
- MSAGPT: Neural Prompting Protein Structure Prediction via MSA Generative Pre-Training [48.398329286769304]
マルチシークエンスアライメント(MSA)は、タンパク質ファミリーの進化的軌道を明らかにする上で重要な役割を担っている。
MSAGPTは、低MSA状態下でのMSA生成前訓練を通じてタンパク質構造予測を促進する新しいアプローチである。
論文 参考訳(メタデータ) (2024-06-08T04:23:57Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Unsupervised language models for disease variant prediction [3.6942566104432886]
広い配列のデータセットで訓練された1つのタンパク質LMは、あらゆる遺伝子変異ゼロショットに対して病原性を評価することができる。
臨床的にラベル付けされた疾患関連遺伝子の変異について評価すると,その評価性能は最先端技術に匹敵することがわかった。
論文 参考訳(メタデータ) (2022-12-07T22:28:13Z) - Scalable Pathogen Detection from Next Generation DNA Sequencing with
Deep Learning [3.8175773487333857]
本稿ではトランスフォーマーネットワークをバックボーンとして利用するディープラーニングベースのソリューションMG2Vecを提案する。
提案手法は,未治療の実際の臨床サンプルから病原体を検出するのに有効であることを示す。
本稿では,メタジェノムをベースとした深層学習による疾患診断のための新しい表現学習フレームワークの包括的評価を行う。
論文 参考訳(メタデータ) (2022-11-30T00:13:59Z) - PhyloTransformer: A Discriminative Model for Mutation Prediction Based
on a Multi-head Self-attention Mechanism [10.468453827172477]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)は10/19/21で219万人が感染し、死亡率は3.6%となっている。
そこで我々は,トランスフォーマーを用いた識別モデルであるPhylo Transformerを開発した。
論文 参考訳(メタデータ) (2021-11-03T01:30:57Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Classification of Influenza Hemagglutinin Protein Sequences using
Convolutional Neural Networks [8.397189036839956]
本稿では,インフルエンザA型ウイルスが特定の宿主,具体的にはヒト,鳥,豚の宿主に感染するかどうかを,HA遺伝子のタンパク質配列のみを用いて正確に予測することに焦点を当てる。
本稿では, タンパク質配列を疎水性指数を用いて数値信号に符号化し, その後, 畳み込みニューラルネットワークに基づく予測モデルを活用することを提案する。
その結果,ヒト,鳥,豚の宿主に感染するウイルスが検出された場合,HAタンパク質配列を高い精度で識別できることがわかった。
論文 参考訳(メタデータ) (2021-08-09T10:42:26Z) - Epigenetic evolution of deep convolutional models [81.21462458089142]
我々は、より深い畳み込みモデルを進化させるために、これまで提案されていた神経進化の枠組みを構築した。
異なる形状と大きさのカーネルを同一層内に共存させる畳み込み層配置を提案する。
提案したレイアウトにより、畳み込み層内の個々のカーネルのサイズと形状を、対応する新しい突然変異演算子で進化させることができる。
論文 参考訳(メタデータ) (2021-04-12T12:45:16Z) - Modelling SARS-CoV-2 coevolution with genetic algorithms [0.0]
SARS-CoV-2の流行はウイルス変異の出現に反応した。
遺伝的アルゴリズム(GA)との共進化を,この関係をモデル化するための信頼性の高いアプローチとして提案する。
本稿では,ウイルスの生存と感染率の最小化を目的とした対策を両立させる二重GAモデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T15:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。