論文の概要: InForecaster: Forecasting Influenza Hemagglutinin Mutations Through the
Lens of Anomaly Detection
- arxiv url: http://arxiv.org/abs/2210.13709v1
- Date: Tue, 25 Oct 2022 02:08:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 15:50:42.809429
- Title: InForecaster: Forecasting Influenza Hemagglutinin Mutations Through the
Lens of Anomaly Detection
- Title(参考訳): InForecaster: 異常検出レンズによるインフルエンザ・ヘマグルチニン変異の予測
- Authors: Ali Garjani, Atoosa Malemir Chegini, Mohammadreza Salehi, Alireza
Tabibzadeh, Parastoo Yousefi, Mohammad Hossein Razizadeh, Moein Esghaei,
Maryam Esghaei, and Mohammad Hossein Rohban
- Abstract要約: 異常検出(AD)は機械学習(ML)において確立された分野である
我々は,異常検出(AD)によってこの問題に取り組むことを提案する。
公開されている4つのデータセットに対して、多数の実験を行います。
- 参考スコア(独自算出の注目度): 3.5213888068272197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The influenza virus hemagglutinin is an important part of the virus
attachment to the host cells. The hemagglutinin proteins are one of the genetic
regions of the virus with a high potential for mutations. Due to the importance
of predicting mutations in producing effective and low-cost vaccines, solutions
that attempt to approach this problem have recently gained a significant
attention. A historical record of mutations have been used to train predictive
models in such solutions. However, the imbalance between mutations and the
preserved proteins is a big challenge for the development of such models that
needs to be addressed. Here, we propose to tackle this challenge through
anomaly detection (AD). AD is a well-established field in Machine Learning (ML)
that tries to distinguish unseen anomalies from the normal patterns using only
normal training samples. By considering mutations as the anomalous behavior, we
could benefit existing rich solutions in this field that have emerged recently.
Such methods also fit the problem setup of extreme imbalance between the number
of unmutated vs. mutated training samples. Motivated by this formulation, our
method tries to find a compact representation for unmutated samples while
forcing anomalies to be separated from the normal ones. This helps the model to
learn a shared unique representation between normal training samples as much as
possible, which improves the discernibility and detectability of mutated
samples from the unmutated ones at the test time. We conduct a large number of
experiments on four publicly available datasets, consisting of 3 different
hemagglutinin protein datasets, and one SARS-CoV-2 dataset, and show the
effectiveness of our method through different standard criteria.
- Abstract(参考訳): インフルエンザウイルスヘマグルチニンは宿主細胞へのウイルス付着の重要な部分である。
ヘマグルチニンタンパク質はウイルスの遺伝的領域の一つであり、突然変異の可能性が高い。
効果的で低コストなワクチンの生産において突然変異を予測することの重要性から、この問題にアプローチしようとする解決策が近年注目されている。
突然変異の歴史的記録は、そのような解の予測モデルを訓練するために使われてきた。
しかし、変異と保存されたタンパク質の不均衡は、対処すべきモデルを開発する上で大きな課題である。
本稿では,異常検出(AD)によってこの問題に取り組むことを提案する。
ADは機械学習(ML)において確立された分野であり、通常のトレーニングサンプルのみを使用して、見えない異常を通常のパターンと区別しようとする。
突然変異を異常な振る舞いとして考えることで、この領域で最近出現した既存のリッチソリューションに利益をもたらすことができる。
このような方法は、変更されていないトレーニングサンプルの数と変更されていないトレーニングサンプルとの極端な不均衡の問題設定にも適合する。
この定式化に動機づけられた本手法では, 変異のないサンプルに対するコンパクトな表現を探索し, 異常を通常のサンプルから分離させる。
これにより、モデルが通常のトレーニングサンプル間の共有ユニークな表現を可能な限り学習し、テスト時に未変更のサンプルから変異したサンプルの識別性と検出性が向上する。
3つの異なるヘマグルチニンタンパク質データセットと1つのSARS-CoV-2データセットからなる4つの公開データセットに対して多数の実験を行い、異なる標準基準により本手法の有効性を示す。
関連論文リスト
- Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - Invariant Anomaly Detection under Distribution Shifts: A Causal
Perspective [6.845698872290768]
異常検出(AD、Anomaly Detection)は、異常なサンプルを識別する機械学習タスクである。
分散シフトの制約の下では、トレーニングサンプルとテストサンプルが同じ分布から引き出されるという仮定が崩壊する。
我々は,異常検出モデルのレジリエンスを,異なる種類の分布シフトに高めようとしている。
論文 参考訳(メタデータ) (2023-12-21T23:20:47Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Accurate and Definite Mutational Effect Prediction with Lightweight
Equivariant Graph Neural Networks [2.381587712372268]
本研究では,野生型タンパク質の微小環境を効率的に解析する軽量なグラフ表現学習手法を提案する。
私たちのソリューションは、コミュニティにとって理想的な選択肢となる、幅広いメリットを提供します。
論文 参考訳(メタデータ) (2023-04-13T09:51:49Z) - Diversity-Measurable Anomaly Detection [106.07413438216416]
本稿では,再構成の多様性を高めるため,DMAD(Diversity-Measurable Anomaly Detection)フレームワークを提案する。
PDMは基本的に、変形を埋め込みから分離し、最終的な異常スコアをより信頼性を高める。
論文 参考訳(メタデータ) (2023-03-09T05:52:42Z) - Saliency Grafting: Innocuous Attribution-Guided Mixup with Calibrated
Label Mixing [104.630875328668]
ミックスアップスキームは、強化されたトレーニングサンプルを作成するために、サンプルのペアを混ぜることを提案する。
両世界のベストを捉えた、斬新だがシンプルなミックスアップ版を提示する。
論文 参考訳(メタデータ) (2021-12-16T11:27:48Z) - PhyloTransformer: A Discriminative Model for Mutation Prediction Based
on a Multi-head Self-attention Mechanism [10.468453827172477]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)は10/19/21で219万人が感染し、死亡率は3.6%となっている。
そこで我々は,トランスフォーマーを用いた識別モデルであるPhylo Transformerを開発した。
論文 参考訳(メタデータ) (2021-11-03T01:30:57Z) - MutFormer: A context-dependent transformer-based model to predict
pathogenic missense mutations [5.153619184788929]
ミスセンス突然変異は、ヒトの遺伝疾患の原因となる既知の変異の約半分を占める。
ディープラーニングの最近の進歩は、トランスフォーマーモデルが特にシーケンスのモデリングに強力であることを示している。
病原性ミスセンス変異の予測のためのトランスフォーマーモデルであるMutFormerを紹介する。
論文 参考訳(メタデータ) (2021-10-27T20:17:35Z) - GANs with Variational Entropy Regularizers: Applications in Mitigating
the Mode-Collapse Issue [95.23775347605923]
深層学習の成功に基づいて、GAN(Generative Adversarial Networks)は、観測されたサンプルから確率分布を学習するための現代的なアプローチを提供する。
GANはしばしば、ジェネレータが入力分布の既存のすべてのモードをキャプチャできないモード崩壊問題に悩まされる。
情報理論のアプローチを採り、生成したサンプルのエントロピーの変動的下限を最大化し、それらの多様性を増大させる。
論文 参考訳(メタデータ) (2020-09-24T19:34:37Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。