論文の概要: Using Signal Processing in Tandem With Adapted Mixture Models for
Classifying Genomic Signals
- arxiv url: http://arxiv.org/abs/2211.01603v1
- Date: Thu, 3 Nov 2022 06:10:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 14:37:36.521380
- Title: Using Signal Processing in Tandem With Adapted Mixture Models for
Classifying Genomic Signals
- Title(参考訳): 適応混合モデルを用いたタンデム信号処理によるゲノム信号の分類
- Authors: Saish Jaiswal, Shreya Nema, Hema A Murthy, Manikandan Narayanan
- Abstract要約: 本稿では,ガウス混合モデルとタンデムの信号処理を併用して,シーケンスのスペクトル表現を改善する手法を提案する。
提案手法は、確立されたベンチマークデータセットに対して、6.06%の精度で類似した最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 16.119729980200955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Genomic signal processing has been used successfully in bioinformatics to
analyze biomolecular sequences and gain varied insights into DNA structure,
gene organization, protein binding, sequence evolution, etc. But challenges
remain in finding the appropriate spectral representation of a biomolecular
sequence, especially when multiple variable-length sequences need to be handled
consistently. In this study, we address this challenge in the context of the
well-studied problem of classifying genomic sequences into different taxonomic
units (strain, phyla, order, etc.). We propose a novel technique that employs
signal processing in tandem with Gaussian mixture models to improve the
spectral representation of a sequence and subsequently the taxonomic
classification accuracies. The sequences are first transformed into spectra,
and projected to a subspace, where sequences belonging to different taxons are
better distinguishable. Our method outperforms a similar state-of-the-art
method on established benchmark datasets by an absolute margin of 6.06%
accuracy.
- Abstract(参考訳): ゲノムシグナル処理はバイオインフォマティクスにおいて、生体分子配列を分析し、DNA構造、遺伝子構造、タンパク質結合、配列の進化など、様々な知見を得るのに成功している。
しかし、特に複数の可変長配列を一貫して扱う必要がある場合、生体分子配列の適切なスペクトル表現を見つけることが課題である。
本研究では,ゲノム配列を異なる分類単位(ストレイン,フィラ,秩序など)に分類する,十分に検討された問題の文脈において,この課題に対処する。
本稿では,ガウス混合モデルを用いて信号処理を行い,系列のスペクトル表現を改善し,分類学的分類の精度を向上させる新しい手法を提案する。
配列はまずスペクトルに変換され、サブ空間に投影され、異なるタクソンに属する配列はより識別しやすい。
本手法は,確立されたベンチマークデータセットにおける同様の最先端手法を6.06%の精度で絶対マージンで上回っている。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - DNA Sequence Classification with Compressors [0.0]
本研究は,DNA配列解析に適した圧縮機を用いたパラメータフリー分類法を新たに導入する。
この手法は、精度の観点から現在の最先端と整合するだけでなく、従来の機械学習手法よりもリソース効率の良い代替手段を提供する。
論文 参考訳(メタデータ) (2024-01-25T09:17:19Z) - Fast and Functional Structured Data Generators Rooted in Out-of-Equilibrium Physics [44.97217246897902]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - Multiscale methods for signal selection in single-cell data [2.683475550237718]
教師なし特徴選択のための3つのトポロジカルな数学的手法を提案する。
単細胞転写学データセットにこれらの手法を適用することで,これらの手法の有用性を実証する。
論文 参考訳(メタデータ) (2022-06-15T18:42:26Z) - EvoVGM: A Deep Variational Generative Model for Evolutionary Parameter
Estimation [0.0]
本研究では,局所生物学的進化パラメータの真後部を共同で近似した深部変分ベイズ生成モデルを提案する。
本研究では,いくつかの進化シナリオと実際のウイルス配列アライメントをシミュレートした合成配列アライメントにおける手法の一貫性と有効性を示す。
論文 参考訳(メタデータ) (2022-05-25T20:08:10Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。