論文の概要: Hamming Encoder: Mining Discriminative k-mers for Discrete Sequence
Classification
- arxiv url: http://arxiv.org/abs/2310.10321v1
- Date: Mon, 16 Oct 2023 12:03:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 14:46:28.254757
- Title: Hamming Encoder: Mining Discriminative k-mers for Discrete Sequence
Classification
- Title(参考訳): ハミングエンコーダ:離散シーケンス分類のためのマイニング判別k-mer
- Authors: Junjie Dong, Mudi Jiang, Lianyu Hu, Zengyou He
- Abstract要約: 既存のパターンベースの手法は、採掘過程において個々の特徴の識別力を測定する。
シーケンスを特徴ベクトルに変換した後、全体的な識別性能を確保することは困難である。
本稿では,二項化1D畳み込みニューラルネットワーク(1DCNN)アーキテクチャを用いて,識別的k-mer集合をマイニングするハミングを提案する。
- 参考スコア(独自算出の注目度): 1.6693049653540362
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sequence classification has numerous applications in various fields. Despite
extensive studies in the last decades, many challenges still exist,
particularly in pattern-based methods. Existing pattern-based methods measure
the discriminative power of each feature individually during the mining
process, leading to the result of missing some combinations of features with
discriminative power. Furthermore, it is difficult to ensure the overall
discriminative performance after converting sequences into feature vectors. To
address these challenges, we propose a novel approach called Hamming Encoder,
which utilizes a binarized 1D-convolutional neural network (1DCNN) architecture
to mine discriminative k-mer sets. In particular, we adopt a Hamming
distance-based similarity measure to ensure consistency in the feature mining
and classification procedure. Our method involves training an interpretable CNN
encoder for sequential data and performing a gradient-based search for
discriminative k-mer combinations. Experiments show that the Hamming Encoder
method proposed in this paper outperforms existing state-of-the-art methods in
terms of classification accuracy.
- Abstract(参考訳): シーケンス分類は様々な分野に応用されている。
過去数十年にわたる広範な研究にもかかわらず、特にパターンベースの手法では、多くの課題が残っている。
既存のパターンベースの手法では、マイニングの過程で個々の特徴の識別能力を測定し、特徴と識別力の組み合わせを欠く結果となる。
さらに、シーケンスを特徴ベクトルに変換した後、全体的な識別性能を確保することは困難である。
これらの課題に対処するために,二元化1次元畳み込みニューラルネットワーク(1dcnn)アーキテクチャを用いて識別k-mer集合をマイニングするhamming encoderと呼ばれる新しい手法を提案する。
特に,ハミング距離に基づく類似度尺度を採用し,特徴採鉱・分類手順の整合性を確保する。
本手法は,シーケンシャルデータのための解釈可能なcnnエンコーダを訓練し,識別k-mer組合せの勾配に基づく探索を行う。
実験により,本論文で提案するハミングエンコーダ法は,従来の最先端の手法よりも分類精度が優れていることを示した。
関連論文リスト
- Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - FeCAM: Exploiting the Heterogeneity of Class Distributions in
Exemplar-Free Continual Learning [21.088762527081883]
Exemplar-free class-incremental learning (CIL)は、以前のタスクからのデータのリハーサルを禁止しているため、いくつかの課題がある。
第1タスクの後に特徴抽出器を凍結して分類器を漸進的に学習する手法が注目されている。
凍結した特徴抽出器を用いて新しいクラスプロトタイプを生成するCILのプロトタイプネットワークを探索し,プロトタイプとのユークリッド距離に基づいて特徴を分類する。
論文 参考訳(メタデータ) (2023-09-25T11:54:33Z) - Sparse-Inductive Generative Adversarial Hashing for Nearest Neighbor
Search [8.020530603813416]
本稿では,Sparsity-induced Generative Adversarial Hashing (SiGAH)と呼ばれる新しい教師なしハッシュ法を提案する。
SiGAHは、大規模な高次元特徴をバイナリコードにエンコードする。
Tiny100K、GIST1M、Deep1M、MNISTの4つのベンチマーク実験の結果、提案されたSiGAHは最先端のアプローチよりも優れた性能を示している。
論文 参考訳(メタデータ) (2023-06-12T08:07:23Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Few-Shot Specific Emitter Identification via Deep Metric Ensemble
Learning [26.581059299453663]
本稿では,自動監視ブロードキャスト(ADS-B)信号を用いた航空機識別のための新しいFS-SEIを提案する。
特に,提案手法は特徴埋め込みと分類から成り立っている。
シミュレーションの結果,カテゴリごとのサンプル数が5以上であれば,提案手法の平均精度は98%以上であることがわかった。
論文 参考訳(メタデータ) (2022-07-14T01:09:22Z) - Learning to Hash Naturally Sorts [84.90210592082829]
そこで我々はNaturely-Sorted Hashing (NSH)を導入し,最終結果のソートによる深層ハッシュモデルのトレーニングを行った。
NSHはサンプルのハッシュコードのハミング距離をソートし、それに従って自己教師付きトレーニングのための潜伏した表現を収集する。
Sorted Noise-Contrastive Estimation (SortedNCE) の新たな損失について述べる。
論文 参考訳(メタデータ) (2022-01-31T16:19:02Z) - Rank-Consistency Deep Hashing for Scalable Multi-Label Image Search [90.30623718137244]
スケーラブルなマルチラベル画像検索のための新しいディープハッシュ法を提案する。
2つの空間の類似性順序を整列するために、新しい階数整合性目的を適用した。
強力な損失関数は、意味的類似性とハミング距離が一致しないサンプルをペナルティ化するように設計されている。
論文 参考訳(メタデータ) (2021-02-02T13:46:58Z) - High-Dimensional Quadratic Discriminant Analysis under Spiked Covariance
Model [101.74172837046382]
そこで本研究では,魚の識別比を最大化する2次分類手法を提案する。
数値シミュレーションにより,提案した分類器は,合成データと実データの両方において古典的R-QDAよりも優れるだけでなく,計算量の削減も要求されることがわかった。
論文 参考訳(メタデータ) (2020-06-25T12:00:26Z) - Pairwise Supervised Hashing with Bernoulli Variational Auto-Encoder and
Self-Control Gradient Estimator [62.26981903551382]
バイナリ潜在変数を持つ変分自動エンコーダ(VAE)は、文書検索の精度の観点から最先端のパフォーマンスを提供する。
本稿では、クラス内類似度とクラス間類似度に報いるために、個別潜伏型VAEを用いたペアワイズ損失関数を提案する。
この新しいセマンティックハッシュフレームワークは、最先端技術よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-05-21T06:11:33Z) - Deterministic Decoding for Discrete Data in Variational Autoencoders [5.254093731341154]
サンプリングの代わりに最上位のトークンを選択するシーケンシャルデータに対して,決定論的デコーダ(DD-VAE)を用いたVAEモデルについて検討する。
分子生成や最適化問題を含む複数のデータセット上でのDD-VAEの性能を示す。
論文 参考訳(メタデータ) (2020-03-04T16:36:52Z) - Boosted Locality Sensitive Hashing: Discriminative Binary Codes for
Source Separation [19.72987718461291]
音声スペクトルを効率よく表現する局所性に敏感なハッシュ符号を学習するための適応的な促進手法を提案する。
我々は、複雑な機械学習モデルの代替として、学習したハッシュコードを単一チャネルの音声認識タスクに使用する。
論文 参考訳(メタデータ) (2020-02-14T20:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。