論文の概要: ADRS-CNet: An adaptive models of dimensionality reduction methods for DNA storage clustering algorithms
- arxiv url: http://arxiv.org/abs/2408.12751v1
- Date: Thu, 22 Aug 2024 22:26:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-26 16:28:47.781060
- Title: ADRS-CNet: An adaptive models of dimensionality reduction methods for DNA storage clustering algorithms
- Title(参考訳): ADRS-CNet:DNAストレージクラスタリングアルゴリズムにおける次元削減手法の適応モデル
- Authors: Bowen Liu, Jiankun Li,
- Abstract要約: 本稿では、DNA配列の特徴を分類し、最適次元減少法をインテリジェントに選択する多層パーセプトロン(MLP)に基づくモデルを提案する。
オープンソースのデータセットで検証した実験結果から,我々のモデルは分類性能に優れるだけでなく,クラスタリングの精度も著しく向上することが示された。
- 参考スコア(独自算出の注目度): 8.295062627879938
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: DNA storage technology, with its high density, long-term preservation capability, low maintenance requirements, and compact physical size, is emerging as a promising option for large-scale data storage. However, extracting features from DNA sequences of varying lengths can lead to the problem of dimensionality, which needs to be addressed. Techniques such as PCA, UMAP, and t-SNE are commonly used to project high-dimensional data into a lower-dimensional space, but their effectiveness varies across different datasets. To address this challenge, this paper proposes a model based on a multilayer perceptron (MLP) that classifies DNA sequence features and intelligently selects the optimal dimensionality reduction method, thereby enhancing subsequent clustering performance. Experimental results, tested on open-source datasets and compared with multiple benchmark methods, demonstrate that our model not only excels in classification performance but also significantly improves clustering accuracy, indicating that this approach effectively mitigates the challenges posed by high-dimensional features in clustering models.
- Abstract(参考訳): DNAストレージ技術は、密度が高く、長期保存能力が高く、メンテナンス要件が低く、物理的サイズも小さく、大規模データストレージにとって有望な選択肢として浮上している。
しかし、様々な長さのDNA配列から特徴を抽出することは、対処すべき次元の問題につながる可能性がある。
PCA、UMAP、t-SNEといった技術は、高次元データを低次元空間に投影するのに一般的に使用されるが、それらの効果は異なるデータセットによって異なる。
そこで本研究では,DNA配列の特徴を分類し,最適次元縮小法をインテリジェントに選択し,その後のクラスタリング性能を向上させる多層パーセプトロン(MLP)に基づくモデルを提案する。
オープンソースのデータセットで検証し、複数のベンチマーク手法と比較した結果、我々のモデルは分類性能に優れるだけでなく、クラスタリング精度も大幅に向上し、クラスタリングモデルにおける高次元特徴による課題を効果的に軽減することを示した。
関連論文リスト
- Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Deep Learning for Efficient GWAS Feature Selection [0.0]
本稿では,Mirzaeiらによって提案された特徴選択手法の拡張について紹介する。
拡張されたアプローチは、学生ネットワークにフロベニウスのノルムペナルティを導入することによって、元の手法を強化する。
教師なしと教師なしの両方で シームレスに動作します 2つの重要なニューラルネットワークを使っています
論文 参考訳(メタデータ) (2023-12-22T20:35:47Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - SparCA: Sparse Compressed Agglomeration for Feature Extraction and
Dimensionality Reduction [0.0]
本稿では,新しい次元縮小法としてスパース圧縮凝集法(SparCA)を提案する。
SparCAは、幅広いデータタイプに適用でき、高度に解釈可能な機能を生成し、下流の教師あり学習タスクで魅力的なパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-01-26T13:59:15Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - Multidimensional Scaling for Gene Sequence Data with Autoencoders [0.0]
本稿では、数百万の遺伝子配列を含むデータセットに容易にスケールできるオートエンコーダに基づく次元還元モデルを提案する。
提案モデルは現実世界の菌類遺伝子配列データセットを用いてDAMDSに対して評価される。
論文 参考訳(メタデータ) (2021-04-19T02:14:17Z) - High-dimensional Bayesian Optimization of Personalized Cardiac Model
Parameters via an Embedded Generative Model [7.286540513944084]
ベイズ最適化の目的関数に生成的変分オートエンコーダ(VAE)を組み込む新しい概念を提案する。
生成コードに関するVAE符号化された知識は、探索空間の探索を導くために使用される。
本発明の方法は、心臓電気生理学的モデルにおける組織興奮性の推定に応用される。
論文 参考訳(メタデータ) (2020-05-15T22:14:16Z) - GeneCAI: Genetic Evolution for Acquiring Compact AI [36.04715576228068]
ディープニューラルネットワーク(DNN)は、より高い推論精度を達成するために、より複雑なアーキテクチャへと進化している。
モデル圧縮技術は、リソース制限されたモバイルデバイスにそのような計算集約的なアーキテクチャを効率的に展開するために利用することができる。
本稿では,階層ごとの圧縮ハイパーパラメータのチューニング方法を自動的に学習する新しい最適化手法であるGeneCAIを紹介する。
論文 参考訳(メタデータ) (2020-04-08T20:56:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。