論文の概要: LRDB: LSTM Raw data DNA Base-caller based on long-short term models in
an active learning environment
- arxiv url: http://arxiv.org/abs/2303.08915v1
- Date: Wed, 15 Mar 2023 20:18:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 17:59:00.005288
- Title: LRDB: LSTM Raw data DNA Base-caller based on long-short term models in
an active learning environment
- Title(参考訳): LRDB: 活動学習環境における長期モデルに基づくLSTM RawデータDNAベースコール
- Authors: Ahmad Rezaei, Mahdi Taheri, Ali Mahani, Sebastian Magierowski
- Abstract要約: 本稿では, 対象菌試料の読み出し精度を向上した, プライベート開発のための軽量オープンソースモデルを提案する。
我々は、訓練データの範囲を制限し、重要なアプリケーションでLRDBのアクティブな使用を可能にするために、転送学習アルゴリズムの恩恵を受けている。
- 参考スコア(独自算出の注目度): 1.452875650827562
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The first important step in extracting DNA characters is using the output
data of MinION devices in the form of electrical current signals. Various
cutting-edge base callers use this data to detect the DNA characters based on
the input. In this paper, we discuss several shortcomings of prior base callers
in the case of time-critical applications, privacy-aware design, and the
problem of catastrophic forgetting. Next, we propose the LRDB model, a
lightweight open-source model for private developments with a better
read-identity (0.35% increase) for the target bacterial samples in the paper.
We have limited the extent of training data and benefited from the transfer
learning algorithm to make the active usage of the LRDB viable in critical
applications. Henceforth, less training time for adapting to new DNA samples
(in our case, Bacterial samples) is needed. Furthermore, LRDB can be modified
concerning the user constraints as the results show a negligible accuracy loss
in case of using fewer parameters. We have also assessed the noise-tolerance
property, which offers about a 1.439% decline in accuracy for a 15dB noise
injection, and the performance metrics show that the model executes in a medium
speed range compared with current cutting-edge models.
- Abstract(参考訳): DNA文字を抽出する最初の重要なステップは、電流信号の形でMinIONデバイスの出力データを使用することである。
様々な最先端のベースコールは、このデータを使って入力に基づいてDNA文字を検出する。
本稿では,時間クリティカルなアプリケーションやプライバシを意識した設計,破滅的な忘れ方といった課題において,先行するベース呼び出し者の欠点について論じる。
次に, 論文中の細菌サンプルの読み出し精度(0.35%増加)が向上した, プライベート開発のための軽量オープンソースモデルであるLRDBモデルを提案する。
我々は、トレーニングデータの範囲を制限し、トランスファー学習アルゴリズムの恩恵を受け、重要なアプリケーションでlrdbをアクティブに利用できるようにする。
そのため、新しいDNAサンプル(この場合、細菌サンプル)に適応するためのトレーニング時間を短縮する必要がある。
また、パラメータの少ない場合には精度の低下が無視できるため、ユーザ制約に関してlrdbを変更することができる。
また、15dBノイズインジェクションの精度を約1.439%低下させる耐雑音性の評価を行い, 性能測定結果から, 現在の最先端モデルと比較して中速度範囲でモデルが実行されることが示された。
関連論文リスト
- Development and Comparative Analysis of Machine Learning Models for Hypoxemia Severity Triage in CBRNE Emergency Scenarios Using Physiological and Demographic Data from Medical-Grade Devices [0.0]
グラディエントブースティングモデル(GBM)は、トレーニング速度、解釈可能性、信頼性の点で、シーケンシャルモデルを上回った。
タイムリーな介入のために5分間の予測ウィンドウが選択された。
本研究は、トリアージを改善し、アラーム疲労を軽減するMLの可能性を強調した。
論文 参考訳(メタデータ) (2024-10-30T23:24:28Z) - Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.784793380119806]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。
従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。
我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-04T14:28:52Z) - Benchmarking Neural Decoding Backbones towards Enhanced On-edge iBCI Applications [28.482461973598593]
本研究は、エッジ展開に適した堅牢な性能と迅速な推論能力を有する最適な神経復号バックボーンを特定することを目的とする。
我々は、GRU(Gated Recurrent Unit)、Transformer、Receptance Weighted Key Value(RWKV)、Selective State Space Model(Mamba)の4つの予測モデルを評価した。
これらの結果から, GRUモデルでは十分な精度が得られたが, RWKVモデルとMambaモデルの方が推論速度とキャリブレーション速度が優れていることが示唆された。
論文 参考訳(メタデータ) (2024-06-08T02:45:36Z) - KAKURENBO: Adaptively Hiding Samples in Deep Neural Network Training [2.8804804517897935]
深層ニューラルネットワークのトレーニングにおいて,最も重要でないサンプルを隠蔽する手法を提案する。
我々は,学習プロセス全体への貢献に基づいて,与えられたエポックを除外するサンプルを適応的に見つける。
本手法は, ベースラインと比較して, 最大22%の精度でトレーニング時間を短縮できる。
論文 参考訳(メタデータ) (2023-10-16T06:19:29Z) - SMRD: SURE-based Robust MRI Reconstruction with Diffusion Models [76.43625653814911]
拡散モデルは、高い試料品質のため、MRIの再生を加速するために人気を博している。
推論時に柔軟にフォワードモデルを組み込んだまま、効果的にリッチなデータプリエントとして機能することができる。
拡散モデル(SMRD)を用いたSUREに基づくMRI再構成を導入し,テスト時の堅牢性を向上する。
論文 参考訳(メタデータ) (2023-10-03T05:05:35Z) - Bias-Aware Minimisation: Understanding and Mitigating Estimator Bias in
Private SGD [56.01810892677744]
DP-SGDにおいて,サンプルごとの勾配ノルムとプライベート勾配オラクルの推定バイアスの関連性を示す。
BAM(Bias-Aware Minimisation)を提案する。
論文 参考訳(メタデータ) (2023-08-23T09:20:41Z) - Preconditioned Score-based Generative Models [49.88840603798831]
直感的な加速度法はサンプリングの繰り返しを減らし、しかしながら重大な性能劣化を引き起こす。
本稿では,行列プレコンディショニングを利用したモデル非依存型bfem事前条件拡散サンプリング(PDS)手法を提案する。
PDSは、バニラSGMのサンプリングプロセスを限界余剰計算コストで変更し、モデルの再訓練を行わない。
論文 参考訳(メタデータ) (2023-02-13T16:30:53Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Longitudinal detection of new MS lesions using Deep Learning [0.0]
新たなMS病変の検出・分節作業に対処するディープラーニングベースのパイプラインについて述べる。
まず,1つの時間点を用いたセグメンテーションタスクで訓練されたモデルからの移動学習を提案する。
第2に、新しい病変を伴う現実的な縦断時間を生成するためのデータ合成戦略を提案する。
論文 参考訳(メタデータ) (2022-06-16T16:09:04Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。