論文の概要: LRDB: LSTM Raw data DNA Base-caller based on long-short term models in
an active learning environment
- arxiv url: http://arxiv.org/abs/2303.08915v1
- Date: Wed, 15 Mar 2023 20:18:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 17:59:00.005288
- Title: LRDB: LSTM Raw data DNA Base-caller based on long-short term models in
an active learning environment
- Title(参考訳): LRDB: 活動学習環境における長期モデルに基づくLSTM RawデータDNAベースコール
- Authors: Ahmad Rezaei, Mahdi Taheri, Ali Mahani, Sebastian Magierowski
- Abstract要約: 本稿では, 対象菌試料の読み出し精度を向上した, プライベート開発のための軽量オープンソースモデルを提案する。
我々は、訓練データの範囲を制限し、重要なアプリケーションでLRDBのアクティブな使用を可能にするために、転送学習アルゴリズムの恩恵を受けている。
- 参考スコア(独自算出の注目度): 1.452875650827562
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The first important step in extracting DNA characters is using the output
data of MinION devices in the form of electrical current signals. Various
cutting-edge base callers use this data to detect the DNA characters based on
the input. In this paper, we discuss several shortcomings of prior base callers
in the case of time-critical applications, privacy-aware design, and the
problem of catastrophic forgetting. Next, we propose the LRDB model, a
lightweight open-source model for private developments with a better
read-identity (0.35% increase) for the target bacterial samples in the paper.
We have limited the extent of training data and benefited from the transfer
learning algorithm to make the active usage of the LRDB viable in critical
applications. Henceforth, less training time for adapting to new DNA samples
(in our case, Bacterial samples) is needed. Furthermore, LRDB can be modified
concerning the user constraints as the results show a negligible accuracy loss
in case of using fewer parameters. We have also assessed the noise-tolerance
property, which offers about a 1.439% decline in accuracy for a 15dB noise
injection, and the performance metrics show that the model executes in a medium
speed range compared with current cutting-edge models.
- Abstract(参考訳): DNA文字を抽出する最初の重要なステップは、電流信号の形でMinIONデバイスの出力データを使用することである。
様々な最先端のベースコールは、このデータを使って入力に基づいてDNA文字を検出する。
本稿では,時間クリティカルなアプリケーションやプライバシを意識した設計,破滅的な忘れ方といった課題において,先行するベース呼び出し者の欠点について論じる。
次に, 論文中の細菌サンプルの読み出し精度(0.35%増加)が向上した, プライベート開発のための軽量オープンソースモデルであるLRDBモデルを提案する。
我々は、トレーニングデータの範囲を制限し、トランスファー学習アルゴリズムの恩恵を受け、重要なアプリケーションでlrdbをアクティブに利用できるようにする。
そのため、新しいDNAサンプル(この場合、細菌サンプル)に適応するためのトレーニング時間を短縮する必要がある。
また、パラメータの少ない場合には精度の低下が無視できるため、ユーザ制約に関してlrdbを変更することができる。
また、15dBノイズインジェクションの精度を約1.439%低下させる耐雑音性の評価を行い, 性能測定結果から, 現在の最先端モデルと比較して中速度範囲でモデルが実行されることが示された。
関連論文リスト
- Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Longitudinal detection of new MS lesions using Deep Learning [0.0]
新たなMS病変の検出・分節作業に対処するディープラーニングベースのパイプラインについて述べる。
まず,1つの時間点を用いたセグメンテーションタスクで訓練されたモデルからの移動学習を提案する。
第2に、新しい病変を伴う現実的な縦断時間を生成するためのデータ合成戦略を提案する。
論文 参考訳(メタデータ) (2022-06-16T16:09:04Z) - Generative Adversarial Network Based Synthetic Learning and a Novel
Domain Relevant Loss Term for Spine Radiographs [0.0]
文献レビューから, 有意な入力を伴わない合成脊椎X線画像のGAN生成を初めて達成した。
ジェネレータの新規臨床損失項の導入は、生成リコールの増加とモデルトレーニングの加速に寄与した。
論文 参考訳(メタデータ) (2022-05-05T03:58:19Z) - Efficient Test-Time Model Adaptation without Forgetting [60.36499845014649]
テストタイム適応は、トレーニングとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
信頼性および非冗長なサンプルを同定するためのアクティブなサンプル選択基準を提案する。
また、重要なモデルパラメータを劇的な変化から制約するFisher regularizerを導入します。
論文 参考訳(メタデータ) (2022-04-06T06:39:40Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Semi-supervised on-device neural network adaptation for remote and
portable laser-induced breakdown spectroscopy [0.22843885788439797]
LIBS用軽量多層パーセプトロン(MLP)モデルを導入し、新しい入力データのラベルを必要とせずにオンデバイスで適応できます。
データストリーミング中の平均精度は89.3%で、適応をサポートしないモデルに比べて最大2.1%高い精度を示している。
論文 参考訳(メタデータ) (2021-04-08T00:20:36Z) - Efficient Estimation and Evaluation of Prediction Rules in
Semi-Supervised Settings under Stratified Sampling [6.930951733450623]
本稿では,2段階の半教師付き学習(SSL)手法を提案する。
ステップIでは、非ランダムサンプリングを考慮した非線形基底関数による重み付き回帰により、欠落ラベルをインプットする。
ステップIIでは、結果の予測器の整合性を確保するために、初期計算を増強する。
論文 参考訳(メタデータ) (2020-10-19T12:54:45Z) - RDP-GAN: A R\'enyi-Differential Privacy based Generative Adversarial
Network [75.81653258081435]
GAN(Generative Adversarial Network)は,プライバシ保護の高い現実的なサンプルを生成する能力によって,近年注目を集めている。
しかし、医療記録や財務記録などの機密・私的な訓練例にGANを適用すると、個人の機密・私的な情報を漏らしかねない。
本稿では、学習中の損失関数の値にランダムノイズを慎重に付加することにより、GAN内の差分プライバシー(DP)を実現するR'enyi-differentially private-GAN(RDP-GAN)を提案する。
論文 参考訳(メタデータ) (2020-07-04T09:51:02Z) - SiTGRU: Single-Tunnelled Gated Recurrent Unit for Abnormality Detection [29.500392184282518]
異常検出のための単一トンネルGRU(Single Tunnelled GRU)と呼ばれるGRU(Gated Recurrent Unit)の新規バージョンを提案する。
提案手法は,標準GRUとLong Short Term Memory(LSTM)ネットワークを,検出および一般化タスクのほとんどの指標で上回っている。
論文 参考訳(メタデータ) (2020-03-30T14:58:13Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。