論文の概要: Deep DNA Storage: Scalable and Robust DNA Storage via Coding Theory and
Deep Learning
- arxiv url: http://arxiv.org/abs/2109.00031v1
- Date: Tue, 31 Aug 2021 18:21:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-02 14:11:29.182549
- Title: Deep DNA Storage: Scalable and Robust DNA Storage via Coding Theory and
Deep Learning
- Title(参考訳): ディープDNAストレージ:コーディング理論とディープラーニングによるスケーラブルでロバストなDNAストレージ
- Authors: Daniella Bar-Lev, Itai Orr, Omer Sabary, Tuvi Etzion, Eitan Yaakobi
- Abstract要約: 我々は、DNAベースのストレージシステムを実装するための堅牢で効率的でスケーラブルなソリューションを提案する。
本手法では,合成およびシークエンシングプロセスによって生成されたコピーの完全クラスタに基づいて,文字列を再構成するディープニューラルネットワーク(DNN)をデプロイする。
- 参考スコア(独自算出の注目度): 52.32306238197686
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The concept of DNA storage was first suggested in 1959 by Richard Feynman who
shared his vision regarding nanotechnology in the talk "There is plenty of room
at the bottom". Later, towards the end of the 20-th century, the interest in
storage solutions based on DNA molecules was increased as a result of the human
genome project which in turn led to a significant progress in sequencing and
assembly methods. DNA storage enjoys major advantages over the well-established
magnetic and optical storage solutions. As opposed to magnetic solutions, DNA
storage does not require electrical supply to maintain data integrity and is
superior to other storage solutions in both density and durability. Given the
trends in cost decreases of DNA synthesis and sequencing, it is now
acknowledged that within the next 10-15 years DNA storage may become a highly
competitive archiving technology and probably later the main such technology.
With that said, the current implementations of DNA based storage systems are
very limited and are not fully optimized to address the unique pattern of
errors which characterize the synthesis and sequencing processes. In this work,
we propose a robust, efficient and scalable solution to implement DNA-based
storage systems. Our method deploys Deep Neural Networks (DNN) which
reconstruct a sequence of letters based on imperfect cluster of copies
generated by the synthesis and sequencing processes. A tailor-made
Error-Correcting Code (ECC) is utilized to combat patterns of errors which
occur during this process. Since our reconstruction method is adapted to
imperfect clusters, our method overcomes the time bottleneck of the noisy DNA
copies clustering process by allowing the use of a rapid and scalable
pseudo-clustering instead. Our architecture combines between convolutions and
transformers blocks and is trained using synthetic data modelled after real
data statistics.
- Abstract(参考訳): このDNA保存の概念は1959年にリチャード・ファインマン(Richard Feynman)によって初めて提案された。
その後、20世紀の終わりごろ、ヒトゲノムプロジェクトの結果、DNA分子に基づく貯蔵ソリューションへの関心が高まり、シーケンシングや組立法が大幅に進歩した。
DNAストレージは、確立された磁気および光ストレージソリューションに対して大きな利点がある。
磁気ソリューションとは対照的に、DNAストレージはデータの整合性を維持するために電気的供給を必要としないため、密度と耐久性の両方において他のストレージソリューションよりも優れている。
DNA合成とシークエンシングのコスト低下の傾向を考えると、今後10~15年以内にDNA保存が高度に競争力のあるアーカイビング技術となり、後に主要な技術になる可能性が認識されている。
とはいえ、現在のDNAベースのストレージシステムの実装は非常に限られており、合成とシークエンシングを特徴付けるエラーのユニークなパターンに完全に最適化されていない。
本研究では、DNAベースのストレージシステムを実装するための堅牢で効率的でスケーラブルなソリューションを提案する。
本手法では,合成およびシークエンシングプロセスによって生成されたコピーの完全クラスタに基づいて,文字列を再構成するディープニューラルネットワーク(DNN)をデプロイする。
この過程で発生するエラーのパターンに対処するために、テーラーメイドのエラー修正コード(ECC)が使用される。
再構成手法は不完全なクラスタに適応するため,高速でスケーラブルな擬似クラスタリングを用いることで,ノイズの多いDNAコピークラスタリングプロセスの時間的ボトルネックを克服する。
我々のアーキテクチャは畳み込みブロックと変圧器ブロックを組み合わせ、実際のデータ統計の後にモデル化された合成データを用いて訓練される。
関連論文リスト
- BiDense: Binarization for Dense Prediction [62.70804353158387]
BiDenseは、効率よく正確な密度予測タスクのために設計された一般化されたバイナリニューラルネットワーク(BNN)である。
BiDenseは2つの重要なテクニックを取り入れている: 分散適応バイナリー (DAB) とチャネル適応完全精度バイパス (CFB) である。
論文 参考訳(メタデータ) (2024-11-15T16:46:04Z) - SemAI: Semantic Artificial Intelligence-enhanced DNA storage for Internet-of-Things [9.858497777817522]
本稿では,Semantic Artificial Intelligence-enhanced DNA Storage(SemAI-DNA)パラダイムを紹介する。
数値的な結果から,SemAI-DNAの有効性が示され,従来の深層学習アプローチよりも2.61dBピーク信号-雑音比(PSNR)が向上し,構造類似度指数(SSIM)が0.13改善した。
論文 参考訳(メタデータ) (2024-09-18T12:21:58Z) - Implicit Neural Multiple Description for DNA-based data storage [6.423239719448169]
DNAは、ストレージ密度と長期的な安定性のために、データストレージソリューションとして大きな可能性を秘めている。
しかし、この新素材の開発には、特に貯蔵や生物学的操作によるエラーに対処する上で、独自の課題が伴う。
我々は,DNAデータ記憶にニューラルネットワークを利用する,新しい圧縮手法と最先端の多重記述符号化(MDC)技術を開発した。
論文 参考訳(メタデータ) (2023-09-13T13:42:52Z) - Low-Energy Convolutional Neural Networks (CNNs) using Hadamard Method [0.0]
畳み込みニューラルネットワーク(CNN)は、オブジェクト認識と検出の潜在的アプローチである。
畳み込み操作の代替として,アダマール変換に基づく新しいアプローチを示す。
この方法は、入力画像サイズよりもカーネルサイズが小さい場合、他のコンピュータビジョンタスクに役立ちます。
論文 参考訳(メタデータ) (2022-09-06T21:36:57Z) - Dynamic Network-Assisted D2D-Aided Coded Distributed Learning [59.29409589861241]
本稿では,デバイス間のロードバランシングのための新しいデバイス・ツー・デバイス(D2D)支援型符号化学習手法(D2D-CFL)を提案する。
最小処理時間を達成するための最適圧縮率を導出し、収束時間との接続を確立する。
提案手法は,ユーザが継続的にトレーニングデータを生成するリアルタイム協調アプリケーションに有用である。
論文 参考訳(メタデータ) (2021-11-26T18:44:59Z) - Distribution-sensitive Information Retention for Accurate Binary Neural
Network [49.971345958676196]
本稿では、前向きのアクティベーションと後向きの勾配の情報を保持するために、新しいDIR-Net(Distribution-sensitive Information Retention Network)を提案する。
我々のDIR-Netは、主流かつコンパクトなアーキテクチャの下で、SOTAバイナライゼーションアプローチよりも一貫して優れています。
我々は、実世界のリソース制限されたデバイス上でDIR-Netを行い、ストレージの11.1倍の節約と5.4倍のスピードアップを実現した。
論文 参考訳(メタデータ) (2021-09-25T10:59:39Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - A reconfigurable neural network ASIC for detector front-end data
compression at the HL-LHC [0.40690419770123604]
ニューラルネットワークのオートエンコーダモデルを放射線耐性ASICに実装して、損失のあるデータ圧縮を行うことができる。
これは、粒子物理学アプリケーション用に設計されたニューラルネットワークの耐放射線性オンディテクタASIC実装である。
論文 参考訳(メタデータ) (2021-05-04T18:06:23Z) - Efficient approximation of DNA hybridisation using deep learning [0.0]
本研究は,DNAハイブリダイゼーションの予測に応用された機械学習手法の総合的研究である。
機械学習アルゴリズムの広い範囲の使用を可能にする2.5百万以上のデータポイントの合成ハイブリッド化データセットを紹介します。
論文 参考訳(メタデータ) (2021-02-19T19:23:49Z) - Neural Network Compression for Noisy Storage Devices [71.4102472611862]
従来、モデル圧縮と物理ストレージは分離される。
このアプローチでは、ストレージは圧縮されたモデルの各ビットを等しく扱い、各ビットに同じ量のリソースを割り当てるように強制される。
i) 各メモリセルの容量を最大化するためにアナログメモリを使用し, (ii) モデル圧縮と物理ストレージを共同で最適化し, メモリの有用性を最大化する。
論文 参考訳(メタデータ) (2021-02-15T18:19:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。