論文の概要: Learning Structurally Stabilized Representations for Multi-modal Lossless DNA Storage
- arxiv url: http://arxiv.org/abs/2408.00779v1
- Date: Wed, 17 Jul 2024 06:31:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-19 05:28:21.257044
- Title: Learning Structurally Stabilized Representations for Multi-modal Lossless DNA Storage
- Title(参考訳): マルチモーダルロスレスDNAストレージのための構造安定化表現の学習
- Authors: Ben Cao, Tiantian He, Xue Li, Bin Wang, Xiaohu Wu, Qiang Zhang, Yew-Soon Ong,
- Abstract要約: Reed-Solomon coded single-stranded representation learningはDNAストレージの表現を学習するための新しいエンドツーエンドモデルである。
既存の学習手法とは対照的に、RSRLは誤り訂正と構造生物学の両方に着想を得ている。
その結果、RSRLは、情報密度と耐久性がはるかに高いがエラー率がはるかに低い様々な種類のデータを格納できることを示した。
- 参考スコア(独自算出の注目度): 32.00500955709341
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we present Reed-Solomon coded single-stranded representation learning (RSRL), a novel end-to-end model for learning representations for multi-modal lossless DNA storage. In contrast to existing learning-based methods, the proposed RSRL is inspired by both error-correction codec and structural biology. Specifically, RSRL first learns the representations for the subsequent storage from the binary data transformed by the Reed-Solomon codec. Then, the representations are masked by an RS-code-informed mask to focus on correcting the burst errors occurring in the learning process. With the decoded representations with error corrections, a novel biologically stabilized loss is formulated to regularize the data representations to possess stable single-stranded structures. By incorporating these novel strategies, the proposed RSRL can learn highly durable, dense, and lossless representations for the subsequent storage tasks into DNA sequences. The proposed RSRL has been compared with a number of strong baselines in real-world tasks of multi-modal data storage. The experimental results obtained demonstrate that RSRL can store diverse types of data with much higher information density and durability but much lower error rates.
- Abstract(参考訳): 本稿では,多モードロスレスDNAストレージのための表現を学習するための新しいエンド・ツー・エンドモデルである,リード・ソロモン符号化単本鎖表現学習(RSRL)を提案する。
既存の学習手法とは対照的に,提案手法は誤り訂正コーデックと構造生物学の両方に着想を得ている。
具体的には、RSRLはReed-Solomonコーデックによって変換されたバイナリデータから、後続のストレージの表現を学習する。
そして、RSコードインフォームドマスクによって表現をマスクし、学習プロセスで発生したバーストエラーの修正に集中する。
誤り訂正付き復号化表現を用いて、データ表現を規則化して安定な単本鎖構造を持つように、生物学的に安定な損失を定式化する。
これらの新しい戦略を取り入れることで、提案されたRSRLは、その後の保存タスクに対する高い耐久性、密度、損失のない表現をDNA配列に学習することができる。
提案したRSRLは,マルチモーダルデータストレージの実際のタスクにおいて,いくつかの強力なベースラインと比較されている。
その結果、RSRLは、情報密度と耐久性がはるかに高いがエラー率がはるかに低い様々な種類のデータを格納できることを示した。
関連論文リスト
- Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - Compressing Deep Reinforcement Learning Networks with a Dynamic
Structured Pruning Method for Autonomous Driving [63.155562267383864]
深部強化学習(DRL)は複雑な自律運転シナリオにおいて顕著な成功を収めている。
DRLモデルは、必然的に高いメモリ消費と計算をもたらし、リソース限定の自動運転デバイスへの広範な展開を妨げる。
そこで本研究では,DRLモデルの非重要なニューロンを段階的に除去する,新しい動的構造化プルーニング手法を提案する。
論文 参考訳(メタデータ) (2024-02-07T09:00:30Z) - Implicit Neural Multiple Description for DNA-based data storage [6.423239719448169]
DNAは、ストレージ密度と長期的な安定性のために、データストレージソリューションとして大きな可能性を秘めている。
しかし、この新素材の開発には、特に貯蔵や生物学的操作によるエラーに対処する上で、独自の課題が伴う。
我々は,DNAデータ記憶にニューラルネットワークを利用する,新しい圧縮手法と最先端の多重記述符号化(MDC)技術を開発した。
論文 参考訳(メタデータ) (2023-09-13T13:42:52Z) - RPLHR-CT Dataset and Transformer Baseline for Volumetric
Super-Resolution from CT Scans [12.066026343488453]
粗い解像度は、医師またはコンピュータ支援診断アルゴリズムによる医学的診断の困難を引き起こす可能性がある。
深層学習に基づく容積超解法(SR法)は、解法を改善するための実現可能な方法である。
本稿では,RPLHR-CTをボリュームSRのベンチマークとして構築した。
また,CNNの固有の欠点を考慮し,アテンション機構に基づくトランスフォーマーボリューム超解像ネットワーク(TVSRN)を提案する。
論文 参考訳(メタデータ) (2022-06-13T15:35:59Z) - Single-Read Reconstruction for DNA Data Storage Using Transformers [0.0]
エンコーダ・デコーダ・トランスフォーマアーキテクチャを用いたDNAベースのデータストレージのためのシングルリード再構成手法を提案する。
本モデルでは,DNA鎖の1つの読み取りから元のデータを再構成する際の誤り率を低くする。
これは、DNAベースのストレージにおけるシングルリード再構築にディープラーニングモデルを使用した最初のデモンストレーションである。
論文 参考訳(メタデータ) (2021-09-12T10:01:59Z) - DML-GANR: Deep Metric Learning With Generative Adversarial Network
Regularization for High Spatial Resolution Remote Sensing Image Retrieval [9.423185775609426]
我々は,HSR-RSI検索のためのDML-GANR(Generative Adversarial Network regularization)を用いたディープメトリック学習手法を開発した。
3つのデータセットの実験結果から,HSR-RSI検索における最先端技術よりもDML-GANRの方が優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-07T02:26:03Z) - Understanding Self-supervised Learning with Dual Deep Networks [74.92916579635336]
本稿では,2組の深層ReLUネットワークを用いたコントラスト型自己教師学習(SSL)手法を理解するための新しい枠組みを提案する。
種々の損失関数を持つSimCLRの各SGD更新において、各層の重みは共分散演算子によって更新されることを示す。
共分散演算子の役割と、そのようなプロセスでどのような特徴が学習されるかをさらに研究するために、我々は、階層的潜在木モデル(HLTM)を用いて、データ生成および増大過程をモデル化する。
論文 参考訳(メタデータ) (2020-10-01T17:51:49Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Modal Regression based Structured Low-rank Matrix Recovery for
Multi-view Learning [70.57193072829288]
近年、低ランクなマルチビューサブスペース学習は、クロスビューの分類において大きな可能性を示している。
既存のLMvSLベースの手法では、ビューの区別と差別を同時に扱うことができない。
本稿では,視差を効果的に除去し,識別性を向上する独自の方法であるStructured Low-rank Matrix Recovery (SLMR)を提案する。
論文 参考訳(メタデータ) (2020-03-22T03:57:38Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。