論文の概要: DoDo-Code: a Deep Levenshtein Distance Embedding-based Code for IDS
Channel and DNA Storage
- arxiv url: http://arxiv.org/abs/2312.12717v1
- Date: Wed, 20 Dec 2023 02:22:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 17:15:53.074910
- Title: DoDo-Code: a Deep Levenshtein Distance Embedding-based Code for IDS
Channel and DNA Storage
- Title(参考訳): DoDo-Code: IDSチャネルとDNAストレージのためのディープレベンシュテイン距離埋め込みベースのコード
- Authors: Alan J.X. Guo, Sihan Sun, Xiang Wei, Mengyi Wei, Xin Chen
- Abstract要約: DoDo-Codeは、Levenshtein距離のディープ埋め込み、ディープ埋め込みベースのコードワード検索、ディープ埋め込みベースのセグメント修正を含むIDS訂正コードである。
DoDo-Codeは、可算深層学習法を用いて設計された最初のIDS訂正コードである。
- 参考スコア(独自算出の注目度): 5.974644083956271
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, DNA storage has emerged as a promising data storage solution,
offering significant advantages in storage density, maintenance cost
efficiency, and parallel replication capability. Mathematically, the DNA
storage pipeline can be viewed as an insertion, deletion, and substitution
(IDS) channel. Because of the mathematical terra incognita of the Levenshtein
distance, designing an IDS-correcting code is still a challenge. In this paper,
we propose an innovative approach that utilizes deep Levenshtein distance
embedding to bypass these mathematical challenges. By representing the
Levenshtein distance between two sequences as a conventional distance between
their corresponding embedding vectors, the inherent structural property of
Levenshtein distance is revealed in the friendly embedding space. Leveraging
this embedding space, we introduce the DoDo-Code, an IDS-correcting code that
incorporates deep embedding of Levenshtein distance, deep embedding-based
codeword search, and deep embedding-based segment correcting. To address the
requirements of DNA storage, we also present a preliminary algorithm for long
sequence decoding. As far as we know, the DoDo-Code is the first IDS-correcting
code designed using plausible deep learning methodologies, potentially paving
the way for a new direction in error-correcting code research. It is also the
first IDS code that exhibits characteristics of being `optimal' in terms of
redundancy, significantly outperforming the mainstream IDS-correcting codes of
the Varshamov-Tenengolts code family in code rate.
- Abstract(参考訳): 近年、DNAストレージは有望なデータストレージソリューションとして登場し、ストレージ密度、メンテナンスコスト効率、並列レプリケーション能力に大きな利点をもたらしている。
数学的には、DNA貯蔵パイプラインは挿入、削除、置換(IDS)チャネルと見なすことができる。
レヴェンシュテイン距離の数学的テラ認識のため、IDS訂正コードの設計は依然として課題である。
本稿では,これらの数学的課題を回避すべく,深部レベンシュテイン距離埋め込みを用いた革新的な手法を提案する。
2つの配列間のレヴェンシュテイン距離を、対応する埋め込みベクトル間の従来の距離として表現することにより、親密な埋め込み空間において、レヴェンシュテイン距離の性質を明らかにする。
この埋め込み空間を活用することで、レベンシュテイン距離の深い埋め込み、深埋め込みベースのコードワード検索、深埋め込みに基づくセグメント修正を組み込んだids訂正コードであるdodo-codeを導入する。
また,DNA保存の要件に対処するため,長周期デコードのための予備アルゴリズムを提案する。
私たちが知る限り、DoDo-Codeは、プラウシブルなディープラーニング方法論を使って設計された最初のIDS訂正コードであり、エラー修正コード研究における新たな方向性の道を開く可能性がある。
また、冗長性の観点から「最適」であることの特徴を示す最初のidsコードであり、コードレートでvarshamov-tenengoltsコードファミリーの主流ids訂正符号を著しく上回っている。
関連論文リスト
- Gumbel-Softmax Discretization Constraint, Differentiable IDS Channel, and an IDS-Correcting Code for DNA Storage [1.4272256806865107]
本稿では,複雑なIDSチャネルに対して,IDS訂正符号を効率よく生成することを目的とした自動エンコーダ方式 THEA-codeを提案する。
オートエンコーダの特徴を識別するために,Gumbel-Softmax離散化制約を提案する。
擬似微分可能なIDSチャネルは、IDS操作の微分可能な代替手段として開発されている。
論文 参考訳(メタデータ) (2024-07-10T06:52:56Z) - Factor Graph Optimization of Error-Correcting Codes for Belief Propagation Decoding [62.25533750469467]
低密度パリティ・チェック (LDPC) コードは、他の種類のコードに対していくつかの利点がある。
提案手法は,既存の人気符号の復号性能を桁違いに向上させる。
論文 参考訳(メタデータ) (2024-06-09T12:08:56Z) - Learning Linear Block Error Correction Codes [62.25533750469467]
本稿では,バイナリ線形ブロック符号の統一エンコーダデコーダトレーニングを初めて提案する。
また,コード勾配の効率的なバックプロパゲーションのために,自己注意マスキングを行うトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2024-05-07T06:47:12Z) - StepCoder: Improve Code Generation with Reinforcement Learning from
Compiler Feedback [58.20547418182074]
2つの主要コンポーネントからなるコード生成の新しいフレームワークであるStepCoderを紹介します。
CCCSは、長いシーケンスのコード生成タスクをCurriculum of Code Completion Subtaskに分割することで、探索課題に対処する。
FGOは、未実行のコードセグメントをマスクすることでのみモデルを最適化し、Fine-Grained Optimizationを提供する。
提案手法は,出力空間を探索し,対応するベンチマークにおいて最先端の手法より優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-02-02T13:14:31Z) - Sparse-Inductive Generative Adversarial Hashing for Nearest Neighbor
Search [8.020530603813416]
本稿では,Sparsity-induced Generative Adversarial Hashing (SiGAH)と呼ばれる新しい教師なしハッシュ法を提案する。
SiGAHは、大規模な高次元特徴をバイナリコードにエンコードする。
Tiny100K、GIST1M、Deep1M、MNISTの4つのベンチマーク実験の結果、提案されたSiGAHは最先端のアプローチよりも優れた性能を示している。
論文 参考訳(メタデータ) (2023-06-12T08:07:23Z) - LSAP: Rethinking Inversion Fidelity, Perception and Editability in GAN
Latent Space [42.56147568941768]
本稿では,正規化スタイル空間と$mathcalSN$ Cosine Distanceを導入し,逆法の不整合を計測する。
提案するSNCDは,エンコーダ方式と最適化方式の両方で最適化可能であり,一様解を実現することができる。
論文 参考訳(メタデータ) (2022-09-26T14:55:21Z) - Denoising Diffusion Error Correction Codes [92.10654749898927]
近年、ニューラルデコーダは古典的デコーダ技術に対する優位性を実証している。
最近の最先端のニューラルデコーダは複雑で、多くのレガシデコーダの重要な反復的スキームが欠如している。
本稿では,任意のブロック長の線形符号のソフトデコードにデノナイズ拡散モデルを適用することを提案する。
論文 参考訳(メタデータ) (2022-09-16T11:00:50Z) - Deep DNA Storage: Scalable and Robust DNA Storage via Coding Theory and
Deep Learning [49.3231734733112]
シミュレーションデータに基づいてトレーニングされたDeep Neural Networks(DNN)、Product(TP)ベースのエラー修正コード(ECC)、安全マージンを1つのコヒーレントパイプラインに組み合わせたモジュラーで総合的なアプローチを示す。
我々の研究は, 最大で x3200 の速度向上, 40%の精度向上により, 現在の指導的ソリューションの改善を実現し, 高雑音下では1ベースあたり1.6ビットのコードレートを提供する。
論文 参考訳(メタデータ) (2021-08-31T18:21:20Z) - KO codes: Inventing Nonlinear Encoding and Decoding for Reliable
Wireless Communication via Deep-learning [76.5589486928387]
ランドマークコードは、Reed-Muller、BCH、Convolution、Turbo、LDPC、Polarといった信頼性の高い物理層通信を支える。
本論文では、ディープラーニング駆動型(エンコーダ、デコーダ)ペアの計算効率の良いファミリーであるKO符号を構築する。
KO符号は最先端のリード・ミュラー符号と極符号を破り、低複雑さの逐次復号法で復号された。
論文 参考訳(メタデータ) (2021-08-29T21:08:30Z) - ADMM-based Decoder for Binary Linear Codes Aided by Deep Learning [40.25456611849273]
この研究は、二進線形符号に対するディープニューラルネットワーク支援復号アルゴリズムを示す。
ディープ・アンフォールディングの概念に基づいて,乗算器の交互方向のデコーダ(ADMM)を展開させてデコードネットワークを設計する。
以上の結果から,DL支援デコーダはADMM課金デコーダよりも優れていた。
論文 参考訳(メタデータ) (2020-02-14T03:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。