論文の概要: DoDo-Code: a Deep Levenshtein Distance Embedding-based Code for IDS
Channel and DNA Storage
- arxiv url: http://arxiv.org/abs/2312.12717v1
- Date: Wed, 20 Dec 2023 02:22:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-12-21 17:15:53.074910
- Title: DoDo-Code: a Deep Levenshtein Distance Embedding-based Code for IDS
Channel and DNA Storage
- Title(参考訳): DoDo-Code: IDSチャネルとDNAストレージのためのディープレベンシュテイン距離埋め込みベースのコード
- Authors: Alan J.X. Guo, Sihan Sun, Xiang Wei, Mengyi Wei, Xin Chen
- Abstract要約: DoDo-Codeは、Levenshtein距離のディープ埋め込み、ディープ埋め込みベースのコードワード検索、ディープ埋め込みベースのセグメント修正を含むIDS訂正コードである。
DoDo-Codeは、可算深層学習法を用いて設計された最初のIDS訂正コードである。
- 参考スコア(独自算出の注目度): 5.974644083956271
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, DNA storage has emerged as a promising data storage solution,
offering significant advantages in storage density, maintenance cost
efficiency, and parallel replication capability. Mathematically, the DNA
storage pipeline can be viewed as an insertion, deletion, and substitution
(IDS) channel. Because of the mathematical terra incognita of the Levenshtein
distance, designing an IDS-correcting code is still a challenge. In this paper,
we propose an innovative approach that utilizes deep Levenshtein distance
embedding to bypass these mathematical challenges. By representing the
Levenshtein distance between two sequences as a conventional distance between
their corresponding embedding vectors, the inherent structural property of
Levenshtein distance is revealed in the friendly embedding space. Leveraging
this embedding space, we introduce the DoDo-Code, an IDS-correcting code that
incorporates deep embedding of Levenshtein distance, deep embedding-based
codeword search, and deep embedding-based segment correcting. To address the
requirements of DNA storage, we also present a preliminary algorithm for long
sequence decoding. As far as we know, the DoDo-Code is the first IDS-correcting
code designed using plausible deep learning methodologies, potentially paving
the way for a new direction in error-correcting code research. It is also the
first IDS code that exhibits characteristics of being `optimal' in terms of
redundancy, significantly outperforming the mainstream IDS-correcting codes of
the Varshamov-Tenengolts code family in code rate.
- Abstract(参考訳): 近年、DNAストレージは有望なデータストレージソリューションとして登場し、ストレージ密度、メンテナンスコスト効率、並列レプリケーション能力に大きな利点をもたらしている。
数学的には、DNA貯蔵パイプラインは挿入、削除、置換(IDS)チャネルと見なすことができる。
レヴェンシュテイン距離の数学的テラ認識のため、IDS訂正コードの設計は依然として課題である。
本稿では,これらの数学的課題を回避すべく,深部レベンシュテイン距離埋め込みを用いた革新的な手法を提案する。
2つの配列間のレヴェンシュテイン距離を、対応する埋め込みベクトル間の従来の距離として表現することにより、親密な埋め込み空間において、レヴェンシュテイン距離の性質を明らかにする。
この埋め込み空間を活用することで、レベンシュテイン距離の深い埋め込み、深埋め込みベースのコードワード検索、深埋め込みに基づくセグメント修正を組み込んだids訂正コードであるdodo-codeを導入する。
また,DNA保存の要件に対処するため,長周期デコードのための予備アルゴリズムを提案する。
私たちが知る限り、DoDo-Codeは、プラウシブルなディープラーニング方法論を使って設計された最初のIDS訂正コードであり、エラー修正コード研究における新たな方向性の道を開く可能性がある。
また、冗長性の観点から「最適」であることの特徴を示す最初のidsコードであり、コードレートでvarshamov-tenengoltsコードファミリーの主流ids訂正符号を著しく上回っている。
関連論文リスト
- Tradeoffs on the volume of fault-tolerant circuits [8.594140167290096]
誤り訂正符号は欠陥のある回路部品を克服し、堅牢な計算を可能にする。
適切なコードを選択することは、いくつかの要件のバランスを取る必要があるため、簡単ではない。
コードファミリは、エンコードされたCNOTゲートを実行するための、一定レート、距離の増大、および短距離ガジェットを同時に持つことはできない。
論文 参考訳(メタデータ) (2025-10-03T14:39:31Z) - Rectified Sparse Attention [61.7702154360081]
効率的なロングシーケンス生成は、大規模言語モデルにとって重要な課題である。
本稿では,ブロックスパースアテンションと周期的な密度補正を組み合わせた簡易かつ効果的な方法であるRectified Sparse Attention (ReSA)を提案する。
数学推論、言語モデリング、検索タスクにわたる実験は、ReSAがほぼ無作為な生成品質を達成することを示す。
論文 参考訳(メタデータ) (2025-06-04T16:01:48Z) - Fast correlated decoding of transversal logical algorithms [67.01652927671279]
大規模計算には量子エラー補正(QEC)が必要であるが、かなりのリソースオーバーヘッドが発生する。
近年の進歩により、論理ゲートからなるアルゴリズムにおいて論理キュービットを共同で復号化することにより、症候群抽出ラウンドの数を削減できることが示されている。
ここでは、回路を介して伝播する関連する論理演算子製品を直接復号することで、回路の復号化の問題を修正する。
論文 参考訳(メタデータ) (2025-05-19T18:00:00Z) - Efficient Transformer-based Decoder for Varshamov-Tenengolts Codes [1.53119329713143]
主に単一エラー訂正のために設計されたVarshamov-Tenengolts (VT) コードは、研究の中心として浮上している。
既存の復号法では1つの誤りを訂正する精度が高いが、複数のIDSエラーを修正できない場合が多い。
本研究では,変換器をベースとしたVTデコーダを導入することにより,VT符号が複数のエラーに対処する能力を維持していることを示す。
論文 参考訳(メタデータ) (2025-02-28T13:59:14Z) - Beyond Natural Language Perplexity: Detecting Dead Code Poisoning in Code Generation Datasets [8.977790462534152]
本稿では,コードの構造に合わせた新しいラインレベルの検出とクリーン化手法であるDePAを提案する。
DePAは既存の方法よりも優れており、検出F1スコアが0.14-0.19向上し、有毒セグメントの局在精度が44-65%向上した。
論文 参考訳(メタデータ) (2025-02-27T16:30:00Z) - Efficient Approximate Degenerate Ordered Statistics Decoding for Quantum Codes via Reliable Subset Reduction [5.625796693054094]
我々は、近似縮退復号法の概念を導入し、順序付き統計復号法(OSD)と統合する。
コードキャパシティノイズモデルにおけるOSD効率を大幅に向上するADOSDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-30T17:45:08Z) - SECRET: Towards Scalable and Efficient Code Retrieval via Segmented Deep Hashing [83.35231185111464]
ディープラーニングは、検索パラダイムを語彙ベースのマッチングから、ソースコードとクエリをベクトル表現にエンコードした。
従来の研究では、クエリやコードスニペットのハッシュコードを生成し、ハミング距離を使ってコード候補を高速にリコールするディープハッシュベースの手法が提案されている。
提案手法は,既存の深層ハッシュ法によって計算された長いハッシュコードを,反復的学習戦略により複数の短いハッシュコードセグメントに変換する手法である。
論文 参考訳(メタデータ) (2024-12-16T12:51:35Z) - Limitations of the decoding-to-LPN reduction via code smoothing [59.90381090395222]
研究者は、ノイズ問題を伴う学習パリティのアルゴリズム的難しさを実証しようと試みている。
復号化問題とプリミティブ問題のパラメータの観点から,削減の効率を特徴付ける。
論文 参考訳(メタデータ) (2024-08-07T12:54:43Z) - Gumbel-Softmax Discretization Constraint, Differentiable IDS Channel, and an IDS-Correcting Code for DNA Storage [1.4272256806865107]
本稿では,複雑なIDSチャネルに対して,IDS訂正符号を効率よく生成することを目的とした自動エンコーダ方式 THEA-codeを提案する。
オートエンコーダの特徴を識別するために,Gumbel-Softmax離散化制約を提案する。
擬似微分可能なIDSチャネルは、IDS操作の微分可能な代替手段として開発されている。
論文 参考訳(メタデータ) (2024-07-10T06:52:56Z) - Factor Graph Optimization of Error-Correcting Codes for Belief Propagation Decoding [62.25533750469467]
低密度パリティ・チェック (LDPC) コードは、他の種類のコードに対していくつかの利点がある。
提案手法は,既存の人気符号の復号性能を桁違いに向上させる。
論文 参考訳(メタデータ) (2024-06-09T12:08:56Z) - Learning Linear Block Error Correction Codes [62.25533750469467]
本稿では,バイナリ線形ブロック符号の統一エンコーダデコーダトレーニングを初めて提案する。
また,コード勾配の効率的なバックプロパゲーションのために,自己注意マスキングを行うトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2024-05-07T06:47:12Z) - Error Correction in Dynamical Codes [0.0]
我々は、一連の測定で定義される量子エラー訂正符号の一般的な枠組みを問う。
本研究では,このプロトコルを用いてエラーシンドロームに関する情報を追跡し,動的コードの距離を決定するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-03-07T02:47:21Z) - StepCoder: Improve Code Generation with Reinforcement Learning from
Compiler Feedback [58.20547418182074]
2つの主要コンポーネントからなるコード生成の新しいフレームワークであるStepCoderを紹介します。
CCCSは、長いシーケンスのコード生成タスクをCurriculum of Code Completion Subtaskに分割することで、探索課題に対処する。
FGOは、未実行のコードセグメントをマスクすることでのみモデルを最適化し、Fine-Grained Optimizationを提供する。
提案手法は,出力空間を探索し,対応するベンチマークにおいて最先端の手法より優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-02-02T13:14:31Z) - Sparse-Inductive Generative Adversarial Hashing for Nearest Neighbor
Search [8.020530603813416]
本稿では,Sparsity-induced Generative Adversarial Hashing (SiGAH)と呼ばれる新しい教師なしハッシュ法を提案する。
SiGAHは、大規模な高次元特徴をバイナリコードにエンコードする。
Tiny100K、GIST1M、Deep1M、MNISTの4つのベンチマーク実験の結果、提案されたSiGAHは最先端のアプローチよりも優れた性能を示している。
論文 参考訳(メタデータ) (2023-06-12T08:07:23Z) - Deep Joint Source-Channel Coding with Iterative Source Error Correction [11.41076729592696]
深層学習に基づくジョイントソースチャネル符号(Deep J SCC)に対する反復的ソース誤り訂正(ISEC)復号法を提案する。
チャネルを通じて受信されたノイズワードに対して、Deep J SCCエンコーダとデコーダペアを使用して、コードを反復的に更新する。
提案手法は, チャネルノイズ特性がトレーニング時に使用するものと一致しない場合に, ベースラインよりも信頼性の高いソース再構成結果を生成する。
論文 参考訳(メタデータ) (2023-02-17T22:50:58Z) - LSAP: Rethinking Inversion Fidelity, Perception and Editability in GAN
Latent Space [42.56147568941768]
本稿では,正規化スタイル空間と$mathcalSN$ Cosine Distanceを導入し,逆法の不整合を計測する。
提案するSNCDは,エンコーダ方式と最適化方式の両方で最適化可能であり,一様解を実現することができる。
論文 参考訳(メタデータ) (2022-09-26T14:55:21Z) - Denoising Diffusion Error Correction Codes [92.10654749898927]
近年、ニューラルデコーダは古典的デコーダ技術に対する優位性を実証している。
最近の最先端のニューラルデコーダは複雑で、多くのレガシデコーダの重要な反復的スキームが欠如している。
本稿では,任意のブロック長の線形符号のソフトデコードにデノナイズ拡散モデルを適用することを提案する。
論文 参考訳(メタデータ) (2022-09-16T11:00:50Z) - Deep DNA Storage: Scalable and Robust DNA Storage via Coding Theory and
Deep Learning [49.3231734733112]
シミュレーションデータに基づいてトレーニングされたDeep Neural Networks(DNN)、Product(TP)ベースのエラー修正コード(ECC)、安全マージンを1つのコヒーレントパイプラインに組み合わせたモジュラーで総合的なアプローチを示す。
我々の研究は, 最大で x3200 の速度向上, 40%の精度向上により, 現在の指導的ソリューションの改善を実現し, 高雑音下では1ベースあたり1.6ビットのコードレートを提供する。
論文 参考訳(メタデータ) (2021-08-31T18:21:20Z) - KO codes: Inventing Nonlinear Encoding and Decoding for Reliable
Wireless Communication via Deep-learning [76.5589486928387]
ランドマークコードは、Reed-Muller、BCH、Convolution、Turbo、LDPC、Polarといった信頼性の高い物理層通信を支える。
本論文では、ディープラーニング駆動型(エンコーダ、デコーダ)ペアの計算効率の良いファミリーであるKO符号を構築する。
KO符号は最先端のリード・ミュラー符号と極符号を破り、低複雑さの逐次復号法で復号された。
論文 参考訳(メタデータ) (2021-08-29T21:08:30Z) - ADMM-based Decoder for Binary Linear Codes Aided by Deep Learning [40.25456611849273]
この研究は、二進線形符号に対するディープニューラルネットワーク支援復号アルゴリズムを示す。
ディープ・アンフォールディングの概念に基づいて,乗算器の交互方向のデコーダ(ADMM)を展開させてデコードネットワークを設計する。
以上の結果から,DL支援デコーダはADMM課金デコーダよりも優れていた。
論文 参考訳(メタデータ) (2020-02-14T03:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。