論文の概要: DoDo-Code: an Efficient Levenshtein Distance Embedding-based Code for 4-ary IDS Channel
- arxiv url: http://arxiv.org/abs/2312.12717v2
- Date: Fri, 26 Sep 2025 14:01:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:53.797083
- Title: DoDo-Code: an Efficient Levenshtein Distance Embedding-based Code for 4-ary IDS Channel
- Title(参考訳): DoDo-Code: 4-ary IDSチャネルのための効率的なLevenshtein距離埋め込みコード
- Authors: Alan J. X. Guo, Sihan Sun, Xiang Wei, Mengyi Wei, Xin Chen,
- Abstract要約: 深部レベンシュテイン距離埋め込みによる高速単一IDS訂正符号を設計するための新しい手法を提案する。
深層学習モデルを用いて、シークエンスを埋め込みベクトルに投影し、元のシークエンス間のレヴェンシュテイン距離を保存する。
この埋め込み空間は、コードワード検索とセグメント修正のためのアルゴリズムを開発する複雑なLevenshteinドメインのプロキシとして機能する。
- 参考スコア(独自算出の注目度): 8.092763074723594
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the emergence of new storage and communication methods, the insertion, deletion, and substitution (IDS) channel has attracted considerable attention. However, many topics on the IDS channel and the associated Levenshtein distance remain open, making the invention of a novel IDS-correcting code a hard task. Furthermore, current studies on single-IDS-correcting code misalign with the requirements of applications which necessitates the correcting of multiple errors. Compromise solutions have involved shortening codewords to reduce the chance of multiple errors. However, the code rates of existing codes are poor at short lengths, diminishing the overall storage density. In this study, a novel method is introduced for designing high-code-rate single-IDS-correcting codewords through deep Levenshtein distance embedding. A deep learning model is utilized to project the sequences into embedding vectors that preserve the Levenshtein distances between the original sequences. This embedding space serves as a proxy for the complex Levenshtein domain, within which algorithms for codeword search and segment correcting is developed. While the concept underpinning this approach is straightforward, it bypasses the mathematical challenges typically encountered in code design. The proposed method results in a code rate that outperforms existing combinatorial solutions, particularly for designing short-length codewords.
- Abstract(参考訳): 新たな記憶・通信手法の出現に伴い, 挿入, 削除, 置換 (IDS) チャネルが注目されている。
しかし、IDSチャネルと関連するLevenshtein距離に関する多くのトピックが未解決のままであり、新しいIDS訂正コードの発明が難しい課題となっている。
さらに、単一IDS訂正コードに関する最近の研究は、複数のエラーの修正を必要とするアプリケーションの要件に反する。
コンパイルソリューションは、複数エラーの確率を減らすために、コードワードを短縮する。
しかし、既存のコードのコードレートは短い時間で劣っているため、全体のストレージ密度は低下する。
本研究では, 深部レベンシュテイン距離埋め込みによる高速単一IDS訂正符号を設計するための新しい手法を提案する。
深層学習モデルを用いて、シークエンスを埋め込みベクトルに投影し、元のシークエンス間のレヴェンシュテイン距離を保存する。
この埋め込み空間は複雑なLevenshteinドメインのプロキシとして機能し、コードワード検索とセグメント修正のためのアルゴリズムが開発されている。
このアプローチの根底にある概念は単純ですが、コード設計で一般的に遭遇する数学的課題を回避します。
提案手法は,特に短長のコードワードの設計において,既存の組合せ解よりも優れるコードレートを導出する。
関連論文リスト
- Beyond Natural Language Perplexity: Detecting Dead Code Poisoning in Code Generation Datasets [8.977790462534152]
本稿では,コードの構造に合わせた新しいラインレベルの検出とクリーン化手法であるDePAを提案する。
DePAは既存の方法よりも優れており、検出F1スコアが0.14-0.19向上し、有毒セグメントの局在精度が44-65%向上した。
論文 参考訳(メタデータ) (2025-02-27T16:30:00Z) - Efficient Approximate Degenerate Ordered Statistics Decoding for Quantum Codes via Reliable Subset Reduction [5.625796693054094]
我々は、近似縮退復号法の概念を導入し、順序付き統計復号法(OSD)と統合する。
コードキャパシティノイズモデルにおけるOSD効率を大幅に向上するADOSDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-30T17:45:08Z) - SECRET: Towards Scalable and Efficient Code Retrieval via Segmented Deep Hashing [83.35231185111464]
ディープラーニングは、検索パラダイムを語彙ベースのマッチングから、ソースコードとクエリをベクトル表現にエンコードした。
従来の研究では、クエリやコードスニペットのハッシュコードを生成し、ハミング距離を使ってコード候補を高速にリコールするディープハッシュベースの手法が提案されている。
提案手法は,既存の深層ハッシュ法によって計算された長いハッシュコードを,反復的学習戦略により複数の短いハッシュコードセグメントに変換する手法である。
論文 参考訳(メタデータ) (2024-12-16T12:51:35Z) - Gumbel-Softmax Discretization Constraint, Differentiable IDS Channel, and an IDS-Correcting Code for DNA Storage [1.4272256806865107]
本稿では,複雑なIDSチャネルに対して,IDS訂正符号を効率よく生成することを目的とした自動エンコーダ方式 THEA-codeを提案する。
オートエンコーダの特徴を識別するために,Gumbel-Softmax離散化制約を提案する。
擬似微分可能なIDSチャネルは、IDS操作の微分可能な代替手段として開発されている。
論文 参考訳(メタデータ) (2024-07-10T06:52:56Z) - Factor Graph Optimization of Error-Correcting Codes for Belief Propagation Decoding [62.25533750469467]
低密度パリティ・チェック (LDPC) コードは、他の種類のコードに対していくつかの利点がある。
提案手法は,既存の人気符号の復号性能を桁違いに向上させる。
論文 参考訳(メタデータ) (2024-06-09T12:08:56Z) - Learning Linear Block Error Correction Codes [62.25533750469467]
本稿では,バイナリ線形ブロック符号の統一エンコーダデコーダトレーニングを初めて提案する。
また,コード勾配の効率的なバックプロパゲーションのために,自己注意マスキングを行うトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2024-05-07T06:47:12Z) - StepCoder: Improve Code Generation with Reinforcement Learning from
Compiler Feedback [58.20547418182074]
2つの主要コンポーネントからなるコード生成の新しいフレームワークであるStepCoderを紹介します。
CCCSは、長いシーケンスのコード生成タスクをCurriculum of Code Completion Subtaskに分割することで、探索課題に対処する。
FGOは、未実行のコードセグメントをマスクすることでのみモデルを最適化し、Fine-Grained Optimizationを提供する。
提案手法は,出力空間を探索し,対応するベンチマークにおいて最先端の手法より優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-02-02T13:14:31Z) - Sparse-Inductive Generative Adversarial Hashing for Nearest Neighbor
Search [8.020530603813416]
本稿では,Sparsity-induced Generative Adversarial Hashing (SiGAH)と呼ばれる新しい教師なしハッシュ法を提案する。
SiGAHは、大規模な高次元特徴をバイナリコードにエンコードする。
Tiny100K、GIST1M、Deep1M、MNISTの4つのベンチマーク実験の結果、提案されたSiGAHは最先端のアプローチよりも優れた性能を示している。
論文 参考訳(メタデータ) (2023-06-12T08:07:23Z) - LSAP: Rethinking Inversion Fidelity, Perception and Editability in GAN
Latent Space [42.56147568941768]
本稿では,正規化スタイル空間と$mathcalSN$ Cosine Distanceを導入し,逆法の不整合を計測する。
提案するSNCDは,エンコーダ方式と最適化方式の両方で最適化可能であり,一様解を実現することができる。
論文 参考訳(メタデータ) (2022-09-26T14:55:21Z) - Denoising Diffusion Error Correction Codes [92.10654749898927]
近年、ニューラルデコーダは古典的デコーダ技術に対する優位性を実証している。
最近の最先端のニューラルデコーダは複雑で、多くのレガシデコーダの重要な反復的スキームが欠如している。
本稿では,任意のブロック長の線形符号のソフトデコードにデノナイズ拡散モデルを適用することを提案する。
論文 参考訳(メタデータ) (2022-09-16T11:00:50Z) - Deep DNA Storage: Scalable and Robust DNA Storage via Coding Theory and
Deep Learning [49.3231734733112]
シミュレーションデータに基づいてトレーニングされたDeep Neural Networks(DNN)、Product(TP)ベースのエラー修正コード(ECC)、安全マージンを1つのコヒーレントパイプラインに組み合わせたモジュラーで総合的なアプローチを示す。
我々の研究は, 最大で x3200 の速度向上, 40%の精度向上により, 現在の指導的ソリューションの改善を実現し, 高雑音下では1ベースあたり1.6ビットのコードレートを提供する。
論文 参考訳(メタデータ) (2021-08-31T18:21:20Z) - KO codes: Inventing Nonlinear Encoding and Decoding for Reliable
Wireless Communication via Deep-learning [76.5589486928387]
ランドマークコードは、Reed-Muller、BCH、Convolution、Turbo、LDPC、Polarといった信頼性の高い物理層通信を支える。
本論文では、ディープラーニング駆動型(エンコーダ、デコーダ)ペアの計算効率の良いファミリーであるKO符号を構築する。
KO符号は最先端のリード・ミュラー符号と極符号を破り、低複雑さの逐次復号法で復号された。
論文 参考訳(メタデータ) (2021-08-29T21:08:30Z) - ADMM-based Decoder for Binary Linear Codes Aided by Deep Learning [40.25456611849273]
この研究は、二進線形符号に対するディープニューラルネットワーク支援復号アルゴリズムを示す。
ディープ・アンフォールディングの概念に基づいて,乗算器の交互方向のデコーダ(ADMM)を展開させてデコードネットワークを設計する。
以上の結果から,DL支援デコーダはADMM課金デコーダよりも優れていた。
論文 参考訳(メタデータ) (2020-02-14T03:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。