論文の概要: RELDEC: Reinforcement Learning-Based Decoding of Moderate Length LDPC
Codes
- arxiv url: http://arxiv.org/abs/2112.13934v2
- Date: Tue, 11 Jul 2023 15:17:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-12 19:26:18.837069
- Title: RELDEC: Reinforcement Learning-Based Decoding of Moderate Length LDPC
Codes
- Title(参考訳): RELDEC: 正規長LDPC符号の強化学習に基づく復号化
- Authors: Salman Habib, Allison Beemer, and Joerg Kliewer
- Abstract要約: RELDECは、中等長低密度パリティチェック(LDPC)符号のシーケンシャルデコードのための新しいアプローチである。
マルコフ決定過程(MDP)に基づく強化学習により最適化された復号法が得られる。
提案したRELDEC方式は,様々なLDPC符号に対して,標準的なフラッディングとランダムなシーケンシャルデコーディングを著しく上回っている。
- 参考スコア(独自算出の注目度): 4.588028371034406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work we propose RELDEC, a novel approach for sequential decoding of
moderate length low-density parity-check (LDPC) codes. The main idea behind
RELDEC is that an optimized decoding policy is subsequently obtained via
reinforcement learning based on a Markov decision process (MDP). In contrast to
our previous work, where an agent learns to schedule only a single check node
(CN) within a group (cluster) of CNs per iteration, in this work we train the
agent to schedule all CNs in a cluster, and all clusters in every iteration.
That is, in each learning step of RELDEC an agent learns to schedule CN
clusters sequentially depending on a reward associated with the outcome of
scheduling a particular cluster. We also modify the state space representation
of the MDP, enabling RELDEC to be suitable for larger block length LDPC codes
than those studied in our previous work. Furthermore, to address decoding under
varying channel conditions, we propose agile meta-RELDEC (AM-RELDEC) that
employs meta-reinforcement learning. The proposed RELDEC scheme significantly
outperforms standard flooding and random sequential decoding for a variety of
LDPC codes, including codes designed for 5G new radio.
- Abstract(参考訳): 本研究では,中等長低密度パリティチェック(LDPC)符号の逐次復号化手法であるRELDECを提案する。
RELDECの背景にある主要な考え方は、マルコフ決定プロセス(MDP)に基づいた強化学習によって最適化された復号法が得られたことである。
エージェントがひとつのグループ(クラスタ)内の1つのチェックノード(cn)だけをスケジュールすることを学ぶ以前の作業とは対照的に、この作業では、エージェントにクラスタ内のすべてのcnと、イテレーション毎にすべてのクラスタをスケジュールするようにトレーニングします。
すなわち、RELDECの各学習ステップにおいて、エージェントは特定のクラスタのスケジューリング結果に関連する報酬に応じて、CNクラスタを順次スケジュールすることを学ぶ。
また、MPPの状態空間の表現も変更し、RELDECが以前の研究よりも大きなブロック長LDPC符号に適合できるようにした。
さらに,様々なチャネル条件下での復号化に対処するために,メタ強化学習を用いたアジャイルメタRELDEC(AM-RELDEC)を提案する。
提案したRELDEC方式は,5G新無線用に設計されたコードを含む様々なLDPC符号に対して,標準的なフラッディングとランダムなシーケンシャルデコーディングを著しく上回っている。
関連論文リスト
- Decoding Quantum LDPC Codes Using Graph Neural Networks [52.19575718707659]
グラフニューラルネットワーク(GNN)に基づく量子低密度パリティチェック(QLDPC)符号の新しい復号法を提案する。
提案したGNNベースのQLDPCデコーダは,QLDPC符号のスパースグラフ構造を利用して,メッセージパスデコーダとして実装することができる。
論文 参考訳(メタデータ) (2024-08-09T16:47:49Z) - Learning on JPEG-LDPC Compressed Images: Classifying with Syndromes [3.2657732635702375]
ゴール指向通信では、受信機の目的は、元のデータを再構成するのではなく、ディープラーニングモデルを適用することである。
本稿では,低密度パリティチェック(LDPC)符号を用いてエントロピー符号化を実現する方法を提案する。
論文 参考訳(メタデータ) (2024-03-15T11:07:38Z) - StepCoder: Improve Code Generation with Reinforcement Learning from
Compiler Feedback [58.20547418182074]
2つの主要コンポーネントからなるコード生成の新しいフレームワークであるStepCoderを紹介します。
CCCSは、長いシーケンスのコード生成タスクをCurriculum of Code Completion Subtaskに分割することで、探索課題に対処する。
FGOは、未実行のコードセグメントをマスクすることでのみモデルを最適化し、Fine-Grained Optimizationを提供する。
提案手法は,出力空間を探索し,対応するベンチマークにおいて最先端の手法より優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-02-02T13:14:31Z) - Graph Neural Networks for Enhanced Decoding of Quantum LDPC Codes [6.175503577352742]
量子低密度パリティチェック(LDPC)符号に対する微分可能な反復デコーダを提案する。
提案アルゴリズムは,古典的信念伝達(BP)復号段階と中間グラフニューラルネットワーク(GNN)層から構成される。
論文 参考訳(メタデータ) (2023-10-26T19:56:25Z) - Exploring Continual Learning for Code Generation Models [80.78036093054855]
継続的学習(CL)は、コードドメインの中でまだ過小評価されていない重要な側面である。
コード生成,翻訳,要約,改良など,幅広いタスクをカバーするCodeTask-CLというベンチマークを導入する。
即時選択機構の不安定な訓練により,プロンプトプール (PP) などの有効手法が破滅的な忘れ込みに悩まされることが判明した。
論文 参考訳(メタデータ) (2023-07-05T16:58:39Z) - Deep Joint Source-Channel Coding with Iterative Source Error Correction [11.41076729592696]
深層学習に基づくジョイントソースチャネル符号(Deep J SCC)に対する反復的ソース誤り訂正(ISEC)復号法を提案する。
チャネルを通じて受信されたノイズワードに対して、Deep J SCCエンコーダとデコーダペアを使用して、コードを反復的に更新する。
提案手法は, チャネルノイズ特性がトレーニング時に使用するものと一致しない場合に, ベースラインよりも信頼性の高いソース再構成結果を生成する。
論文 参考訳(メタデータ) (2023-02-17T22:50:58Z) - Machine Learning-Aided Efficient Decoding of Reed-Muller Subcodes [59.55193427277134]
Reed-Muller (RM) 符号は、一般的なバイナリインプットメモリレス対称チャネルの容量を達成する。
RM符号は制限されたレートのみを許容する。
効率的なデコーダは、RM符号に対して有限長で利用可能である。
論文 参考訳(メタデータ) (2023-01-16T04:11:14Z) - Graph Neural Networks for Channel Decoding [71.15576353630667]
低密度パリティチェック(LDPC)やBCH符号など、様々な符号化方式の競合復号性能を示す。
ニューラルネットワーク(NN)は、与えられたグラフ上で一般化されたメッセージパッシングアルゴリズムを学習する。
提案するデコーダを,従来のチャネル復号法および最近のディープラーニングに基づく結果と比較した。
論文 参考訳(メタデータ) (2022-07-29T15:29:18Z) - Coding for Distributed Multi-Agent Reinforcement Learning [12.366967700730449]
ストラグラーは、様々なシステム障害が存在するため、分散学習システムで頻繁に発生する。
本稿では,ストラグラーの存在下でのMARLアルゴリズムの学習を高速化する分散学習フレームワークを提案する。
最大距離分離可能(MDS)コード、ランダムスパースコード、レプリケーションベースのコード、通常の低密度パリティチェック(LDPC)コードなど、さまざまなコーディングスキームも検討されている。
論文 参考訳(メタデータ) (2021-01-07T00:22:34Z) - Pruning Neural Belief Propagation Decoders [77.237958592189]
本稿では,機械学習を用いたBPデコードに対して,過剰完全パリティチェック行列を調整する手法を提案する。
我々は,デコーダの複雑さを低減しつつ,0.27dB,1.5dBのML性能を実現する。
論文 参考訳(メタデータ) (2020-01-21T12:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。