論文の概要: Pseudo Random Number Generation through Reinforcement Learning and
Recurrent Neural Networks
- arxiv url: http://arxiv.org/abs/2011.02909v2
- Date: Thu, 19 Nov 2020 14:55:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 04:38:46.932199
- Title: Pseudo Random Number Generation through Reinforcement Learning and
Recurrent Neural Networks
- Title(参考訳): 強化学習と繰り返しニューラルネットワークによる擬似乱数生成
- Authors: Luca Pasqualini and Maurizio Parton
- Abstract要約: Pseudo-Random Number Generator (PRNG) は乱数の性質を近似する数列を生成するアルゴリズムである。
本稿では,PRNGをゼロから生成するタスクに対する強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A Pseudo-Random Number Generator (PRNG) is any algorithm generating a
sequence of numbers approximating properties of random numbers. These numbers
are widely employed in mid-level cryptography and in software applications.
Test suites are used to evaluate PRNGs quality by checking statistical
properties of the generated sequences. These sequences are commonly represented
bit by bit. This paper proposes a Reinforcement Learning (RL) approach to the
task of generating PRNGs from scratch by learning a policy to solve a partially
observable Markov Decision Process (MDP), where the full state is the period of
the generated sequence and the observation at each time step is the last
sequence of bits appended to such state. We use a Long-Short Term Memory (LSTM)
architecture to model the temporal relationship between observations at
different time steps, by tasking the LSTM memory with the extraction of
significant features of the hidden portion of the MDP's states. We show that
modeling a PRNG with a partially observable MDP and a LSTM architecture largely
improves the results of the fully observable feedforward RL approach introduced
in previous work.
- Abstract(参考訳): Pseudo-Random Number Generator (PRNG) は、乱数の性質を近似する数列を生成するアルゴリズムである。
これらの数字は中級暗号やソフトウェアアプリケーションで広く使われている。
テストスイートは、生成されたシーケンスの統計特性をチェックすることにより、PRNGの品質を評価するために使用される。
これらの配列は一般にビット単位で表される。
本稿では,全状態が生成されたシーケンスの周期であり,各時間ステップにおける観察がその状態に追加されたビット列である部分可観測マルコフ決定過程(mdp)を解決するためのポリシーを学習することにより,prngを生成するタスクに対する強化学習(rl)アプローチを提案する。
我々は、LSTMメモリにMDP状態の隠蔽部分の重要な特徴を抽出することで、異なる時間ステップにおける観測間の時間的関係をモデル化するために、Long-Short Term Memory (LSTM)アーキテクチャを使用する。
PRNGを部分的に観測可能なMDPとLSTMアーキテクチャでモデル化することは、以前の研究で導入された完全に観測可能なフィードフォワードRLアプローチの結果を大幅に改善することを示します。
関連論文リスト
- Recurrent Stochastic Configuration Networks for Temporal Data Analytics [3.8719670789415925]
本稿では,問題解決のためのコンフィグレーションネットワーク(RSCN)のリカレントバージョンを開発する。
我々は、初期RCCNモデルを構築し、その後、オンラインで出力重みを更新する。
数値的な結果は,提案したRCCNが全データセットに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2024-06-21T03:21:22Z) - Nearest Neighbor Speculative Decoding for LLM Generation and Attribution [87.3259169631789]
Nearest Speculative Decoding (NEST)は、任意の長さの実世界のテキストスパンをLM世代に組み込むことができ、それらのソースへの属性を提供する。
NESTは、様々な知識集約タスクにおいて、基本LMの生成品質と帰属率を大幅に向上させる。
さらに、NESTは、Llama-2-Chat 70Bに適用した場合の推論時間において1.8倍のスピードアップを達成することにより、生成速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-05-29T17:55:03Z) - RetMIL: Retentive Multiple Instance Learning for Histopathological Whole Slide Image Classification [10.365234803533982]
本稿では,階層的特徴伝搬構造を通じてWSIシーケンスを処理するRetMILと呼ばれるリテーナ型MIL法を提案する。
局所レベルでは、WSIシーケンスは複数のサブシーケンスに分割され、各サブシーケンスのトークンは並列線形保持機構によって更新される。
グローバルレベルでは、サブシーケンスをグローバルシーケンスに融合し、シリアル保持機構によって更新し、最後に、グローバルアテンションプーリングによりスライドレベル表現を得る。
論文 参考訳(メタデータ) (2024-03-16T08:50:47Z) - State Sequences Prediction via Fourier Transform for Representation
Learning [111.82376793413746]
本研究では,表現表現を効率よく学習する新しい方法である,フーリエ変換(SPF)による状態列予測を提案する。
本研究では,状態系列における構造情報の存在を理論的に解析する。
実験により,提案手法はサンプル効率と性能の両面で,最先端のアルゴリズムよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-10-24T14:47:02Z) - Quick Adaptive Ternary Segmentation: An Efficient Decoding Procedure For
Hidden Markov Models [70.26374282390401]
ノイズの多い観測から元の信号(すなわち隠れ鎖)を復号することは、ほぼすべてのHMMに基づくデータ分析の主要な目標の1つである。
本稿では,多対数計算複雑性において隠れた列を復号化するための分法であるQuick Adaptive Ternary(QATS)を提案する。
論文 参考訳(メタデータ) (2023-05-29T19:37:48Z) - Empirical Analysis of the Inductive Bias of Recurrent Neural Networks by
Discrete Fourier Transform of Output Sequences [7.279215553861787]
本研究の目的は、リカレントニューラルネットワーク(RNN)の固有一般化特性、すなわち帰納バイアスを明らかにすることである。
実験の結果,Long Short-Term Memory (LSTM) とGated Recurrent Unit (GRU) は低周波パターンに対する誘導バイアスを有することがわかった。
また,LSTMとGRUの誘導バイアスは,層数や層の大きさによって異なることがわかった。
論文 参考訳(メタデータ) (2023-05-16T05:30:13Z) - HiPPO: Recurrent Memory with Optimal Polynomial Projections [93.3537706398653]
本稿では,連続信号と離散時系列をベースに投影してオンライン圧縮するための一般フレームワーク(HiPPO)を提案する。
過去の各時間ステップの重要性を示す尺度が与えられた場合、HiPPOは自然なオンライン関数近似問題に対する最適解を生成する。
このフォーマルなフレームワークは、すべての履歴を記憶するために時間をかけてスケールする新しいメモリ更新メカニズム(HiPPO-LegS)を提供する。
論文 参考訳(メタデータ) (2020-08-17T23:39:33Z) - Graph Gamma Process Generalized Linear Dynamical Systems [60.467040479276704]
実マルチ変数時系列をモデル化するために,グラフガンマ過程(GGP)線形力学系を導入する。
時間的パターン発見のために、モデルの下での潜在表現は、時系列を多変量部分列の同相集合に分解するために使用される。
非零次ノード数が有限であるランダムグラフを用いて、潜時状態遷移行列の空間パターンと次元の両方を定義する。
論文 参考訳(メタデータ) (2020-07-25T04:16:34Z) - Planning in Markov Decision Processes with Gap-Dependent Sample
Complexity [48.98199700043158]
マルコフ決定過程における計画のための新しいトラジェクトリに基づくモンテカルロ木探索アルゴリズム MDP-GapE を提案する。
我々は, MDP-GapE に要求される生成モデルに対する呼び出し回数の上限を証明し, 確率の高い準最適動作を同定する。
論文 参考訳(メタデータ) (2020-06-10T15:05:51Z) - Tensor Networks for Probabilistic Sequence Modeling [7.846449972735859]
シーケンスデータの確率的モデリングには,一様行列積状態(u-MPS)モデルを用いる。
次に、訓練されたu-MPSに対して、様々な条件分布から効率的にサンプリングできる新しい生成アルゴリズムを提案する。
合成テキストデータと実テキストデータを用いたシーケンスモデリング実験は、U-MPSが様々なベースラインより優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T17:16:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。