論文の概要: VDHLA: Variable Depth Hybrid Learning Automaton and Its Application to
Defense Against the Selfish Mining Attack in Bitcoin
- arxiv url: http://arxiv.org/abs/2302.12096v1
- Date: Wed, 15 Feb 2023 06:25:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-26 13:14:43.443403
- Title: VDHLA: Variable Depth Hybrid Learning Automaton and Its Application to
Defense Against the Selfish Mining Attack in Bitcoin
- Title(参考訳): vdhla:可変深度ハイブリッド学習オートマトンとそのbitcoinの利己的なマイニング攻撃に対する防御への応用
- Authors: Ali Nikhalat-Jahromi, Ali Mohammad Saghiri, Mohammad Reza Meybodi
- Abstract要約: 固定構造と可変動作集合学習オートマトンを組み合わせたハイブリッド学習オートマトンモデルを提案する。
我々の知る限りでは、固定構造学習オートマトンの深さをインテリジェントに変化させる最初のハイブリッドモデルである。
提案されたモデルは、Bitcoinの利己的なマイニング攻撃から守るために適用される。
- 参考スコア(独自算出の注目度): 1.160208922584163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning Automaton (LA) is an adaptive self-organized model that improves its
action-selection through interaction with an unknown environment. LA with
finite action set can be classified into two main categories: fixed and
variable structure. Furthermore, variable action-set learning automaton (VASLA)
is one of the main subsets of variable structure learning automaton. In this
paper, we propose VDHLA, a novel hybrid learning automaton model, which is a
combination of fixed structure and variable action set learning automaton. In
the proposed model, variable action set learning automaton can increase,
decrease, or leave unchanged the depth of fixed structure learning automaton
during the action switching phase. In addition, the depth of the proposed model
can change in a symmetric (SVDHLA) or asymmetric (AVDHLA) manner. To the best
of our knowledge, it is the first hybrid model that intelligently changes the
depth of fixed structure learning automaton. Several computer simulations are
conducted to study the performance of the proposed model with respect to the
total number of rewards and action switching in stationary and non-stationary
environments. The proposed model is compared with FSLA and VSLA. In order to
determine the performance of the proposed model in a practical application, the
selfish mining attack which threatens the incentive-compatibility of a
proof-of-work based blockchain environment is considered. The proposed model is
applied to defend against the selfish mining attack in Bitcoin and compared
with the tie-breaking mechanism, which is a well-known defense. Simulation
results in all environments have shown the superiority of the proposed model.
- Abstract(参考訳): 学習オートマトン(LA)は、未知の環境との相互作用を通じて行動選択を改善する適応的な自己組織化モデルである。
有限作用集合を持つlaは、固定構造と可変構造という2つの主要なカテゴリに分類できる。
さらに、可変アクションセット学習オートマトン(VASLA)は、可変構造学習オートマトンの主要なサブセットの1つである。
本稿では、固定構造と可変動作集合学習オートマトンを組み合わせた新しいハイブリッド学習オートマトンモデルであるVDHLAを提案する。
提案モデルでは、可変アクションセット学習オートマトンは、動作切り替えフェーズ中に固定構造学習オートマトンの深さを増加、減少、または残すことができる。
さらに、提案モデルの深さは、対称(SVDHLA)または非対称(AVDHLA)の方法で変化することができる。
我々の知る限りでは、固定構造学習オートマトンの深さをインテリジェントに変化させる最初のハイブリッドモデルである。
静止環境および非定常環境における報酬の総数および行動スイッチングについて,提案モデルの性能を計算機シミュレーションにより検討した。
提案モデルとFSLAとVSLAを比較した。
提案したモデルの性能を実用的に適用するために,実証型ブロックチェーン環境のインセンティブ適合性を脅かす利己的なマイニング攻撃を検討する。
提案したモデルは、Bitcoinの自己中心的なマイニング攻撃に対する防御に応用され、よく知られた防御機構であるタイブレーキングメカニズムと比較される。
すべての環境におけるシミュレーション結果から,提案モデルの有効性が示された。
関連論文リスト
- Physics-informed reinforcement learning via probabilistic co-adjustment
functions [3.6787556334630334]
両手法の利点を組み合わせた新しい手法として,コクリグ調整 (CKA) とリッジ回帰調整 (RRA) を導入する。
本手法は,GPプリエントと統合した自己回帰AR1コクリグモデルに基づく。
論文 参考訳(メタデータ) (2023-09-11T12:10:19Z) - From system models to class models: An in-context learning paradigm [0.0]
本稿では,1段階の予測と複数段階のシミュレーションという2つの主要な課題に対処する,システム識別のための新しいパラダイムを提案する。
動的システムのクラスを表すメタモデルを学ぶ。
一段階の予測では、GPTのようなデコーダのみのアーキテクチャを使用し、シミュレーション問題ではエンコーダ-デコーダ構造を用いる。
論文 参考訳(メタデータ) (2023-08-25T13:50:17Z) - Learning Environment Models with Continuous Stochastic Dynamics [0.0]
本研究では,エージェントの制御下での環境行動のオートマトンモデルを学ぶことによって,エージェントが直面する決定に対する洞察を提供することを目的とする。
本研究では,複雑で連続的な力学を持つ環境のモデルを学習できるように,自動学習の能力を高める。
我々は,LunarLander,CartPole,Mountain Car,Acrobotなど,OpenAI GymのRLベンチマーク環境に自動学習フレームワークを適用した。
論文 参考訳(メタデータ) (2023-06-29T12:47:28Z) - Online Weighted Q-Ensembles for Reduced Hyperparameter Tuning in
Reinforcement Learning [0.38073142980732994]
強化学習はロボット制御を学ぶための有望なパラダイムであり、ダイナミックスモデルを必要とせずに複雑な制御ポリシーを学習することができる。
本稿では,複数の強化学習エージェントのアンサンブルを用いて,それぞれ異なるパラメータの集合と,最適な演奏セットを選択するメカニズムを提案する。
オンライン重み付きQ-アンサンブルは,q平均アンサンブルと比較した場合,全体の低分散と優れた結果を示した。
論文 参考訳(メタデータ) (2022-09-29T19:57:43Z) - DST: Dynamic Substitute Training for Data-free Black-box Attack [79.61601742693713]
そこで本研究では,対象モデルからより高速に学習するための代用モデルの促進を目的とした,新しい動的代用トレーニング攻撃手法を提案する。
タスク駆動型グラフに基づく構造情報学習の制約を導入し、生成したトレーニングデータの質を向上させる。
論文 参考訳(メタデータ) (2022-04-03T02:29:11Z) - Neurosymbolic hybrid approach to driver collision warning [64.02492460600905]
自律運転システムには2つの主要なアルゴリズムアプローチがある。
ディープラーニングだけでは、多くの分野で最先端の結果が得られています。
しかし、ディープラーニングモデルが機能しない場合、デバッグが非常に難しい場合もあります。
論文 参考訳(メタデータ) (2022-03-28T20:29:50Z) - Momentum Pseudo-Labeling for Semi-Supervised Speech Recognition [55.362258027878966]
本稿では,半教師付き音声認識のための簡易かつ効果的な手法として,モーメント擬似ラベル(MPL)を提案する。
MPLは、平均的な教師メソッドにインスパイアされて、相互に相互作用し、学習するオンラインとオフラインの2つのモデルで構成されている。
実験の結果,MPLはベースモデルよりも効果的に改善され,様々な半教師付きシナリオに拡張可能であることが示された。
論文 参考訳(メタデータ) (2021-06-16T16:24:55Z) - Model Predictive Actor-Critic: Accelerating Robot Skill Acquisition with
Deep Reinforcement Learning [42.525696463089794]
Model Predictive Actor-Critic (MoPAC)は、モデル予測ロールアウトとポリシー最適化を組み合わせてモデルバイアスを軽減するハイブリッドモデルベース/モデルフリーメソッドである。
MoPACは最適なスキル学習を近似誤差まで保証し、環境との物理的相互作用を減らす。
論文 参考訳(メタデータ) (2021-03-25T13:50:24Z) - Generative Temporal Difference Learning for Infinite-Horizon Prediction [101.59882753763888]
我々は、無限確率的地平線を持つ環境力学の予測モデルである$gamma$-modelを導入する。
トレーニングタイムとテストタイムの複合的なエラーの間には、そのトレーニングが避けられないトレードオフを反映しているかについて議論する。
論文 参考訳(メタデータ) (2020-10-27T17:54:12Z) - Deep Imitation Learning for Bimanual Robotic Manipulation [70.56142804957187]
本稿では,ロボットによるバイマニュアル操作のための深層模倣学習フレームワークを提案する。
中心となる課題は、操作スキルを異なる場所にあるオブジェクトに一般化することである。
i)マルチモーダルダイナミクスを要素運動プリミティブに分解し、(ii)リカレントグラフニューラルネットワークを用いて各プリミティブをパラメータ化して相互作用を捕捉し、(iii)プリミティブを逐次的に構成する高レベルプランナと、プリミティブダイナミクスと逆運動学制御を組み合わせた低レベルコントローラを統合することを提案する。
論文 参考訳(メタデータ) (2020-10-11T01:40:03Z) - AutoFIS: Automatic Feature Interaction Selection in Factorization Models
for Click-Through Rate Prediction [75.16836697734995]
自動特徴相互作用選択(AutoFIS)と呼ばれる2段階のアルゴリズムを提案する。
AutoFISは、目標モデルを収束させるためにトレーニングするのと同等の計算コストで、因子化モデルに対する重要な特徴的相互作用を自動的に識別することができる。
AutoFISはHuawei App Storeレコメンデーションサービスのトレーニングプラットフォームにデプロイされている。
論文 参考訳(メタデータ) (2020-03-25T06:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。