論文の概要: DyFEn: Agent-Based Fee Setting in Payment Channel Networks
- arxiv url: http://arxiv.org/abs/2210.08197v1
- Date: Sat, 15 Oct 2022 05:06:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 21:32:55.072674
- Title: DyFEn: Agent-Based Fee Setting in Payment Channel Networks
- Title(参考訳): DyFEn: 支払いチャネルネットワークにおけるエージェントベースのフィー設定
- Authors: Kiana Asgari, Aida Afshar Mohammadian, Mojtaba Tefagh
- Abstract要約: 本稿では,オープンソースのリアルタイム金融ネットワークモデルであるDynamic Fee Learning Environment(DyFEn)を紹介する。
本稿では,オフチェーン決済チャネルのマルチチャネル動的料金設定を同時に行うという課題について述べる。
具体的には、この動的料金設定タスクにおいて、よく使われる深層強化学習法の実証結果について報告する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, with the development of easy to use learning environments,
implementing and reproducible benchmarking of reinforcement learning algorithms
has been largely accelerated by utilizing these frameworks. In this article, we
introduce the Dynamic Fee learning Environment (DyFEn), an open-source
real-world financial network model. It can provide a testbed for evaluating
different reinforcement learning techniques. To illustrate the promise of
DyFEn, we present a challenging problem which is a simultaneous multi-channel
dynamic fee setting for off-chain payment channels. This problem is well-known
in the Bitcoin Lightning Network and has no effective solutions. Specifically,
we report the empirical results of several commonly used deep reinforcement
learning methods on this dynamic fee setting task as a baseline for further
experiments. To the best of our knowledge, this work proposes the first virtual
learning environment based on a simulation of blockchain and distributed ledger
technologies, unlike many others which are based on physics simulations or game
platforms.
- Abstract(参考訳): 近年,容易に利用できる学習環境の開発により,強化学習アルゴリズムの実装と再現可能なベンチマークが,これらのフレームワークを利用することで大幅に加速されている。
本稿では,オープンソースのリアルタイム金融ネットワークモデルであるDynamic Fee Learning Environment(DyFEn)を紹介する。
異なる強化学習技術を評価するためのテストベッドを提供することができる。
我々は,DyFEnの約束を説明するために,オフチェーン決済チャネルのマルチチャネル動的料金設定を同時に行うという課題を提示する。
この問題はbitcoin lightning networkでよく知られており、有効な解決策はない。
具体的には,この動的料金設定タスクにおいて広く用いられている深層強化学習手法について,実験のベースラインとして実験結果について報告する。
我々の知る限り、この研究は、物理シミュレーションやゲームプラットフォームに基づく他の多くのものとは異なり、ブロックチェーンと分散台帳技術のシミュレーションに基づく最初の仮想学習環境を提案する。
関連論文リスト
- The lazy (NTK) and rich ($μ$P) regimes: a gentle tutorial [0.0]
現代の機械学習パラダイムの中心的なテーマは、大規模ニューラルネットワークがさまざまなメトリクスでより良いパフォーマンスを達成することである。
本チュートリアルでは,広義のネットワークを効果的に訓練するためには,自由度が1つしかないという,非厳密だが実証的な事実の導出を行う。
この自由度はトレーニング行動の豊かさを制御します。最小限のネットワークはカーネルマシンのように遅延し、最大でも機能学習を示します。
論文 参考訳(メタデータ) (2024-04-30T17:11:12Z) - Neural Active Learning Beyond Bandits [69.99592173038903]
ストリームベースとプールベースの両方のアクティブラーニングをニューラルネットワーク近似を用いて検討する。
ストリームベースおよびプールベースアクティブラーニングのためのニューラルネットワークを新たに設計したエクスプロイトと探索に基づく2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-18T21:52:14Z) - Towards Explainable Machine Learning: The Effectiveness of Reservoir
Computing in Wireless Receive Processing [21.843365090029987]
本稿では,Reservoir Computing (RC) と呼ばれる一般的な学習手法を適用し,チャネル等化の具体的課題について検討する。
RCは従来の手法や学習に基づく手法に比べて優れた性能を示した。
また,これをシミュレーションにより最適化することにより,受信処理/シンボル検出性能の向上を示す。
論文 参考訳(メタデータ) (2023-10-08T00:44:35Z) - Mixture-of-Variational-Experts for Continual Learning [0.0]
学習と忘れのトレードオフを促進する最適原理を提案する。
我々はMixture-of-Variational-Experts (MoVE)と呼ばれる連続学習のためのニューラルネットワーク層を提案する。
MNISTおよびCIFAR10データセットの変種に関する実験は、MoVE層の競合性能を示す。
論文 参考訳(メタデータ) (2021-10-25T06:32:06Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Improving the Accuracy of Early Exits in Multi-Exit Architectures via
Curriculum Learning [88.17413955380262]
マルチエクイットアーキテクチャにより、ディープニューラルネットワークは、正確なコストで厳密な期限に従うために、実行を早期に終了することができる。
カリキュラム学習を活用したマルチエクジットカリキュラム学習という新しい手法を紹介します。
本手法は, 標準訓練手法と比較して, 早期終了の精度を一貫して向上させる。
論文 参考訳(メタデータ) (2021-04-21T11:12:35Z) - PsiPhi-Learning: Reinforcement Learning with Demonstrations using
Successor Features and Inverse Temporal Difference Learning [102.36450942613091]
時間差学習(ITD)と呼ばれる逆強化学習アルゴリズムを提案する。
Psi Phi$-learningと呼ばれるデモで強化学習のための新しいアルゴリズムに到達し、オンライン環境の相互作用から学習とITDをシームレスに統合する方法を示します。
論文 参考訳(メタデータ) (2021-02-24T21:12:09Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。