論文の概要: A Modularized and Scalable Multi-Agent Reinforcement Learning-based
System for Financial Portfolio Management
- arxiv url: http://arxiv.org/abs/2102.03502v1
- Date: Sat, 6 Feb 2021 04:04:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:56:22.548884
- Title: A Modularized and Scalable Multi-Agent Reinforcement Learning-based
System for Financial Portfolio Management
- Title(参考訳): 金融ポートフォリオ管理のためのモジュール化・拡張型マルチエージェント強化学習システム
- Authors: Zhenhan Huang, Fumihide Tanaka
- Abstract要約: 金融ポートフォリオマネジメントは強化学習(RL)において最も適用可能な問題の1つである
MSPMは、ポートフォリオ管理のためのモジュール化されたスケーラブルなアーキテクチャを備えた、新しいマルチエージェント強化学習ベースシステムである。
8年にわたる米株式市場のデータの実験は、MSPMが既存のベンチマークを上回るパフォーマンスで蓄積した利益がMSPMの有効性を証明している。
- 参考スコア(独自算出の注目度): 7.6146285961466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Financial Portfolio Management is one of the most applicable problems in
Reinforcement Learning (RL) by its sequential decision-making nature. Existing
RL-based approaches, while inspiring, often lack scalability, reusability, or
profundity of intake information to accommodate the ever-changing capital
markets. In this paper, we design and develop MSPM, a novel Multi-agent
Reinforcement learning-based system with a modularized and scalable
architecture for portfolio management. MSPM involves two asynchronously updated
units: Evolving Agent Module (EAM) and Strategic Agent Module (SAM). A
self-sustained EAM produces signal-comprised information for a specific asset
using heterogeneous data inputs, and each EAM possesses its reusability to have
connections to multiple SAMs. A SAM is responsible for the assets reallocation
of a portfolio using profound information from the EAMs connected. With the
elaborate architecture and the multi-step condensation of the volatile market
information, MSPM aims to provide a customizable, stable, and dedicated
solution to portfolio management that existing approaches do not. We also
tackle data-shortage issue of newly-listed stocks by transfer learning, and
validate the necessity of EAM. Experiments on 8-year U.S. stock markets data
prove the effectiveness of MSPM in profits accumulation by its outperformance
over existing benchmarks.
- Abstract(参考訳): 金融ポートフォリオ管理はその逐次意思決定性によって強化学習(rl)において最も適用可能な問題の1つである。
既存のRLベースのアプローチは、常に変化する資本市場に対応するために、スケーラビリティ、再利用性、あるいはインテーク情報のプロファンドをしばしば欠いている。
本稿では,ポートフォリオ管理のためのモジュール化・スケーラブルなアーキテクチャを備えた,新たなマルチエージェント強化学習システムmspmの設計と開発を行う。
MSPMには、Evolving Agent Module (EAM) と Strategic Agent Module (SAM) の2つの非同期更新ユニットが含まれている。
自己持続型EAMは、異種データ入力を用いて特定の資産の信号構成情報を生成し、各EAMは、複数のSAMに接続することができる。
SAMはEAMからの深い情報を用いてポートフォリオの資産再配置を担います。
MSPMは、精巧なアーキテクチャと揮発性市場情報のマルチステップ凝縮により、既存のアプローチにはない、カスタマイズ可能で安定した専用ソリューションをポートフォリオ管理に提供することを目指しています。
また、移転学習による新規上場株式のデータ不足問題にも取り組み、EAMの必要性を検証しています。
8年間の米国株式市場データに関する実験では、MSPMが既存のベンチマークを上回るパフォーマンスで利益の蓄積に有効であることを証明している。
関連論文リスト
- Many learning agents interacting with an agent-based market model [0.0]
反応型エージェントベースモデルと相互作用する最適な実行取引エージェントの学習のダイナミクスを考察する。
このモデルは、最適な実行学習エージェント、最小限の知的流動性テイカー、高速な電子流動性プロバイダによって表される3つの栄養レベルを持つ市場エコロジーを表している。
学習可能な最適な実行エージェントを組み込むことで、経験的データと同じ複雑さで動的に生成できるかどうかを検討する。
論文 参考訳(メタデータ) (2023-03-13T18:15:52Z) - Multi-Agent Reinforcement Learning with Shared Resources for Inventory
Management [62.23979094308932]
私たちの設定では、共有リソース(在庫容量など)の制約は、SKUごとに独立した制御を結合します。
共有資源ゲーム(SRSG)としてこの問題を定式化し,CD-PPO(Context-aware Decentralized PPO)と呼ばれる効率的なアルゴリズムを提案する。
実験により,CD-PPOは標準的なMARLアルゴリズムと比較して学習手順を高速化できることが実証された。
論文 参考訳(メタデータ) (2022-12-15T09:35:54Z) - Multi-Agent Automated Machine Learning [54.14038920246645]
自動機械学習(AutoML)におけるモジュールの共同最適化のためのマルチエージェント自動機械学習(MA2ML)を提案する。
MA2MLはモジュール間の協力を強化するために各エージェントにクレジットを明示的に割り当て、検索効率を向上させるために政治外の学習を取り入れている。
実験により、MA2MLは計算コストの制約の下でImageNet上で最先端のトップ1の精度が得られることが示された。
論文 参考訳(メタデータ) (2022-10-17T13:32:59Z) - MetaTrader: An Reinforcement Learning Approach Integrating Diverse
Policies for Portfolio Optimization [17.759687104376855]
ポートフォリオ管理のための新しい2段階的アプローチを提案する。
最初の段階では、強化学習フレームワークに模倣学習を組み込む。
第2段階では、メタ政治を学び、市場状況を認識し、従うべき最も適切な学習方針を決定する。
論文 参考訳(メタデータ) (2022-09-01T07:58:06Z) - Mava: a research framework for distributed multi-agent reinforcement
learning [62.858425623166475]
Mavaはスケーラブルなマルチエージェント強化学習システムを構築するためのフレームワークである。
DeepMindのAcme citephoffman 2020acme上に構築されており、既存のシングルエージェントRLコンポーネントと統合されており、大きなメリットがある。
MARLのベースラインシステムは、すでにMavaで実装されている。
論文 参考訳(メタデータ) (2021-07-03T16:23:31Z) - Model-Augmented Q-learning [112.86795579978802]
モデルベースRLの構成要素を付加したMFRLフレームワークを提案する。
具体的には、$Q$-valuesだけでなく、共有ネットワークにおける遷移と報酬の両方を見積もる。
提案手法は,MQL (Model-augmented $Q$-learning) とよばれる提案手法により,真に報いられた学習によって得られる解と同一のポリシ不変解が得られることを示す。
論文 参考訳(メタデータ) (2021-02-07T17:56:50Z) - Reinforced Deep Markov Models With Applications in Automatic Trading [0.0]
我々はReinforced Deep Markov Model(RDMM)というモデルに基づくRLアプローチを提案する。
RDMMは自動取引システムとして機能する強化学習アルゴリズムの望ましい特性を統合する。
テストの結果、RDMMはデータ効率が良く、最適な実行問題のベンチマークと比較すると、金銭的利益が得られることがわかった。
論文 参考訳(メタデータ) (2020-11-09T12:46:30Z) - Information Freshness-Aware Task Offloading in Air-Ground Integrated
Edge Computing Systems [49.80033982995667]
本稿では,空域統合マルチアクセスエッジコンピューティングシステムにおける情報更新性を考慮したタスクオフロードの問題について検討する。
サードパーティのリアルタイムアプリケーションサービスプロバイダは、InPからの限られた通信と計算リソースで、加入したモバイルユーザ(MU)にコンピューティングサービスを提供する。
本稿では,各MUに2つの個別の深度Q-networksを適用し,Q-factorと後Q-factorを近似する新しい深度強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-15T21:32:43Z) - MAPS: Multi-agent Reinforcement Learning-based Portfolio Management
System [23.657021288146158]
マルチエージェント強化学習に基づくポートフォリオ管理システム(MAPS)を提案する。
MAPSは、各エージェントが独立した「投資者」であり、独自のポートフォリオを作成する協調システムである。
米国の12年間の市場データによる実験の結果、MAPSはシャープ比でベースラインの大半を上回っている。
論文 参考訳(メタデータ) (2020-07-10T14:08:12Z) - Reinforcement-Learning based Portfolio Management with Augmented Asset
Movement Prediction States [71.54651874063865]
ポートフォリオマネジメント(PM)は、最大利益や最小リスクといった投資目標を達成することを目的としている。
本稿では,PMのための新しいステート拡張RLフレームワークであるSARLを提案する。
当社の枠組みは, 金融PMにおける2つのユニークな課題に対処することを目的としている。(1) データの異種データ -- 資産毎の収集情報は通常, 多様性, ノイズ, 不均衡(ニュース記事など), (2) 環境の不確実性 -- 金融市場は多様で非定常である。
論文 参考訳(メタデータ) (2020-02-09T08:10:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。