論文の概要: Detecting and adapting to crisis pattern with context based Deep
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2009.07200v2
- Date: Mon, 9 Nov 2020 07:49:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 02:48:30.009462
- Title: Detecting and adapting to crisis pattern with context based Deep
Reinforcement Learning
- Title(参考訳): 文脈に基づく深層強化学習による危機パターンの検出と適応
- Authors: Eric Benhamou, David Saltiel, Jean-Jacques Ohana, and Jamal Atif
- Abstract要約: 本稿では、2つのサブネットワークで構成された革新的なDRLフレームワークを提案する。
テストセットの結果、このアプローチはMarkowitzのような従来のポートフォリオ最適化手法を大幅に上回っており、現在のCovidのような危機を検出し予測することができる。
- 参考スコア(独自算出の注目度): 6.224519494738852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep reinforcement learning (DRL) has reached super human levels in complex
tasks like game solving (Go and autonomous driving). However, it remains an
open question whether DRL can reach human level in applications to financial
problems and in particular in detecting pattern crisis and consequently
dis-investing. In this paper, we present an innovative DRL framework consisting
in two sub-networks fed respectively with portfolio strategies past
performances and standard deviations as well as additional contextual features.
The second sub network plays an important role as it captures dependencies with
common financial indicators features like risk aversion, economic surprise
index and correlations between assets that allows taking into account context
based information. We compare different network architectures either using
layers of convolutions to reduce network's complexity or LSTM block to capture
time dependency and whether previous allocations is important in the modeling.
We also use adversarial training to make the final model more robust. Results
on test set show this approach substantially over-performs traditional
portfolio optimization methods like Markowitz and is able to detect and
anticipate crisis like the current Covid one.
- Abstract(参考訳): 深層強化学習(DRL)は、ゲーム問題解決(Goと自動運転)のような複雑なタスクにおいて、超人間レベルに達した。
しかし、DRLが金融問題への応用、特にパターン危機の検出、そしてその結果の非投資において、人間レベルに達することができるかどうかには疑問が残る。
本稿では,2つのサブネットワークにそれぞれ,過去のポートフォリオ戦略と標準偏差と追加のコンテキスト特徴を付与した,革新的なdrlフレームワークを提案する。
第2のサブネットワークは、リスク回避、経済的サプライズ指数、コンテキストベースの情報を考慮した資産間の相関といった一般的な金融指標の依存関係をキャプチャする上で、重要な役割を果たす。
我々は、ネットワークの複雑さを減らすために畳み込み層を使用する異なるネットワークアーキテクチャと、時間依存性をキャプチャするためのLSTMブロックと、モデリングにおいて以前のアロケーションが重要であるかどうかを比較する。
最終モデルをより堅牢にするために、敵のトレーニングも使用しています。
テストセットの結果、このアプローチはMarkowitzのような従来のポートフォリオ最適化手法を大幅に上回っており、現在のCovidのような危機を検出し予測することができる。
関連論文リスト
- Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - Seeing is not Believing: Robust Reinforcement Learning against Spurious
Correlation [57.351098530477124]
国家の異なる部分には、保存されていない共同設立者が引き起こす相関関係が存在しない。
このような役に立たないあるいは有害な相関を学習するモデルは、テストケースの共同創設者がトレーニングケースから逸脱したときに破滅的に失敗する可能性がある。
したがって、単純かつ非構造的な不確実性集合を仮定する既存の頑健なアルゴリズムは、この問題に対処するには不十分である。
論文 参考訳(メタデータ) (2023-07-15T23:53:37Z) - A Neuromorphic Architecture for Reinforcement Learning from Real-Valued
Observations [0.34410212782758043]
強化学習(RL)は複雑な環境における意思決定のための強力なフレームワークを提供する。
本稿では,実測値を用いてRL問題を解くための新しいスパイキングニューラルネットワーク(SNN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-07-06T12:33:34Z) - Factor Investing with a Deep Multi-Factor Model [123.52358449455231]
我々は、業界中立化と市場中立化モジュールを明確な財務見識をもって取り入れた、新しい深層多要素モデルを開発する。
実世界の株式市場データによるテストは、我々の深層多要素モデルの有効性を示している。
論文 参考訳(メタデータ) (2022-10-22T14:47:11Z) - Mastering the Unsupervised Reinforcement Learning Benchmark from Pixels [112.63440666617494]
強化学習アルゴリズムは成功するが、エージェントと環境の間の大量の相互作用を必要とする。
本稿では,教師なしモデルベースRLを用いてエージェントを事前学習する手法を提案する。
我々はReal-Word RLベンチマークにおいて、適応中の環境摂動に対する抵抗性を示唆し、堅牢な性能を示す。
論文 参考訳(メタデータ) (2022-09-24T14:22:29Z) - Stock Trading Optimization through Model-based Reinforcement Learning
with Resistance Support Relative Strength [4.322320095367326]
我々は、モデルベース強化学習(MBRL)アルゴリズムにおける行動の正規化用語として、抵抗とサポート(RS)レベルを活用する新しいアプローチを設計する。
提案手法は、新型コロナウイルス(COVID-19)のパンデミック期、金融市場が予測不可能な危機に陥った時に、大きな下落(最大減損)にも耐えられる。
論文 参考訳(メタデータ) (2022-05-30T12:36:48Z) - Trading with the Momentum Transformer: An Intelligent and Interpretable
Architecture [2.580765958706854]
我々は、ベンチマークを上回るアテンションベースのアーキテクチャであるMomentum Transformerを紹介した。
注意パターンの顕著な構造を観察し,運動量回転点における重要なピークを観測した。
解釈可能な変数選択ネットワークを追加することで、PDは日々のリターンデータに基づいて、モデルがトレーディングから遠ざけるのにどう役立つかを観察する。
論文 参考訳(メタデータ) (2021-12-16T00:04:12Z) - Combining Pessimism with Optimism for Robust and Efficient Model-Based
Deep Reinforcement Learning [56.17667147101263]
実世界のタスクでは、強化学習エージェントはトレーニング中に存在しない状況に遭遇する。
信頼性を確保するため、RLエージェントは最悪の状況に対して堅牢性を示す必要がある。
本稿では,Robust Hallucinated Upper-Confidence RL (RH-UCRL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-18T16:50:17Z) - Deep Hedging, Generative Adversarial Networks, and Beyond [2.253930064459394]
本稿では,ディープラーニングと人工知能の金融応用,特にヘッジへの応用について紹介する。
本稿では,単純なバニラ欧州コールオプションを複製した直接ポリシー検索強化エージェントの枠組みを示し,モデルフリーデルタヘッジにエージェントを使用する。
我々は、このRLベースのヘッジフレームワークが、従来のモデルに固有の問題に対処し、実践的にヘッジを実行するためのより効率的な方法であると信じている。
論文 参考訳(メタデータ) (2021-03-05T19:41:11Z) - Phase Retrieval using Expectation Consistent Signal Recovery Algorithm
based on Hypernetwork [73.94896986868146]
位相検索は現代の計算イメージングシステムにおいて重要な要素である。
近年のディープラーニングの進歩は、堅牢で高速なPRの新たな可能性を開いた。
我々は、既存の制限を克服するために、深層展開のための新しいフレームワークを開発する。
論文 参考訳(メタデータ) (2021-01-12T08:36:23Z) - A new multilayer network construction via Tensor learning [0.0]
多層ネットワークは、異なる複雑なシステムの依存情報を抽出し、提供するのに適していることが判明した。
本研究では,データから直接多層ネットワークを構築するために,タッカーテンソル自動回帰に基づく新しい手法を提案する。
定常分数差の財務データに対する本手法の適用について述べる。
論文 参考訳(メタデータ) (2020-04-11T11:06:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。