論文の概要: Deep Reinforcement Learning and Mean-Variance Strategies for Responsible Portfolio Optimization
- arxiv url: http://arxiv.org/abs/2403.16667v1
- Date: Mon, 25 Mar 2024 12:04:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 14:58:36.582650
- Title: Deep Reinforcement Learning and Mean-Variance Strategies for Responsible Portfolio Optimization
- Title(参考訳): 責任あるポートフォリオ最適化のための深層強化学習と平均変動戦略
- Authors: Fernando Acero, Parisa Zehtabi, Nicolas Marchesotti, Michael Cashmore, Daniele Magazzeni, Manuela Veloso,
- Abstract要約: 本研究では,ESG状態と目的を取り入れたポートフォリオ最適化のための深層強化学習について検討する。
以上の結果から,ポートフォリオアロケーションに対する平均分散アプローチに対して,深層強化学習政策が競争力を発揮する可能性が示唆された。
- 参考スコア(独自算出の注目度): 49.396692286192206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Portfolio optimization involves determining the optimal allocation of portfolio assets in order to maximize a given investment objective. Traditionally, some form of mean-variance optimization is used with the aim of maximizing returns while minimizing risk, however, more recently, deep reinforcement learning formulations have been explored. Increasingly, investors have demonstrated an interest in incorporating ESG objectives when making investment decisions, and modifications to the classical mean-variance optimization framework have been developed. In this work, we study the use of deep reinforcement learning for responsible portfolio optimization, by incorporating ESG states and objectives, and provide comparisons against modified mean-variance approaches. Our results show that deep reinforcement learning policies can provide competitive performance against mean-variance approaches for responsible portfolio allocation across additive and multiplicative utility functions of financial and ESG responsibility objectives.
- Abstract(参考訳): ポートフォリオ最適化は、与えられた投資目標を最大化するために、ポートフォリオ資産の最適配分を決定することを伴う。
従来はリスクを最小化しながらリターンを最大化する目的で平均分散最適化の形式が用いられてきたが、近年では深層強化学習の定式化が検討されている。
投資家は投資決定を行う際にESGの目的を取り入れることに関心を示しており、古典的な平均分散最適化フレームワークの変更が開発されている。
本研究では、ESG状態と目的を組み込んだポートフォリオ最適化のための深層強化学習法について検討し、修正された平均分散アプローチとの比較を行った。
以上の結果から,金融・ESG責任目標の付加的・乗算的ユーティリティ機能にまたがるポートフォリオ割り当てに対する平均分散アプローチに対して,深い強化学習政策が競争力を発揮することが示唆された。
関連論文リスト
- Overcoming Reward Overoptimization via Adversarial Policy Optimization
with Lightweight Uncertainty Estimation [50.0151082930949]
AdvPO(Adversarial Policy Optimization)は、人間からの強化学習における報酬過度最適化の問題に対する新しい解決策である。
本稿では,報酬モデルの最後の層埋め込みにのみ依存して,報酬の不確実性を定量化する軽量な手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:20:12Z) - Unleashing the Potential of Large Language Models as Prompt Optimizers: An Analogical Analysis with Gradient-based Model Optimizers [108.72225067368592]
本稿では,大規模言語モデル(LLM)に基づくプロンプトの設計について検討する。
モデルパラメータ学習における2つの重要な要素を同定する。
特に、勾配に基づく最適化から理論的な枠組みや学習手法を借用し、改良された戦略を設計する。
論文 参考訳(メタデータ) (2024-02-27T15:05:32Z) - Causal Inference on Investment Constraints and Non-stationarity in
Dynamic Portfolio Optimization through Reinforcement Learning [0.0]
我々は,強化学習技術を用いた動的資産配分投資戦略を開発した。
我々は、金融時系列データの非定常性を強化学習アルゴリズムに組み込むという重要な課題に対処してきた。
投資戦略における強化学習の適用は、最適化問題を柔軟に設定する際、顕著な利点をもたらす。
論文 参考訳(メタデータ) (2023-11-08T07:55:51Z) - Acceleration in Policy Optimization [50.323182853069184]
我々は、楽観的かつ適応的な更新を通じて、政策改善のステップにフォレストを組み込むことにより、強化学習(RL)における政策最適化手法を加速するための統一パラダイムに向けて研究する。
我々は、楽観主義を、政策の将来行動の予測モデルとして定義し、適応性は、過度な予測や変化に対する遅延反応からエラーを軽減するために、即時かつ予測的な修正措置をとるものである。
我々は,メタグラディエント学習による適応型楽観的ポリシー勾配アルゴリズムを設計し,実証的なタスクにおいて,加速度に関連するいくつかの設計選択を実証的に強調する。
論文 参考訳(メタデータ) (2023-06-18T15:50:57Z) - Bayesian Optimization of ESG Financial Investments [0.0]
ESG (Economic, Social and Governance) の基準は金融においてより重要になっている。
本稿では,数理モデリングとESGとファイナンスを組み合わせた。
論文 参考訳(メタデータ) (2023-02-10T15:17:36Z) - Asset Allocation: From Markowitz to Deep Reinforcement Learning [2.0305676256390934]
資産配分とは、ポートフォリオの資産を常に再分配することでリスクと報酬のバランスをとることを目的とした投資戦略である。
我々は、多くの最適化手法の有効性と信頼性を決定するために、広範囲なベンチマーク研究を行う。
論文 参考訳(メタデータ) (2022-07-14T14:44:04Z) - Balancing Profit, Risk, and Sustainability for Portfolio Management [0.0]
本研究では,リスクを表すシャープ比と持続可能性を表す環境,社会,ガバナンススコア(ESG)を備えた新しいユーティリティ機能を開発する。
連続的な行動空間を許容することで、深いQ-ラーニングアプローチを改善しつつ、MADDPGよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-06-06T08:38:30Z) - Fuzzy Expert System for Stock Portfolio Selection: An Application to
Bombay Stock Exchange [0.0]
ボンベイ証券取引所(BSE)の株式評価と格付けのためにファジィエキスパートシステムモデルが提案されている。
このモデルの性能は、最近の株のパフォーマンスと比較すると、短期的な投資期間で十分であることが判明した。
論文 参考訳(メタデータ) (2022-04-28T10:01:15Z) - Policy Gradient Bayesian Robust Optimization for Imitation Learning [49.881386773269746]
我々は、期待される性能とリスクのバランスをとるために、新しいポリシー勾配スタイルのロバスト最適化手法PG-BROILを導出する。
その結果,PG-BROILはリスクニュートラルからリスク・アバースまでの行動のファミリを創出できる可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-11T16:49:15Z) - On the Global Optimality of Model-Agnostic Meta-Learning [133.16370011229776]
モデル・ア・メタラーニング(MAML)は、メタラーニングを二段階最適化問題として定式化し、内部レベルが各サブタスクを、共有された事前に基づいて解決する。
学習と教師あり学習の両方においてMAMLが達成した定常点の最適性を特徴付ける。
論文 参考訳(メタデータ) (2020-06-23T17:33:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。