論文の概要: Deep Reinforcement Learning and Mean-Variance Strategies for Responsible Portfolio Optimization
- arxiv url: http://arxiv.org/abs/2403.16667v1
- Date: Mon, 25 Mar 2024 12:04:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 14:58:36.582650
- Title: Deep Reinforcement Learning and Mean-Variance Strategies for Responsible Portfolio Optimization
- Title(参考訳): 責任あるポートフォリオ最適化のための深層強化学習と平均変動戦略
- Authors: Fernando Acero, Parisa Zehtabi, Nicolas Marchesotti, Michael Cashmore, Daniele Magazzeni, Manuela Veloso,
- Abstract要約: 本研究では,ESG状態と目的を取り入れたポートフォリオ最適化のための深層強化学習について検討する。
以上の結果から,ポートフォリオアロケーションに対する平均分散アプローチに対して,深層強化学習政策が競争力を発揮する可能性が示唆された。
- 参考スコア(独自算出の注目度): 49.396692286192206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Portfolio optimization involves determining the optimal allocation of portfolio assets in order to maximize a given investment objective. Traditionally, some form of mean-variance optimization is used with the aim of maximizing returns while minimizing risk, however, more recently, deep reinforcement learning formulations have been explored. Increasingly, investors have demonstrated an interest in incorporating ESG objectives when making investment decisions, and modifications to the classical mean-variance optimization framework have been developed. In this work, we study the use of deep reinforcement learning for responsible portfolio optimization, by incorporating ESG states and objectives, and provide comparisons against modified mean-variance approaches. Our results show that deep reinforcement learning policies can provide competitive performance against mean-variance approaches for responsible portfolio allocation across additive and multiplicative utility functions of financial and ESG responsibility objectives.
- Abstract(参考訳): ポートフォリオ最適化は、与えられた投資目標を最大化するために、ポートフォリオ資産の最適配分を決定することを伴う。
従来はリスクを最小化しながらリターンを最大化する目的で平均分散最適化の形式が用いられてきたが、近年では深層強化学習の定式化が検討されている。
投資家は投資決定を行う際にESGの目的を取り入れることに関心を示しており、古典的な平均分散最適化フレームワークの変更が開発されている。
本研究では、ESG状態と目的を組み込んだポートフォリオ最適化のための深層強化学習法について検討し、修正された平均分散アプローチとの比較を行った。
以上の結果から,金融・ESG責任目標の付加的・乗算的ユーティリティ機能にまたがるポートフォリオ割り当てに対する平均分散アプローチに対して,深い強化学習政策が競争力を発揮することが示唆された。
関連論文リスト
- Quantum-Inspired Portfolio Optimization In The QUBO Framework [0.0]
最適混合資産の選択を目的としたポートフォリオ最適化について,量子インスパイアされた最適化手法を提案する。
本研究は、資産配分とポートフォリオ管理に有用なツールとしての可能性を示した、金融における量子インスパイアされた技術に関する文献の増大に寄与する。
論文 参考訳(メタデータ) (2024-10-08T11:36:43Z) - Anatomy of Machines for Markowitz: Decision-Focused Learning for Mean-Variance Portfolio Optimization [27.791742749950203]
意思決定学習は、予測と最適化を統合して意思決定結果を改善する。
MSEは全ての資産のエラーを等しく扱うが、DFLはどのように異なる資産のエラーを減らせるのか?
本研究は,MVOにおける意思決定を最適化するために,DFLがストックリターン予測モデルをどのように調整するかを検討することを目的とする。
論文 参考訳(メタデータ) (2024-09-15T10:37:11Z) - Deep Pareto Reinforcement Learning for Multi-Objective Recommender Systems [60.91599969408029]
複数の目的を同時に最適化することは、レコメンデーションプラットフォームにとって重要なタスクです。
既存の多目的推薦システムは、そのような動的な関係を体系的に考慮していない。
論文 参考訳(メタデータ) (2024-07-04T02:19:49Z) - Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Overcoming Reward Overoptimization via Adversarial Policy Optimization with Lightweight Uncertainty Estimation [46.61909578101735]
AdvPO(Adversarial Policy Optimization)は、人間からの強化学習における報酬過度最適化の問題に対する新しい解決策である。
本稿では,報酬モデルの最後の層埋め込みにのみ依存して,報酬の不確実性を定量化する軽量な手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:20:12Z) - Causal Inference on Investment Constraints and Non-stationarity in
Dynamic Portfolio Optimization through Reinforcement Learning [0.0]
我々は,強化学習技術を用いた動的資産配分投資戦略を開発した。
我々は、金融時系列データの非定常性を強化学習アルゴリズムに組み込むという重要な課題に対処してきた。
投資戦略における強化学習の適用は、最適化問題を柔軟に設定する際、顕著な利点をもたらす。
論文 参考訳(メタデータ) (2023-11-08T07:55:51Z) - Acceleration in Policy Optimization [50.323182853069184]
我々は、楽観的かつ適応的な更新を通じて、政策改善のステップにフォレストを組み込むことにより、強化学習(RL)における政策最適化手法を加速するための統一パラダイムに向けて研究する。
我々は、楽観主義を、政策の将来行動の予測モデルとして定義し、適応性は、過度な予測や変化に対する遅延反応からエラーを軽減するために、即時かつ予測的な修正措置をとるものである。
我々は,メタグラディエント学習による適応型楽観的ポリシー勾配アルゴリズムを設計し,実証的なタスクにおいて,加速度に関連するいくつかの設計選択を実証的に強調する。
論文 参考訳(メタデータ) (2023-06-18T15:50:57Z) - Bayesian Optimization of ESG Financial Investments [0.0]
ESG (Economic, Social and Governance) の基準は金融においてより重要になっている。
本稿では,数理モデリングとESGとファイナンスを組み合わせた。
論文 参考訳(メタデータ) (2023-02-10T15:17:36Z) - Asset Allocation: From Markowitz to Deep Reinforcement Learning [2.0305676256390934]
資産配分とは、ポートフォリオの資産を常に再分配することでリスクと報酬のバランスをとることを目的とした投資戦略である。
我々は、多くの最適化手法の有効性と信頼性を決定するために、広範囲なベンチマーク研究を行う。
論文 参考訳(メタデータ) (2022-07-14T14:44:04Z) - Policy Gradient Bayesian Robust Optimization for Imitation Learning [49.881386773269746]
我々は、期待される性能とリスクのバランスをとるために、新しいポリシー勾配スタイルのロバスト最適化手法PG-BROILを導出する。
その結果,PG-BROILはリスクニュートラルからリスク・アバースまでの行動のファミリを創出できる可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-11T16:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。