論文の概要: HARLF: Hierarchical Reinforcement Learning and Lightweight LLM-Driven Sentiment Integration for Financial Portfolio Optimization
- arxiv url: http://arxiv.org/abs/2507.18560v1
- Date: Thu, 24 Jul 2025 16:35:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:44.122484
- Title: HARLF: Hierarchical Reinforcement Learning and Lightweight LLM-Driven Sentiment Integration for Financial Portfolio Optimization
- Title(参考訳): HARLF:金融ポートフォリオ最適化のための階層的強化学習と軽量LDM駆動型感性統合
- Authors: Benjamin Coriat, Eric Benhamou,
- Abstract要約: 本稿では,軽量大言語モデル (LLM) と深層強化学習 (DRL) を統合したポートフォリオ最適化のための新しい階層型フレームワークを提案する。
我々の3層アーキテクチャは、ベースRLエージェントを使用してハイブリッドデータを処理する。メタエージェントは意思決定を集約し、スーパーエージェントは市場データと感情分析に基づいて意思決定をマージする。
このフレームワークは毎年26%のリターンを達成し、シャープ比は1.2で、等級とS&P 500ベンチマークを上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel hierarchical framework for portfolio optimization, integrating lightweight Large Language Models (LLMs) with Deep Reinforcement Learning (DRL) to combine sentiment signals from financial news with traditional market indicators. Our three-tier architecture employs base RL agents to process hybrid data, meta-agents to aggregate their decisions, and a super-agent to merge decisions based on market data and sentiment analysis. Evaluated on data from 2018 to 2024, after training on 2000-2017, the framework achieves a 26% annualized return and a Sharpe ratio of 1.2, outperforming equal-weighted and S&P 500 benchmarks. Key contributions include scalable cross-modal integration, a hierarchical RL structure for enhanced stability, and open-source reproducibility.
- Abstract(参考訳): 本稿では、ポートフォリオ最適化のための新しい階層的枠組みを提案し、金融ニュースからの感情信号を従来の市場指標と組み合わせるために、軽量なLarge Language Models(LLM)とDeep Reinforcement Learning(DRL)を統合する。
我々の3層アーキテクチャは、ベースRLエージェントを使用してハイブリッドデータを処理する。メタエージェントは意思決定を集約し、スーパーエージェントは市場データと感情分析に基づいて意思決定をマージする。
2018年から2024年にかけてのデータに基づいて評価され、2000~2017年のトレーニングを経て、このフレームワークは毎年26%のリターンとシャープ比1.2を達成し、同等の重み付けとS&P 500ベンチマークを上回っている。
主なコントリビューションとしては、スケーラブルなクロスモーダル統合、安定性向上のための階層的なRL構造、オープンソース再現性などがある。
関連論文リスト
- FinMarBa: A Market-Informed Dataset for Financial Sentiment Classification [0.0]
本稿では,軽量大言語モデル (LLM) と深層強化学習 (DRL) を統合したポートフォリオ最適化のための新しい階層型フレームワークを提案する。
我々の3層アーキテクチャは、ベースRLエージェントを使用してハイブリッドデータを処理する。メタエージェントは意思決定を集約し、スーパーエージェントは市場データと感情分析に基づいて意思決定をマージする。
このフレームワークは毎年26%のリターンを達成し、シャープ比は1.2で、等級とS&P 500ベンチマークを上回っている。
論文 参考訳(メタデータ) (2025-07-24T16:27:32Z) - Building crypto portfolios with agentic AI [46.348283638884425]
暗号通貨市場の急速な成長は投資家に新たな機会を与えたが、同時に高いボラティリティがもたらされた。
本稿では,暗号アロケーションを自律的に構築し,評価するためのマルチエージェントシステムの実用化について述べる。
論文 参考訳(メタデータ) (2025-07-11T18:03:51Z) - DAPO: An Open-Source LLM Reinforcement Learning System at Scale [63.24798333145823]
我々は,Qwen2.5-32Bベースモデルを用いて,AIME 2024上で50ポイントを達成できる最先端の大規模RLシステムをオープンソース化した。
さらに,verlフレームワーク上に構築されたトレーニングコードと,慎重にキュレートされた,処理されたデータセットもオープンソースとして公開しています。
論文 参考訳(メタデータ) (2025-03-18T17:49:06Z) - Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis [89.60263788590893]
後学習量子化(PTQ)技術は大規模言語モデル(LLM)圧縮に広く採用されている。
既存のアルゴリズムは主にパフォーマンスに重点を置いており、モデルサイズ、パフォーマンス、量子化ビット幅間のトレードオフを見越している。
本稿では LLM PTQ のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-02-18T07:35:35Z) - Federated Fine-Tuning of LLMs: Framework Comparison and Research Directions [59.5243730853157]
Federated Learning(FL)は、分散プライベートデータセットを使用して、トレーニング済みの大規模言語モデル(LLM)を微調整するための、プライバシ保護ソリューションを提供する。
本稿では、知識蒸留(KD)とスプリットラーニング(SL)を統合し、これらの問題を緩和する3つの先進的連合LLM(FedLLM)フレームワークの比較分析を行う。
論文 参考訳(メタデータ) (2025-01-08T11:37:06Z) - Star-Agents: Automatic Data Optimization with LLM Agents for Instruction Tuning [71.2981957820888]
本稿では,データセット間のデータ品質向上を自動化する新しいStar-Agentsフレームワークを提案する。
このフレームワークは最初,複数のLDMエージェントを用いた多様なインストラクションデータを生成する。
生成したデータは、難易度と品質の両方を評価する二重モデル法を用いて厳密な評価を行う。
論文 参考訳(メタデータ) (2024-11-21T02:30:53Z) - Automate Strategy Finding with LLM in Quant Investment [15.475504003134787]
本稿では,大規模言語モデル(LLM)をリスク認識型マルチエージェントシステム内で活用し,定量的ファイナンスにおける戦略発見を自動化する新しい3段階フレームワークを提案する。
本手法は,金融分野における従来のディープラーニングモデルの脆さに対処するものである。
実験結果は、確立されたベンチマークと比較して、中国とアメリカの市場体制における戦略の堅牢な性能を示している。
論文 参考訳(メタデータ) (2024-09-10T07:42:28Z) - Optimizing Portfolio with Two-Sided Transactions and Lending: A Reinforcement Learning Framework [0.0]
本研究では,リスクの高い環境に適した強化学習に基づくポートフォリオ管理モデルを提案する。
マルチヘッドアテンションを持つ畳み込みニューラルネットワークを用いたソフトアクタ・クリティカル(SAC)エージェントを用いてモデルを実装した。
市場のボラティリティ(変動性)が変化する2つの16カ月間にわたってテストされたこのモデルは、ベンチマークを著しく上回った。
論文 参考訳(メタデータ) (2024-08-09T23:36:58Z) - DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文 参考訳(メタデータ) (2024-02-27T12:26:07Z) - Large Language Models are Effective Text Rankers with Pairwise Ranking Prompting [65.00288634420812]
Pairwise Ranking Prompting (PRP)は、大規模言語モデル(LLM)の負担を大幅に軽減する手法である。
本研究は,中等級のオープンソースLCMを用いた標準ベンチマークにおいて,最先端のランク付け性能を達成した文献としては初めてである。
論文 参考訳(メタデータ) (2023-06-30T11:32:25Z) - Robo-Advising: Enhancing Investment with Inverse Optimization and Deep
Reinforcement Learning [13.23731449431572]
2つのMLエージェントからなるフルサイクルデータ駆動型投資ロボマネジメントフレームワークを提案する。
提案された投資パイプラインは、2016年4月1日から2021年2月1日までの実際の市場データに適用され、S&P 500ベンチマークポートフォリオを一貫して上回っている。
論文 参考訳(メタデータ) (2021-05-19T17:20:03Z) - Deep Learning for Portfolio Optimization [5.833272638548154]
個々の資産を選択する代わりに、ポートフォリオを形成するために市場指標のETF(Exchange-Traded Funds)を交換します。
我々は,本手法を広範囲のアルゴリズムと比較し,本モデルがテスト期間中に最高の性能を得ることを示す。
論文 参考訳(メタデータ) (2020-05-27T21:28:43Z) - Reinforcement-Learning based Portfolio Management with Augmented Asset
Movement Prediction States [71.54651874063865]
ポートフォリオマネジメント(PM)は、最大利益や最小リスクといった投資目標を達成することを目的としている。
本稿では,PMのための新しいステート拡張RLフレームワークであるSARLを提案する。
当社の枠組みは, 金融PMにおける2つのユニークな課題に対処することを目的としている。(1) データの異種データ -- 資産毎の収集情報は通常, 多様性, ノイズ, 不均衡(ニュース記事など), (2) 環境の不確実性 -- 金融市場は多様で非定常である。
論文 参考訳(メタデータ) (2020-02-09T08:10:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。