論文の概要: CNN-DRL for Scalable Actions in Finance
- arxiv url: http://arxiv.org/abs/2401.06179v1
- Date: Wed, 10 Jan 2024 22:04:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 21:21:50.528180
- Title: CNN-DRL for Scalable Actions in Finance
- Title(参考訳): 金融におけるスケーラブルアクションのためのCNN-DRL
- Authors: Sina Montazeri, Akram Mirzaeinia, Haseebullah Jumakhan, Amir
Mirzaeinia
- Abstract要約: 金融におけるDRLは、アクションスケールが大きくなると環境のダイナミクスを学ぶのに困難である。
そこで我々は,CNNの入力行列を生成するために,日次特徴ベクトルの最後の90日間のデータを解析するCNNエージェントを設計した。
実験により, ベクトルベースエージェントは初期環境設定に応じた損失を経験し, 設計したCNNは安定であり, 環境を効果的に学習し, 報酬の増加につながることを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The published MLP-based DRL in finance has difficulties in learning the
dynamics of the environment when the action scale increases. If the buying and
selling increase to one thousand shares, the MLP agent will not be able to
effectively adapt to the environment. To address this, we designed a CNN agent
that concatenates the data from the last ninety days of the daily feature
vector to create the CNN input matrix. Our extensive experiments demonstrate
that the MLP-based agent experiences a loss corresponding to the initial
environment setup, while our designed CNN remains stable, effectively learns
the environment, and leads to an increase in rewards.
- Abstract(参考訳): MLPベースのDRLは、アクションスケールが大きくなると環境のダイナミクスを学ぶのに困難がある。
買収と売却が1000株に増加すると、MLPエージェントは環境に効果的に対応できない。
そこで我々は,CNN入力行列を生成するために,日次特徴ベクトルの最後の90日間のデータを結合するCNNエージェントを設計した。
広範な実験により,mlpベースのエージェントは初期環境設定に応じた損失を経験するが,設計したcnnは安定であり,環境を効果的に学習し,報酬の増大につながることが示された。
関連論文リスト
- Role-RL: Online Long-Context Processing with Role Reinforcement Learning for Distinct LLMs in Their Optimal Roles [13.64363652226897]
長いコンテキスト処理を持つ大規模言語モデル(LLM)は、実装の複雑さ、訓練効率、データの分散性のために、依然として難しい。
オンラインLong-Context Processing(OLP)は、無制限のドキュメントを処理する際に提案されるもので、通常は、自動ニュースレポーティング、ライブeコマース、バイラルショートビデオなどの多様なストリーミングメディアの情報受信と組織化に発生する。
また,OLPパイプライン内の各ロールに,実際の性能に応じて異なるLLMを自動デプロイする役割強化学習(Role-RL)を開発した。
論文 参考訳(メタデータ) (2024-09-26T16:22:59Z) - CNN-DRL with Shuffled Features in Finance [0.0]
深層強化学習における畳み込みニューラルネットワークエージェントの財務データへの適用により、報酬が強化された。
特徴ベクトルに特定の置換を適用したことにより、CNN行列を生成し、より関連する特徴を近接して戦略的に配置する。
論文 参考訳(メタデータ) (2024-01-16T14:46:28Z) - AgentBench: Evaluating LLMs as Agents [88.45506148281379]
大規模言語モデル(LLM)は、従来のNLPタスクを超えた現実的な実用的ミッションをターゲットとして、ますます賢く自律的になってきています。
我々は,現在8つの異なる環境からなるベンチマークであるAgentBenchを紹介し,LLM-as-Agentの推論と意思決定能力を評価する。
論文 参考訳(メタデータ) (2023-08-07T16:08:11Z) - Transferability of Convolutional Neural Networks in Stationary Learning
Tasks [96.00428692404354]
本稿では,大規模な空間問題に対する畳み込みニューラルネットワーク(CNN)の効率的なトレーニングのための新しいフレームワークを提案する。
このような信号の小さなウィンドウで訓練されたCNNは、再学習することなく、はるかに大きなウィンドウでほぼ性能を発揮することを示す。
以上の結果から,CNNは10人未満の訓練を受けた後,数百人のエージェントによる問題に対処できることが示唆された。
論文 参考訳(メタデータ) (2023-07-21T13:51:45Z) - Dynamic Datasets and Market Environments for Financial Reinforcement
Learning [68.11692837240756]
FinRL-Metaは、現実世界の市場からジムスタイルの市場環境へ動的データセットを処理するライブラリである。
我々は,ユーザが新しい取引戦略を設計するための足場として,人気のある研究論文を例示し,再現する。
また、ユーザが自身の結果を視覚化し、相対的なパフォーマンスを評価するために、このライブラリをクラウドプラットフォームにデプロイします。
論文 参考訳(メタデータ) (2023-04-25T22:17:31Z) - You can't pick your neighbors, or can you? When and how to rely on
retrieval in the $k$NN-LM [65.74934004876914]
Retrieval-enhanced Language Model (LM) は、大規模な外部データストアから取得したテキストにそれらの予測を条件付ける。
そのようなアプローチの1つ、$k$NN-LMは、既存のLMの予測を$k$-nearest近くのモデルの出力と補間する。
本研究では,2つの英語モデルデータセットに対するアプローチの有効性を実証的に測定する。
論文 参考訳(メタデータ) (2022-10-28T02:57:40Z) - MLPInit: Embarrassingly Simple GNN Training Acceleration with MLP
Initialization [51.76758674012744]
大きなグラフ上でグラフニューラルネットワーク(GNN)をトレーニングするのは複雑で、非常に時間がかかる。
我々は、PeerInitと呼ばれるGNNトレーニングアクセラレーションに対して、恥ずかしく単純だが非常に効果的な方法を提案する。
論文 参考訳(メタデータ) (2022-09-30T21:33:51Z) - Transformed CNNs: recasting pre-trained convolutional layers with
self-attention [17.96659165573821]
視覚変換器(ViT)は、畳み込みネットワーク(CNN)の強力な代替手段として登場した。
本研究では、これらレイヤを畳み込み層として初期化することによって、これらのレイヤのトレーニングに要する時間を短縮するアイデアについて検討する。
微調整は50回しか行われず、結果として得られたT-CNNの性能は著しく向上した。
論文 参考訳(メタデータ) (2021-06-10T14:56:10Z) - Deep learning for gravitational-wave data analysis: A resampling
white-box approach [62.997667081978825]
我々は、LIGO検出器からの単一干渉計データを用いて、畳み込みニューラルネットワーク(CNN)を用いて、コンパクトなバイナリコレッセンスにおける重力波(GW)信号を検出する。
CNNはノイズを検出するのに非常に正確だが、GW信号のリコールに十分な感度がないため、CNNはGWトリガの生成よりもノイズ低減に適している。
論文 参考訳(メタデータ) (2020-09-09T03:28:57Z) - Multi-modal Sentiment Analysis using Super Characters Method on
Low-power CNN Accelerator Device [14.746869920517653]
CNNドメイン特化加速器(CNN-DSA)は、低消費電力で低コストな大量生産を行っている。
本稿では,CNN-DSAにスーパーキャラクタ法を実装する。
論文 参考訳(メタデータ) (2020-01-28T05:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。