論文の概要: Generative Market Equilibrium Models with Stable Adversarial Learning via Reinforcement
- arxiv url: http://arxiv.org/abs/2504.04300v1
- Date: Sat, 05 Apr 2025 23:29:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:08:49.344278
- Title: Generative Market Equilibrium Models with Stable Adversarial Learning via Reinforcement
- Title(参考訳): 強化による安定な逆学習を伴う市場均衡モデル
- Authors: Anastasis Kratsios, Xiaofei Shi, Qiang Sun, Zhanhao Zhang,
- Abstract要約: 我々は、最小限のモデリング仮定の下で、継続的金融市場均衡を解くための一般的な計算フレームワークを提案する。
GAN(Generative Adversarial Network)に触発された本手法では,新たな生成的深層強化学習フレームワークを採用する。
我々のアルゴリズムは、学習するだけでなく、市場参加者の内在的な取引行動から資産の返却とボラティリティがどのように出現するかを検証可能な予測も提供する。
- 参考スコア(独自算出の注目度): 10.35300946640037
- License:
- Abstract: We present a general computational framework for solving continuous-time financial market equilibria under minimal modeling assumptions while incorporating realistic financial frictions, such as trading costs, and supporting multiple interacting agents. Inspired by generative adversarial networks (GANs), our approach employs a novel generative deep reinforcement learning framework with a decoupling feedback system embedded in the adversarial training loop, which we term as the \emph{reinforcement link}. This architecture stabilizes the training dynamics by incorporating feedback from the discriminator. Our theoretically guided feedback mechanism enables the decoupling of the equilibrium system, overcoming challenges that hinder conventional numerical algorithms. Experimentally, our algorithm not only learns but also provides testable predictions on how asset returns and volatilities emerge from the endogenous trading behavior of market participants, where traditional analytical methods fall short. The design of our model is further supported by an approximation guarantee.
- Abstract(参考訳): 本稿では、取引コストなどの現実的な金融摩擦を取り入れつつ、最小限のモデリング仮定の下で、継続的な金融市場均衡を解決するための一般的な計算枠組みについて述べる。
本手法はGAN(Generative Adversarial Network)にインスパイアされた,逆行訓練ループにデカップリングフィードバックを組み込んだ,新しい生成的深層強化学習フレームワークを応用し,これを「emph{reinforcement link}」と呼ぶ。
このアーキテクチャは、識別器からのフィードバックを取り入れることで、トレーニングのダイナミクスを安定化する。
理論的に導かれたフィードバック機構は平衡系の疎結合を可能にし,従来の数値アルゴリズムを阻害する課題を克服する。
実験では, 従来の分析手法が不十分な市場参加者の内在的取引行動から, 資産の返却やボラティリティの出現について, 検証可能な予測を行う。
モデルの設計は近似保証によってさらに支持される。
関連論文リスト
- Robot See, Robot Do: Imitation Reward for Noisy Financial Environments [0.0]
本稿では,模倣学習を活用することによって,より新しい,より堅牢な報酬関数を提案する。
モデルフリー強化学習アルゴリズムにおいて,再現性(エキスパートの)フィードバックと強化性(エージェントの)フィードバックを統合する。
実証的な結果は、この新しいアプローチが従来のベンチマークと比較すると、財務パフォーマンスの指標を改善することを示している。
論文 参考訳(メタデータ) (2024-11-13T14:24:47Z) - Hamiltonian Neural Networks for Robust Out-of-Time Credit Scoring [0.5439020425819]
本稿では,クラス不均衡と時間外予測問題に対処するためにニューラルネットワークを用いた新しいクレジットスコアリング手法を提案する。
我々はハミルトン力学にインスパイアされた特定の損失関数を開発し、信用リスクのダイナミクスをよりよく捉えた。
論文 参考訳(メタデータ) (2024-10-14T06:08:26Z) - Deviations from the Nash equilibrium and emergence of tacit collusion in a two-player optimal execution game with reinforcement learning [0.9208007322096533]
2つの自律的エージェントが市場の影響下で同じ資産を最適に清算することを学習するシナリオについて検討する。
その結果,エージェントが学んだ戦略は,対応する市場影響ゲームのナッシュ均衡から大きく逸脱していることがわかった。
市場のボラティリティの異なるレベルがエージェントのパフォーマンスと彼らが発見する均衡にどのように影響するかを考察する。
論文 参考訳(メタデータ) (2024-08-21T16:54:53Z) - On the Complexity of Adversarial Decision Making [101.14158787665252]
決定推定係数は, 相手の意思決定に対する後悔度を低く抑えるのに必要であり, 十分であることを示す。
我々は、決定推定係数を他のよく知られた複雑性尺度の変種に結びつける新しい構造結果を提供する。
論文 参考訳(メタデータ) (2022-06-27T06:20:37Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - Federated Learning with Unreliable Clients: Performance Analysis and
Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。
しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。
クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文 参考訳(メタデータ) (2021-05-10T08:02:27Z) - Adaptive learning for financial markets mixing model-based and
model-free RL for volatility targeting [0.0]
モデルフリー強化学習は安定した環境において有意義な成果を上げてきたが、今日でも金融市場のような環境の変化に問題がある。
モデルフリーな深層強化学習により,様々なモデルベースアプローチを選択することで,この2つの手法のベストを組み合わせることを提案する。
論文 参考訳(メタデータ) (2021-04-19T19:20:22Z) - On the model-based stochastic value gradient for continuous
reinforcement learning [50.085645237597056]
モデルベースエージェントは,サンプル効率と最終報酬の両方の観点から,最先端のモデルフリーエージェントより優れていることを示す。
以上の結果から,モデルに基づく政策評価がより注目に値することが示唆された。
論文 参考訳(メタデータ) (2020-08-28T17:58:29Z) - Adversarial Attacks on Machine Learning Systems for High-Frequency
Trading [55.30403936506338]
逆機械学習の観点から,アルゴリズム取引のバリュエーションモデルについて検討する。
攻撃コストを最小限に抑えるサイズ制約で、このドメインに特有の新たな攻撃を導入する。
本稿では、金融モデルのロバスト性について研究・評価するための分析ツールとして、これらの攻撃がどのように利用できるかについて論じる。
論文 参考訳(メタデータ) (2020-02-21T22:04:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。