Fugu-MT 論文翻訳(概要): Optimal Market Making by Reinforcement Learning

論文の概要: Optimal Market Making by Reinforcement Learning

arxiv url: http://arxiv.org/abs/2104.04036v1
Date: Thu, 8 Apr 2021 20:13:21 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-12 13:54:30.155041
Title: Optimal Market Making by Reinforcement Learning
Title（参考訳）: 強化学習による最適市場作り
Authors: Matias Selser, Javier Kreiner, Manuel Maurette
Abstract要約: 古典的量的金融市場形成問題に強化学習アルゴリズムを適用する。 Deep Q-Learningアルゴリズムは最適なエージェントを復元する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We apply Reinforcement Learning algorithms to solve the classic quantitative finance Market Making problem, in which an agent provides liquidity to the market by placing buy and sell orders while maximizing a utility function. The optimal agent has to find a delicate balance between the price risk of her inventory and the profits obtained by capturing the bid-ask spread. We design an environment with a reward function that determines an order relation between policies equivalent to the original utility function. When comparing our agents with the optimal solution and a benchmark symmetric agent, we find that the Deep Q-Learning algorithm manages to recover the optimal agent.
Abstract（参考訳）: エージェントが商品の購入と販売の注文を最大化しながら市場に対して流動性を提供する古典的な量的金融市場形成問題を解決するために強化学習アルゴリズムを適用する。最適なエージェントは、在庫の価格リスクと入札の拡散を捉えた利益との微妙なバランスを見つけなければならない。我々は、元のユーティリティ関数に相当するポリシー間の順序関係を決定する報酬関数を持つ環境を設計する。エージェントを最適解とベンチマーク対称エージェントと比較すると、Deep Q-Learningアルゴリズムが最適なエージェントを回復できることがわかった。

関連論文リスト

Reinforcement Learning-Based Market Making as a Stochastic Control on Non-Stationary Limit Order Book Dynamics [0.0]
強化学習(Reinforcement Learning)は、適応型およびデータ駆動型戦略を開発するための有望なフレームワークとして登場した。本稿では,市場形成における強化学習エージェントの統合について考察する。
論文参考訳（メタデータ） (2025-09-15T21:08:13Z)
Learning to Lead: Incentivizing Strategic Agents in the Dark [50.93875404941184]
一般化プリンシパルエージェントモデルのオンライン学習バージョンについて検討する。この挑戦的な設定のための最初の証明可能なサンプル効率アルゴリズムを開発した。我々は、プリンシパルの最適ポリシーを学ぶために、ほぼ最適な $tildeO(sqrtT) $ regret bound を確立する。
論文参考訳（メタデータ） (2025-06-10T04:25:04Z)
Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文参考訳（メタデータ） (2025-03-27T17:34:25Z)
Joint Pricing and Resource Allocation: An Optimal Online-Learning Approach [20.70943884841438]
ネット全体の利益を最大化するために、価格と在庫を共同で決定するオンライン学習の地平について検討する。我々は,複数のOCO上での信頼境界戦略を利用した効率的なアルゴリズムを開発した。
論文参考訳（メタデータ） (2025-01-29T23:23:54Z)
Sequential Resource Trading Using Comparison-Based Gradient Estimation [21.23354615468778]
資源割り当てのシーケンシャルなトレーディングを、2つの合理的なエージェントが有限のカテゴリから逐次的にリソースを交換する環境で検討する。本稿では,提案エージェントが応答エージェントの勾配(参照)を推定し,事前の受け入れや拒絶の応答に基づいて提案を行うアルゴリズムを提案する。有限個の提案が連続的に拒否された後、応答剤は最適に近い状態にあるか、エージェントの勾配が密に一致しているかを示す。
論文参考訳（メタデータ） (2024-08-20T20:42:41Z)
Achieving Fairness in Multi-Agent Markov Decision Processes Using Reinforcement Learning [30.605881670761853]
有限水平エピソードMDPにおける公平性を実現するための強化学習手法を提案する。このようなアプローチは、エピソード数の観点から、サブ線形後悔を実現することを示す。
論文参考訳（メタデータ） (2023-06-01T03:43:53Z)
Approaching Collateral Optimization for NISQ and Quantum-Inspired Computing [0.0]
担保最適化(Collateral optimization)とは、債務又は担保取引を満たすための金融資産の体系的な配分を指す。一般的な目的の1つは、特定のトランザクションや取引ポートフォリオに関連するリスクを軽減するのに必要な担保コストを最小限にすることである。
論文参考訳（メタデータ） (2023-05-25T18:01:04Z)
Local Optimization Achieves Global Optimality in Multi-Agent Reinforcement Learning [139.53668999720605]
本稿では,各エージェントのローカルポリシーをバニラPPOと同様に更新するマルチエージェントPPOアルゴリズムを提案する。マルコフゲームにおける標準正則条件と問題依存量により、我々のアルゴリズムはサブリニアレートで大域的最適ポリシーに収束することを示す。
論文参考訳（メタデータ） (2023-05-08T16:20:03Z)
Learning to Incentivize Information Acquisition: Proper Scoring Rules Meet Principal-Agent Model [64.94131130042275]
インセンティブ付き情報取得問題について検討し、主治官がエージェントを雇って代理情報を収集する。 UCBアルゴリズムをモデルに適合させる,実証可能なサンプル効率の良いアルゴリズムを設計する。本アルゴリズムは,主役の最適利益に対する微妙な推定手順と,所望のエージェントの行動にインセンティブを与える保守的な補正手法を特徴とする。
論文参考訳（メタデータ） (2023-03-15T13:40:16Z)
Diversifying Investments and Maximizing Sharpe Ratio: a novel QUBO formulation [0.0]
本稿では,記述されたタスクに対する新しいQUBOの定式化を提案し,数学的詳細と必要な仮定を提供する。我々は、利用可能なQUBOソルバを用いて結果を得るとともに、この用語で大規模な問題に対処するハイブリッドアプローチの振る舞いについて議論する。
論文参考訳（メタデータ） (2023-02-23T19:15:44Z)
Towards Multi-Agent Reinforcement Learning driven Over-The-Counter Market Simulations [16.48389671789281]
オーバー・ザ・カウンタ市場において,流動性提供者と流動性取扱業者が相互作用するゲームについて検討した。互いに対戦することで、深層強化学習主体のエージェントは創発的な行動を学ぶ。遷移性仮定の下で,多エージェントポリシー勾配アルゴリズムの収束率を示す。
論文参考訳（メタデータ） (2022-10-13T17:06:08Z)
Learn to Match with No Regret: Reinforcement Learning in Markov Matching Markets [151.03738099494765]
我々は、市場の両側でプランナーと戦略エージェントのセットを含むマルコフマッチング市場について検討する。本稿では,楽観的な値反復と最大重みマッチングを組み合わせた強化学習フレームワークを提案する。我々は,アルゴリズムがサブ線形後悔を実現することを証明した。
論文参考訳（メタデータ） (2022-03-07T19:51:25Z)
Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文参考訳（メタデータ） (2021-06-05T09:16:28Z)
Universal Trading for Order Execution with Oracle Policy Distillation [99.57416828489568]
本稿では,不完全な市場状態と注文実行のための最適な行動シーケンスとのギャップを埋める,新たなユニバーサル取引ポリシー最適化フレームワークを提案する。本研究の枠組みは,完全情報を持つ託宣教師による実践的最適実行に向けて,共通政策の学習を指導する上で有効であることを示す。
論文参考訳（メタデータ） (2021-01-28T05:52:18Z)
Learning Strategies in Decentralized Matching Markets under Uncertain Preferences [91.3755431537592]
エージェントの選好が不明な場合,共有資源の不足の設定における意思決定の問題について検討する。我々のアプローチは、再生されたカーネルヒルベルト空間における好みの表現に基づいている。エージェントの期待した利益を最大化する最適な戦略を導出する。
論文参考訳（メタデータ） (2020-10-29T03:08:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。