論文の概要: Recurrent Neural Networks for Stochastic Control in Real-Time Bidding
- arxiv url: http://arxiv.org/abs/2006.07042v1
- Date: Fri, 12 Jun 2020 09:53:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 03:26:50.698453
- Title: Recurrent Neural Networks for Stochastic Control in Real-Time Bidding
- Title(参考訳): リアルタイムバイディングにおける確率制御のための繰り返しニューラルネットワーク
- Authors: Nicolas Grislain, Nicolas Perrin and Antoine Thabault
- Abstract要約: 本稿では,リカレントニューラルネットワークアーキテクチャに基づく近似解を提案する。
RNNの入札者は、目標を逃すのを避けるために必要な全てを規定する。
また、失ったインプレッションを買えば、それが到達しなかった場合のペナルティよりもコストがかかる場合、意図的に目標を達成できない。
- 参考スコア(独自算出の注目度): 11.380399473799034
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bidding in real-time auctions can be a difficult stochastic control task;
especially if underdelivery incurs strong penalties and the market is very
uncertain. Most current works and implementations focus on optimally delivering
a campaign given a reasonable forecast of the market. Practical implementations
have a feedback loop to adjust and be robust to forecasting errors, but no
implementation, to the best of our knowledge, uses a model of market risk and
actively anticipates market shifts. Solving such stochastic control problems in
practice is actually very challenging. This paper proposes an approximate
solution based on a Recurrent Neural Network (RNN) architecture that is both
effective and practical for implementation in a production environment. The RNN
bidder provisions everything it needs to avoid missing its goal. It also
deliberately falls short of its goal when buying the missing impressions would
cost more than the penalty for not reaching it.
- Abstract(参考訳): リアルタイムオークションでの入札は、特に過度の配達が厳しい罰則をもたらし、市場が極めて不確実な場合に、難しい確率的制御課題となる可能性がある。
現在の作業や実装のほとんどは、市場に対する合理的な予測に基づいて、キャンペーンを最適に提供することに焦点を当てている。
実用的な実装には、調整とエラー予測に堅牢なフィードバックループがありますが、私たちの知る限りでは、市場リスクのモデルを使用しており、市場の変化を積極的に予測する実装はありません。
このような確率的制御問題を実際に解決することは、非常に難しい。
本稿では,実運用環境における実装に有効かつ実用的なRNNアーキテクチャに基づく近似解を提案する。
RNNの入札者は、目標を逃すのを避けるために必要な全てを規定する。
また、欠落したインプレッションを購入するのにペナルティ以上のコストがかかる場合、意図的に目標に届かない。
関連論文リスト
- MCI-GRU: Stock Prediction Model Based on Multi-Head Cross-Attention and Improved GRU [15.232546605091818]
本稿では,多頭部クロスアテンション機構と改良型GRUに基づくストック予測モデルMCI-GRUを提案する。
4つの主要株式市場での実験では、提案手法は複数の指標でSOTA技術を上回っている。
論文 参考訳(メタデータ) (2024-09-25T14:37:49Z) - Improving Sequential Market Clearing via Value-oriented Renewable Energy Forecasting [3.0665531066360066]
再生可能エネルギー源(RES)の大規模な浸透は、電力市場に大きな不確実性をもたらす。
本稿では,日頭市場に参入するRESの生成を戦術的に決定する価値指向予測手法を提案する。
論文 参考訳(メタデータ) (2024-05-15T00:04:08Z) - STBA: Towards Evaluating the Robustness of DNNs for Query-Limited Black-box Scenario [50.37501379058119]
本研究では,クエリ制限シナリオにおいて,悪意のある逆の例を作成するために,空間変換ブラックボックス攻撃(STBA)を提案する。
そこで本研究では,STBAが対向例の認識不能性を効果的に改善し,クエリ制限条件下での攻撃成功率を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-03-30T13:28:53Z) - Deep Hedging with Market Impact [0.20482269513546458]
本稿では,Deep Reinforcement Learning(DRL)に基づく新しい市場インパクト動的ヘッジモデルを提案する。
DRLモデルから得られた最適ポリシーは、いくつかのオプションヘッジシミュレーションを用いて分析され、デルタヘッジのような一般的な手順と比較される。
論文 参考訳(メタデータ) (2024-02-20T19:08:24Z) - RAGIC: Risk-Aware Generative Adversarial Model for Stock Interval
Construction [4.059196561157555]
既存の予測アプローチの多くは、効果的な意思決定に必要な深さを欠いて、単一ポイントの予測に焦点を当てている。
本稿では,不確実性をより効果的に定量化するために,ストック間隔予測のためのシーケンス生成を導入するRAGICを提案する。
RAGICのジェネレータには、情報投資家のリスク認識をキャプチャするリスクモジュールと、歴史的価格動向と季節性を考慮した時間モジュールが含まれている。
論文 参考訳(メタデータ) (2024-02-16T15:34:07Z) - Cryptocurrency Portfolio Optimization by Neural Networks [81.20955733184398]
本稿では,これらの投資商品を活用するために,ニューラルネットワークに基づく効果的なアルゴリズムを提案する。
シャープ比を最大化するために、各アセットの割り当て重量を時間間隔で出力するディープニューラルネットワークを訓練する。
ネットワークの特定の資産に対するバイアスを規制する新たな損失項を提案し,最小分散戦略に近い割り当て戦略をネットワークに学習させる。
論文 参考訳(メタデータ) (2023-10-02T12:33:28Z) - Diffusion Variational Autoencoder for Tackling Stochasticity in
Multi-Step Regression Stock Price Prediction [54.21695754082441]
長期的地平線上での多段階の株価予測は、ボラティリティの予測に不可欠である。
多段階の株価予測に対する現在の解決策は、主に単一段階の分類に基づく予測のために設計されている。
深層階層型変分オートコーダ(VAE)と拡散確率的手法を組み合わせてセック2seqの株価予測を行う。
本モデルでは, 予測精度と分散性の観点から, 最先端の解よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-18T16:21:15Z) - Augmented Bilinear Network for Incremental Multi-Stock Time-Series
Classification [83.23129279407271]
本稿では,有価証券のセットで事前学習したニューラルネットワークで利用可能な知識を効率的に保持する手法を提案する。
本手法では,既存の接続を固定することにより,事前学習したニューラルネットワークに符号化された事前知識を維持する。
この知識は、新しいデータを用いて最適化された一連の拡張接続によって、新しい証券に対して調整される。
論文 参考訳(メタデータ) (2022-07-23T18:54:10Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - S2-BNN: Bridging the Gap Between Self-Supervised Real and 1-bit Neural
Networks via Guided Distribution Calibration [74.5509794733707]
本研究では, 実数値から, 最終予測分布上のバイナリネットワークへの誘導型学習パラダイムを提案する。
提案手法は,bnn上で5.515%の絶対利得で,単純なコントラスト学習ベースラインを向上できる。
提案手法は、単純なコントラスト学習ベースラインよりも大幅に改善され、多くの主流教師付きBNN手法に匹敵する。
論文 参考訳(メタデータ) (2021-02-17T18:59:28Z) - Hedging using reinforcement learning: Contextual $k$-Armed Bandit versus
$Q$-learning [0.22940141855172028]
本稿では,リスクと市場摩擦の存在下での連関債権の複製戦略の構築について検討する。
本稿では、ヘッジ問題はリスク・アバース文脈における$k$-armed bandit問題の例と見なされる。
私たちは、$k$の武器付きバンディットモデルが、ヘッジの利益と損失の定式化に自然に適合していることに気付きました。
論文 参考訳(メタデータ) (2020-07-03T11:34:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。