論文の概要: Exploration with Model Uncertainty at Extreme Scale in Real-Time Bidding
- arxiv url: http://arxiv.org/abs/2208.01951v1
- Date: Wed, 3 Aug 2022 09:59:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-04 14:17:32.064935
- Title: Exploration with Model Uncertainty at Extreme Scale in Real-Time Bidding
- Title(参考訳): リアルタイム入札におけるモデル不確かさの探索
- Authors: Jan Hartman, Davorin Kopi\v{c}
- Abstract要約: リアルタイム入札における供給環境を探索するスケーラブルで効率的なシステムを提案する。
このシステムは、クリックスルー率の予測に使用されるモデルの予測不確実性に基づいて探索を指示する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we present a scalable and efficient system for exploring the
supply landscape in real-time bidding. The system directs exploration based on
the predictive uncertainty of models used for click-through rate prediction and
works in a high-throughput, low-latency environment. Through online A/B
testing, we demonstrate that exploration with model uncertainty has a positive
impact on model performance and business KPIs.
- Abstract(参考訳): 本研究では,リアルタイム入札における供給環境を探索するスケーラブルで効率的なシステムを提案する。
このシステムは、クリックスルー率予測に使用されるモデルの予測の不確実性に基づいて探索を指示し、高スループット、低レイテンシ環境で動作する。
オンラインA/Bテストを通じて、モデル不確実性による探索がモデルパフォーマンスとビジネスKPIに肯定的な影響を与えることを示す。
関連論文リスト
- A Utility-Mining-Driven Active Learning Approach for Analyzing Clickstream Sequences [21.38368444137596]
本研究では、SHAP値(HUSPM-SHAP)モデルを用いた高ユーティリティシーケンスパターンマイニングを提案する。
本研究は,電子商取引データ処理を改良し,より合理化され,コスト効率のよい予測モデルに向けたモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-10-09T10:44:02Z) - Learning Off-policy with Model-based Intrinsic Motivation For Active Online Exploration [15.463313629574111]
本稿では,連続制御タスクにおけるサンプル効率の高い探索手法について検討する。
本稿では,予測モデルと非政治学習要素を組み込んだRLアルゴリズムを提案する。
パラメーターのオーバーヘッドを発生させずに本質的な報酬を導き出す。
論文 参考訳(メタデータ) (2024-03-31T11:39:11Z) - COPlanner: Plan to Roll Out Conservatively but to Explore Optimistically
for Model-Based RL [50.385005413810084]
ダイナスタイルのモデルベース強化学習には、ポリシー学習と実環境探索のためのサンプルを生成するモデルロールアウトという2つのフェーズが含まれる。
$textttCOPlanner$は、不正確な学習された動的モデル問題に対処するモデルベースのメソッドのための計画駆動フレームワークである。
論文 参考訳(メタデータ) (2023-10-11T06:10:07Z) - A Bayesian Approach to Robust Inverse Reinforcement Learning [54.24816623644148]
我々は、オフラインモデルに基づく逆強化学習(IRL)に対するベイズ的アプローチを考える。
提案フレームワークは,専門家の報酬関数と環境力学の主観的モデルとを同時推定することにより,既存のオフラインモデルベースIRLアプローチとは異なる。
本分析は, 専門家が環境の高精度なモデルを持つと考えられる場合, 評価政策が堅牢な性能を示すという新たな知見を提示する。
論文 参考訳(メタデータ) (2023-09-15T17:37:09Z) - Exploring validation metrics for offline model-based optimisation with
diffusion models [50.404829846182764]
モデルベース最適化(MBO)では、マシンラーニングを使用して、(基底真理)オラクルと呼ばれるブラックボックス関数に対する報酬の尺度を最大化する候補を設計することに興味があります。
モデル検証中に基底オラクルに対する近似をトレーニングし、その代わりに使用することができるが、その評価は近似的であり、敵の例に対して脆弱である。
本手法は,外挿量を測定するために提案した評価フレームワークにカプセル化されている。
論文 参考訳(メタデータ) (2022-11-19T16:57:37Z) - Adversarial Gradient Driven Exploration for Deep Click-Through Rate
Prediction [39.61776002290324]
textbfAdrial textbfGradientversa Driven textbfExploration (AGE) と呼ばれる新しい探索手法を提案する。
AGEは勾配更新プロセスをシミュレートし、モデルに対する探索項目のサンプルの影響を近似することができる。
本手法の有効性を,オープンアクセス学術データセットで実証した。
論文 参考訳(メタデータ) (2021-12-21T12:13:07Z) - Sample-Efficient Reinforcement Learning via Conservative Model-Based
Actor-Critic [67.00475077281212]
モデルベース強化学習アルゴリズムは、モデルフリーのアルゴリズムよりもサンプル効率が高い。
本稿では,精度の高い学習モデルに強く依存することなく,高いサンプル効率を実現する新しい手法を提案する。
CMBACは,いくつかの課題に対して,サンプル効率の点で最先端のアプローチを著しく上回ることを示す。
論文 参考訳(メタデータ) (2021-12-16T15:33:11Z) - Arbitrary Distribution Modeling with Censorship in Real-Time Bidding
Advertising [2.562910030418378]
インベントリプライシングの目的は、オンライン広告の機会に適切な価格を入札することであり、これはデマンド・サイド・プラットフォーム(DSP)がリアルタイム入札(RTB)で競売に勝つために不可欠である。
以前の作品の多くは、勝利価格の分布形式を強く仮定し、その正確さを減らし、一般化する能力を弱めた。
我々は,新たな損失関数であるNLL(Neighborhood Likelihood Loss)を提案し,検閲下での勝利価格分布を予測するためのフレームワークであるArbitrary Distribution Modeling(ADM)と協調する。
論文 参考訳(メタデータ) (2021-10-26T11:40:00Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z) - VAE-LIME: Deep Generative Model Based Approach for Local Data-Driven
Model Interpretability Applied to the Ironmaking Industry [70.10343492784465]
モデル予測だけでなく、その解釈可能性も、プロセスエンジニアに公開する必要があります。
LIMEに基づくモデルに依存しない局所的解釈可能性ソリューションが最近出現し、元の手法が改良された。
本稿では, 燃焼炉で生成する高温金属の温度を推定するデータ駆動型モデルの局所的解釈可能性に関する新しいアプローチ, VAE-LIMEを提案する。
論文 参考訳(メタデータ) (2020-07-15T07:07:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。