論文の概要: Adversarial Gradient Driven Exploration for Deep Click-Through Rate
Prediction
- arxiv url: http://arxiv.org/abs/2112.11136v1
- Date: Tue, 21 Dec 2021 12:13:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 14:43:15.861027
- Title: Adversarial Gradient Driven Exploration for Deep Click-Through Rate
Prediction
- Title(参考訳): ディープクリックスルー率予測のための逆勾配駆動探索
- Authors: Kailun Wu, Weijie Bian, Zhangming Chan, Lejian Ren, Shiming Xiang,
Shuguang Han, Hongbo Deng, Bo Zheng
- Abstract要約: textbfAdrial textbfGradientversa Driven textbfExploration (AGE) と呼ばれる新しい探索手法を提案する。
AGEは勾配更新プロセスをシミュレートし、モデルに対する探索項目のサンプルの影響を近似することができる。
本手法の有効性を,オープンアクセス学術データセットで実証した。
- 参考スコア(独自算出の注目度): 39.61776002290324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, data-driven deep neural models have already shown remarkable
progress on Click-through Rate (CTR) prediction. Unfortunately, the
effectiveness of such models may fail when there are insufficient data. To
handle this issue, researchers often adopt exploration strategies to examine
items based on the estimated reward, e.g., UCB or Thompson Sampling. In the
context of Exploitation-and-Exploration for CTR prediction, recent studies have
attempted to utilize the prediction uncertainty along with model prediction as
the reward score. However, we argue that such an approach may make the final
ranking score deviate from the original distribution, and thereby affect model
performance in the online system. In this paper, we propose a novel exploration
method called \textbf{A}dversarial \textbf{G}radient Driven
\textbf{E}xploration (AGE). Specifically, we propose a Pseudo-Exploration
Module to simulate the gradient updating process, which can approximate the
influence of the samples of to-be-explored items for the model. In addition,
for better exploration efficiency, we propose an Dynamic Threshold Unit to
eliminate the effects of those samples with low potential CTR. The
effectiveness of our approach was demonstrated on an open-access academic
dataset. Meanwhile, AGE has also been deployed in a real-world display
advertising platform and all online metrics have been significantly improved.
- Abstract(参考訳): 現在、データ駆動型ディープニューラルモデルはすでにクリックスルー率(ctr)の予測において顕著な進歩を示している。
残念ながら、データ不足時にそのようなモデルの有効性は失敗する可能性がある。
この問題に対処するために、研究者はしばしば、UCBやトンプソンサンプリングといった推定報酬に基づいてアイテムを調べるための探索戦略を採用する。
近年,CTR予測における爆発・探査の文脈において,予測の不確実性とモデル予測を報奨スコアとして活用しようと試みている。
しかし、このような手法は、最終的なランキングスコアを元の分布から逸脱させ、オンラインシステムにおけるモデル性能に影響を及ぼす可能性がある。
本稿では,新しい探索手法である \textbf{A}dversarial \textbf{G}radient Driven \textbf{E}xploration (AGE)を提案する。
具体的には,モデルに対するto-be-explored項目のサンプルの影響を近似する勾配更新プロセスをシミュレートする擬似爆発モジュールを提案する。
さらに, 探索効率を向上させるために, 低電位ctrの試料の影響を除去できる動的しきい値ユニットを提案する。
本手法の有効性をオープンアクセス学術データセットで実証した。
一方、AGEは現実世界のディスプレイ広告プラットフォームにもデプロイされており、オンラインの指標も大幅に改善されている。
関連論文リスト
- Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Distribution Learning for Molecular Regression [10.96062816455682]
Distributional Mixture of Experts (DMoE) はモデルに依存しない、データに依存しない回帰法である。
分子特性予測データセットを用いたDMoEの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-30T00:21:51Z) - Learning Off-policy with Model-based Intrinsic Motivation For Active Online Exploration [15.463313629574111]
本稿では,連続制御タスクにおけるサンプル効率の高い探索手法について検討する。
本稿では,予測モデルと非政治学習要素を組み込んだRLアルゴリズムを提案する。
パラメーターのオーバーヘッドを発生させずに本質的な報酬を導き出す。
論文 参考訳(メタデータ) (2024-03-31T11:39:11Z) - Conditional Unscented Autoencoders for Trajectory Prediction [13.121738145903532]
CVAEはADの軌道予測において最も広く使われているモデルの一つである。
CVAEの基礎となるVAEの空間における最近の進歩を利用して,サンプリング手順の簡単な変更が性能に大きな恩恵をもたらすことを示す。
CelebAデータセット上の画像モデリングのタスクだけでなく、InterAction予測データセット上で評価することで、我々のモデルの幅広い適用性を示す。
論文 参考訳(メタデータ) (2023-10-30T18:59:32Z) - A positive feedback method based on F-measure value for Salient Object
Detection [1.9249287163937976]
本稿では,SODに対するF値に基づく正のフィードバック手法を提案する。
提案手法は,画像を検出して既存のモデルに入力し,それぞれの予測マップを取得する。
5つの公開データセットに対する実験結果から,提案手法の正のフィードバックは,5つの評価指標において最新の12の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-28T04:05:13Z) - Generative Causal Representation Learning for Out-of-Distribution Motion
Forecasting [13.99348653165494]
本稿では,分散シフト下での知識伝達を容易にするための生成因果学習表現を提案する。
ヒトの軌道予測モデルにおいて提案手法の有効性を評価する一方、GCRLは他の領域にも適用可能である。
論文 参考訳(メタデータ) (2023-02-17T00:30:44Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - Incorporating Causal Graphical Prior Knowledge into Predictive Modeling
via Simple Data Augmentation [92.96204497841032]
因果グラフ(CG)は、データ分散の背後にあるデータ生成プロセスの知識のコンパクトな表現である。
本研究では,条件付き独立性(CI)関係の事前知識を活用可能なモデルに依存しないデータ拡張手法を提案する。
本手法は,小データシステムにおける予測精度の向上に有効であることを実験的に示した。
論文 参考訳(メタデータ) (2021-02-27T06:13:59Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。