論文の概要: Follow the Prophet: Accurate Online Conversion Rate Prediction in the
Face of Delayed Feedback
- arxiv url: http://arxiv.org/abs/2108.06167v1
- Date: Fri, 13 Aug 2021 10:51:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-16 16:57:52.583306
- Title: Follow the Prophet: Accurate Online Conversion Rate Prediction in the
Face of Delayed Feedback
- Title(参考訳): 預言者の追従:遅延したフィードバックの面における正確なオンライン変換率予測
- Authors: Haoming Li, Feiyang Pan, Xiang Ao, Zhao Yang, Min Lu, Junwei Pan,
Dapeng Liu, Lei Xiao, Qing He
- Abstract要約: 我々は,オンライン広告における遅延したフィードバック問題に対して,FTP(Following the Prophet)を用いて対処することを提案する。
オンライン学習中に預言者を得ることはできないが,集約政策により預言者の予測を予測できることが示されている。
実世界の3つの広告データセットに対する大規模な実験により、我々の手法は過去の最先端のベースラインよりも優れていることが示された。
- 参考スコア(独自算出の注目度): 18.610894358869253
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The delayed feedback problem is one of the imperative challenges in online
advertising, which is caused by the highly diversified feedback delay of a
conversion varying from a few minutes to several days. It is hard to design an
appropriate online learning system under these non-identical delay for
different types of ads and users. In this paper, we propose to tackle the
delayed feedback problem in online advertising by "Following the Prophet" (FTP
for short). The key insight is that, if the feedback came instantly for all the
logged samples, we could get a model without delayed feedback, namely the
"prophet". Although the prophet cannot be obtained during online learning, we
show that we could predict the prophet's predictions by an aggregation policy
on top of a set of multi-task predictions, where each task captures the
feedback patterns of different periods. We propose the objective and
optimization approach for the policy, and use the logged data to imitate the
prophet. Extensive experiments on three real-world advertising datasets show
that our method outperforms the previous state-of-the-art baselines.
- Abstract(参考訳): 遅延したフィードバック問題は、数分から数日の変換の高度に多様化したフィードバック遅延によって引き起こされるオンライン広告における必然的な課題の1つである。
異なるタイプの広告やユーザに対して、このような識別できない遅延の下で適切なオンライン学習システムを設計することは困難である。
本稿では,オンライン広告における遅延したフィードバック問題に対して,"Following the Prophet"(略してFTP)を用いて対処することを提案する。
重要な洞察は、ログされたすべてのサンプルに対して即座にフィードバックが得られた場合、遅延したフィードバック、すなわち"プロキシ"なしでモデルを得ることができます。
オンライン学習中に預言者を得ることはできないが、各タスクが異なる期間のフィードバックパターンをキャプチャするマルチタスク予測のセットの上に集約ポリシーを用いて、預言者の予測を予測することができることを示す。
我々は,ポリシーの目的と最適化のアプローチを提案し,ログデータを用いて預言者を模倣する。
3つの実世界の広告データセットに対する大規模な実験により、我々の手法は過去の最先端のベースラインよりも優れていた。
関連論文リスト
- Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation [67.88747330066049]
きめ細かいフィードバックは、画像の品質と迅速な調整におけるニュアンスドの区別を捉えます。
粗いフィードバックに対する優位性を示すことは、自動ではないことを示す。
きめ細かいフィードバックを抽出し活用する上で重要な課題を特定します。
論文 参考訳(メタデータ) (2024-06-24T17:19:34Z) - Third-Party Language Model Performance Prediction from Instruction [59.574169249307054]
言語モデルに基づく命令フォローシステムは、最近、多くのベンチマークタスクのパフォーマンスが向上している。
ユーザは、応答が正確かどうかを判断することなく、命令付きモデルを容易に促すことができる。
本稿では,タスク上での指示追従システムの評価から得られたメトリックを予測するために,別のモデルを訓練した第三者のパフォーマンス予測フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-19T03:53:47Z) - Direct Language Model Alignment from Online AI Feedback [78.40436231613754]
嗜好からの直接アライメント(DAP)手法は、人間フィードバックからの強化学習(RLHF)の効果的な代替手段として最近登場した。
本研究では,オンラインフィードバックが鍵であり,DAP法の改善を図っている。
オンラインAIフィードバック(OAIF)はLLMをアノテータとして使用し、トレーニング毎に現在のモデルから2つのレスポンスをサンプリングし、LLMアノテータにどちらが好まれるかを選択し、オンラインフィードバックを提供する。
論文 参考訳(メタデータ) (2024-02-07T12:31:13Z) - Performative Time-Series Forecasting [71.18553214204978]
我々は,機械学習の観点から,パフォーマンス時系列予測(PeTS)を定式化する。
本稿では,予測分布シフトに対する遅延応答の概念を活用する新しい手法であるFeature Performative-Shifting(FPS)を提案する。
新型コロナウイルスの複数の時系列モデルと交通予報タスクを用いた総合的な実験を行った。
論文 参考訳(メタデータ) (2023-10-09T18:34:29Z) - Generalized Delayed Feedback Model with Post-Click Information in
Recommender Systems [37.72697954740977]
クリック後のユーザ行動も変換率予測に有益であり,タイムラインの改善に有効であることを示す。
本稿では、クリック後の動作と初期変換の両方をクリック後の情報として統合する一般化遅延フィードバックモデル(GDFM)を提案する。
論文 参考訳(メタデータ) (2022-06-01T11:17:01Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Adaptive Experimentation with Delayed Binary Feedback [11.778924435036519]
本稿では,2値フィードバックの遅延目的に適した適応型実験法を提案する。
実際の目的を推定し、見積もりに基づいて変種を動的に割り当てる。
このソリューションは現在、JD.comのオンライン実験プラットフォームにデプロイされている。
論文 参考訳(メタデータ) (2022-02-02T01:47:10Z) - Multi-Agent Online Optimization with Delays: Asynchronicity, Adaptivity,
and Optimism [33.116006446428756]
遅延と非同期性を考慮したマルチエージェントオンライン学習問題の研究を行った。
エージェントレベルとネットワークレベルの両方で、最適な後悔の境界を持つ適応学習戦略を導き出します。
論文 参考訳(メタデータ) (2020-12-21T18:55:55Z) - Capturing Delayed Feedback in Conversion Rate Prediction via
Elapsed-Time Sampling [29.77426549280091]
コンバージョンレート(CVR)予測は、デジタルディスプレイ広告において最も重要なタスクの1つである。
Elapsed-Time Smpling Delayed Feedback Model (ES-DFM) を提案する。
論文 参考訳(メタデータ) (2020-12-06T12:20:50Z) - Dialogue Response Ranking Training with Large-Scale Human Feedback Data [52.12342165926226]
ソーシャルメディアのフィードバックデータを利用して、フィードバック予測のための大規模なトレーニングデータセットを構築します。
我々は,1300万対の人間のフィードバックデータに基づくGPT-2モデルであるDialogRPTを訓練した。
我々のランキングは、Redditのフィードバックを予測する上で、従来のダイアログの難易度ベースラインよりも優れています。
論文 参考訳(メタデータ) (2020-09-15T10:50:05Z) - A Feedback Shift Correction in Predicting Conversion Rates under Delayed
Feedback [6.38500614968955]
ディスプレイ広告では、広告を表示する価値を推定するために、変換率を予測することが不可欠である。
クリックと結果の変換の間には、比較的長い時間がかかる。
遅延したフィードバックのため、トレーニング期間中の肯定的なインスタンスには負のラベルが付けられている。
論文 参考訳(メタデータ) (2020-02-06T02:05:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。