論文の概要: Generative Regression Based Watch Time Prediction for Video Recommendation: Model and Performance
- arxiv url: http://arxiv.org/abs/2412.20211v1
- Date: Sat, 28 Dec 2024 16:48:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:05:31.603703
- Title: Generative Regression Based Watch Time Prediction for Video Recommendation: Model and Performance
- Title(参考訳): 映像レコメンデーションのための生成的回帰に基づく時計時間予測:モデルと性能
- Authors: Hongxu Ma, Kai Tian, Tao Zhang, Xuefeng Zhang, Chunjie Chen, Han Li, Jihong Guan, Shuigeng Zhou,
- Abstract要約: ショートビデオレコメンデーションシステムにおいて、時計時間予測(WTP)が重要な課題として浮上している。
シーケンス生成に基づくWTPのための新しい生成回帰(GR)パラダイムを提案する。
4つの公開データセットと1つの産業データセットに対する最先端アプローチに対して,本手法の評価を行った。
- 参考スコア(独自算出の注目度): 35.33333441236041
- License:
- Abstract: Watch time prediction (WTP) has emerged as a pivotal task in short video recommendation systems, designed to encapsulate user interests. Predicting users' watch times on videos often encounters challenges, including wide value ranges and imbalanced data distributions, which can lead to significant bias when directly regressing watch time. Recent studies have tried to tackle these issues by converting the continuous watch time estimation into an ordinal classification task. While these methods are somewhat effective, they exhibit notable limitations. Inspired by language modeling, we propose a novel Generative Regression (GR) paradigm for WTP based on sequence generation. This approach employs structural discretization to enable the lossless reconstruction of original values while maintaining prediction fidelity. By formulating the prediction problem as a numerical-to-sequence mapping, and with meticulously designed vocabulary and label encodings, each watch time is transformed into a sequence of tokens. To expedite model training, we introduce the curriculum learning with an embedding mixup strategy which can mitigate training-and-inference inconsistency associated with teacher forcing. We evaluate our method against state-of-the-art approaches on four public datasets and one industrial dataset. We also perform online A/B testing on Kuaishou, a leading video app with about 400 million DAUs, to demonstrate the real-world efficacy of our method. The results conclusively show that GR outperforms existing techniques significantly. Furthermore, we successfully apply GR to another regression task in recommendation systems, i.e., Lifetime Value (LTV) prediction, which highlights its potential as a novel and effective solution to general regression challenges.
- Abstract(参考訳): ユーザの興味をカプセル化するショートビデオレコメンデーションシステムにおいて、ウォッチタイム予測(WTP)が重要なタスクとして登場した。
ビデオ上でのユーザの監視時間を予測することは、広範囲の値範囲や不均衡なデータ配信など、しばしば課題に直面する。
最近の研究は、連続時計時間推定を正規分類タスクに変換することによって、これらの課題に対処しようとしている。
これらの方法は幾分効果があるが、顕著な限界がある。
言語モデリングに触発されて、シーケンス生成に基づくWTPのための新しい生成回帰(GR)パラダイムを提案する。
このアプローチでは、予測忠実性を維持しながら、元の値のロスレス再構成を可能にするために、構造的離散化を用いる。
予測問題を数値列マッピングとして定式化し、巧妙に設計された語彙とラベルエンコーディングにより、各時計時刻を一連のトークンに変換する。
モデルトレーニングの迅速化を目的として,教師の強制にかかわるトレーニングと推論の不整合を軽減できる組込み混合戦略によるカリキュラム学習を紹介する。
4つの公開データセットと1つの産業データセットに対する最先端アプローチに対して,本手法の評価を行った。
また,約4億DAUの動画アプリであるKuaishou上でオンラインA/Bテストを実施し,本手法の実際の有効性を実証した。
その結果,GRは既存の技術よりも優れた性能を示した。
さらに,リコメンデーションシステムにおける他のレグレッションタスク,すなわちライフタイムバリュー(LTV)予測にGRを適用することに成功し,一般的なレグレッション課題に対する新規かつ効果的な解決策としての可能性を強調した。
関連論文リスト
- Enhancing Consistency and Mitigating Bias: A Data Replay Approach for
Incremental Learning [100.7407460674153]
ディープラーニングシステムは、一連のタスクから学ぶとき、破滅的な忘れがちだ。
問題を緩和するため、新しいタスクを学ぶ際に経験豊富なタスクのデータを再生する手法が提案されている。
しかし、メモリ制約やデータプライバシーの問題を考慮すると、実際には期待できない。
代替として、分類モデルからサンプルを反転させることにより、データフリーなデータ再生法を提案する。
論文 参考訳(メタデータ) (2024-01-12T12:51:12Z) - Performative Time-Series Forecasting [71.18553214204978]
我々は,機械学習の観点から,パフォーマンス時系列予測(PeTS)を定式化する。
本稿では,予測分布シフトに対する遅延応答の概念を活用する新しい手法であるFeature Performative-Shifting(FPS)を提案する。
新型コロナウイルスの複数の時系列モデルと交通予報タスクを用いた総合的な実験を行った。
論文 参考訳(メタデータ) (2023-10-09T18:34:29Z) - Explainable Parallel RCNN with Novel Feature Representation for Time
Series Forecasting [0.0]
時系列予測はデータサイエンスにおける根本的な課題である。
RNNとCNNを組み合わせた並列ディープラーニングフレームワークを開発した。
3つのデータセットに対する大規模な実験により,本手法の有効性が明らかとなった。
論文 参考訳(メタデータ) (2023-05-08T17:20:13Z) - Ti-MAE: Self-Supervised Masked Time Series Autoencoders [16.98069693152999]
本稿では,Ti-MAEという新しいフレームワークを提案する。
Ti-MAEは、埋め込み時系列データをランダムにマスクアウトし、オートエンコーダを学び、ポイントレベルでそれらを再構築する。
いくつかの公開実世界のデータセットの実験では、マスク付きオートエンコーディングのフレームワークが生データから直接強力な表現を学習できることが示されている。
論文 参考訳(メタデータ) (2023-01-21T03:20:23Z) - Retrieval Based Time Series Forecasting [37.48394754614059]
時系列データは、スマートトランスポートや環境モニタリングなど、さまざまなアプリケーションに現れる。
時系列解析の基本的な問題の1つは時系列予測である。
理論的にも実証的にも,関連する時系列を参照として検索することで,不確実性を効果的に低減できることを示す。
論文 参考訳(メタデータ) (2022-09-27T16:43:55Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Meta-Forecasting by combining Global DeepRepresentations with Local
Adaptation [12.747008878068314]
メタグローバルローカル自動回帰(Meta-GLAR)と呼ばれる新しい予測手法を導入する。
それは、リカレントニューラルネットワーク(RNN)によって生成された表現からワンステップアヘッド予測へのマッピングをクローズドフォームで学習することで、各時系列に適応する。
本手法は,先行研究で報告されたサンプル外予測精度において,最先端の手法と競合する。
論文 参考訳(メタデータ) (2021-11-05T11:45:02Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Remaining Useful Life Estimation Under Uncertainty with Causal GraphNets [0.0]
時系列モデルの構築とトレーニングのための新しいアプローチを提案する。
提案手法は,非定常時系列の予測モデル構築に適している。
論文 参考訳(メタデータ) (2020-11-23T21:28:03Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。