論文の概要: Distribution-Aware End-to-End Embedding for Streaming Numerical Features in Click-Through Rate Prediction
- arxiv url: http://arxiv.org/abs/2602.03223v1
- Date: Tue, 03 Feb 2026 07:50:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.317856
- Title: Distribution-Aware End-to-End Embedding for Streaming Numerical Features in Click-Through Rate Prediction
- Title(参考訳): クリックスルー速度予測における数値特徴のストリーム化のための分布対応エンド・ツー・エンド埋め込み
- Authors: Jiahao Liu, Hongji Ruan, Weimin Zhang, Ziye Tong, Derick Tang, Zhanpeng Zeng, Qinsong Zeng, Peng Zhang, Tun Lu, Ning Gu,
- Abstract要約: 本稿では,ストリーミング環境におけるClick-Through Rate予測に有効な数値的特徴埋め込みについて検討する。
本稿では,ストリーミング学習シナリオに数値的特徴埋め込みを組み込むためのエンドツーエンドフレームワークであるDAESを提案する。
- 参考スコア(独自算出の注目度): 29.97246591569267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper explores effective numerical feature embedding for Click-Through Rate prediction in streaming environments. Conventional static binning methods rely on offline statistics of numerical distributions; however, this inherently two-stage process often triggers semantic drift during bin boundary updates. While neural embedding methods enable end-to-end learning, they often discard explicit distributional information. Integrating such information end-to-end is challenging because streaming features often violate the i.i.d. assumption, precluding unbiased estimation of the population distribution via the expectation of order statistics. Furthermore, the critical context dependency of numerical distributions is often neglected. To this end, we propose DAES, an end-to-end framework designed to tackle numerical feature embedding in streaming training scenarios by integrating distributional information with an adaptive modulation mechanism. Specifically, we introduce an efficient reservoir-sampling-based distribution estimation method and two field-aware distribution modulation strategies to capture streaming distributions and field-dependent semantics. DAES significantly outperforms existing approaches as demonstrated by extensive offline and online experiments and has been fully deployed on a leading short-video platform with hundreds of millions of daily active users.
- Abstract(参考訳): 本稿では,ストリーミング環境におけるClick-Through Rate予測に有効な数値的特徴埋め込みについて検討する。
従来の静的ビンニング法は、数値分布のオフライン統計に依存するが、本質的にこの2段階のプロセスはビン境界更新時に意味的なドリフトを引き起こすことが多い。
ニューラルネットワークはエンドツーエンドの学習を可能にするが、明示的な分布情報を捨てることが多い。
このような情報をエンドツーエンドに統合することは困難である。なぜなら、ストリーミング機能は、注文統計の予測による人口分布の偏りのない推定を前もって、しばしばi.d.の仮定に反するからである。
さらに、数値分布の臨界文脈依存性は無視されることが多い。
そこで本研究では,配信情報を適応変調機構と統合することにより,ストリーミングトレーニングシナリオに数値的特徴埋め込みを組み込むためのエンドツーエンドフレームワークであるDAESを提案する。
具体的には,効率的な貯水池型分布推定手法と2つのフィールド対応分布変調手法を導入し,ストリーミング分布とフィールド依存セマンティクスをキャプチャする。
DAESは、大規模なオフラインおよびオンライン実験によって実証されたように、既存のアプローチよりも大幅に優れており、毎日数億人のアクティブユーザがいる主要なショートビデオプラットフォームに完全にデプロイされている。
関連論文リスト
- Conformal Prediction for Multi-Source Detection on a Network [59.17729745907474]
マルチソース検出問題について検討する。
グラフ上のノード感染状況のスナップショットが与えられた場合、伝播を開始するソースノードのセットを推定する。
本稿では,ソースセット検出のための統計的に有効なリコール保証を提供する新しいコンフォメーション予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-12T01:09:56Z) - Beyond Quantity: Distribution-Aware Labeling for Visual Grounding [72.43984105242177]
視覚的な接地には、大きく多様な領域テキストペアが必要である。
既存の擬似ラベルパイプラインは、しばしばバイアス分布に適合する。
視覚的グラウンドティングのための分布認識型ラベリングフレームワークであるDALを提案する。
論文 参考訳(メタデータ) (2025-05-30T09:04:47Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - Uncertainty Quantification via Stable Distribution Propagation [60.065272548502]
本稿では,ニューラルネットワークによる安定確率分布の伝播手法を提案する。
提案手法は局所線形化に基づいており,ReLU非線型性に対する全変動距離の近似値として最適であることを示す。
論文 参考訳(メタデータ) (2024-02-13T09:40:19Z) - T-SaS: Toward Shift-aware Dynamic Adaptation for Streaming Data [9.829993835712422]
本稿では,突発的な分散シフトの存在下での逐次データモデリングの課題を解決することを目的とする。
具体的には、データの急激なシフトを捉えるために、離散分布モデリング変数を持つT-SaSと呼ばれるベイズフレームワークを設計する。
提案手法は,全ネットワーク上でどのニューロンを活性化すべきかを学習することで,各分布の特定のモデルパラメータを学習する。
論文 参考訳(メタデータ) (2023-09-05T22:55:10Z) - Statistical Inference Under Constrained Selection Bias [20.862583584531322]
本稿では,選択バイアスが存在する場合の統計的推測を可能にする枠組みを提案する。
出力は、目標分布に対する推定値に対する高確率境界である。
我々はこれらの境界を推定するための手法の計算的および統計的特性を分析し、これらの手法が様々なシミュレートされた半合成的なタスクに対して情報的境界を生成可能であることを示す。
論文 参考訳(メタデータ) (2023-06-05T23:05:26Z) - Always Strengthen Your Strengths: A Drift-Aware Incremental Learning
Framework for CTR Prediction [4.909628097144909]
クリックスルー率(CTR)予測はレコメンデーションシステムやオンライン広告プラットフォームにおいて非常に重要である。
ストリーミングデータには、基礎となる分布が時間とともにドリフトし、再帰する可能性があるという特徴がある。
我々は、CTR予測における破滅的な忘れに対処するために、アンサンブル学習に基づく新しいドリフト対応インクリメンタルラーニングフレームワークを設計する。
論文 参考訳(メタデータ) (2023-04-17T05:45:18Z) - Wild-Time: A Benchmark of in-the-Wild Distribution Shift over Time [69.77704012415845]
時間的シフトは、現実世界にデプロイされた機械学習モデルのパフォーマンスを著しく低下させる可能性がある。
ドメイン一般化、連続学習、自己教師付き学習、アンサンブル学習の手法を含む13の先行手法をベンチマークする。
いずれの評価方略も,分布外データから分布外データへの平均的な性能低下を観察する。
論文 参考訳(メタデータ) (2022-11-25T17:07:53Z) - Robust Calibration with Multi-domain Temperature Scaling [86.07299013396059]
我々は,複数の領域からのデータを活用することで,分散シフトを処理するシステムキャリブレーションモデルを開発した。
提案手法は,分布シフト時のキャリブレーションを改善するために,領域内のロバスト性を利用する。
論文 参考訳(メタデータ) (2022-06-06T17:32:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。