論文の概要: DualGR: Generative Retrieval with Long and Short-Term Interests Modeling
- arxiv url: http://arxiv.org/abs/2511.12518v1
- Date: Sun, 16 Nov 2025 09:20:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:24.290606
- Title: DualGR: Generative Retrieval with Long and Short-Term Interests Modeling
- Title(参考訳): DualGR: 長期的および短期的な関心モデリングによる生成検索
- Authors: Zhongchao Yi, Kai Feng, Xiaojian Ma, Yalong Wang, Yongqi Liu, Han Li, Zhengyang Zhou, Yang Wang,
- Abstract要約: Generative Retrieval (GR) は Embedding-based Retrieval (EBR) の代替として登場した。
ユーザ興味の2つの地平線を選択的アクティベーションで明示的にモデル化する生成検索フレームワークであるDualGRを提案する。
オンラインA/Bテストでは0.527%のビデオビューと+0.432%のウォッチタイムリフトがあり、DualGRは産業生成検索の実践的で効果的なパラダイムとして検証されている。
- 参考スコア(独自算出の注目度): 23.123644321765607
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In large-scale industrial recommendation systems, retrieval must produce high-quality candidates from massive corpora under strict latency. Recently, Generative Retrieval (GR) has emerged as a viable alternative to Embedding-Based Retrieval (EBR), which quantizes items into a finite token space and decodes candidates autoregressively, providing a scalable path that explicitly models target-history interactions via cross-attention. However, three challenges persist: 1) how to balance users' long-term and short-term interests , 2) noise interference when generating hierarchical semantic IDs (SIDs), 3) the absence of explicit modeling for negative feedback such as exposed items without clicks. To address these challenges, we propose DualGR, a generative retrieval framework that explicitly models dual horizons of user interests with selective activation. Specifically, DualGR utilizes Dual-Branch Long/Short-Term Router (DBR) to cover both stable preferences and transient intents by explicitly modeling users' long- and short-term behaviors. Meanwhile, Search-based SID Decoding (S2D) is presented to control context-induced noise and enhance computational efficiency by constraining candidate interactions to the current coarse (level-1) bucket during fine-grained (level-2/3) SID prediction. % also reinforcing intra-class consistency. Finally, we propose an Exposure-aware Next-Token Prediction Loss (ENTP-Loss) that treats "exposed-but-unclicked" items as hard negatives at level-1, enabling timely interest fade-out. On the large-scale Kuaishou short-video recommendation system, DualGR has achieved outstanding performance. Online A/B testing shows +0.527% video views and +0.432% watch time lifts, validating DualGR as a practical and effective paradigm for industrial generative retrieval.
- Abstract(参考訳): 大規模産業レコメンデーションシステムでは、検索は厳格なレイテンシの下で大量のコーパスから高品質な候補を生成する必要がある。
近年、ジェネレーティブ・レトリーヴァル(GR)は、アイテムを有限トークン空間に量子化し、候補を自己回帰的にデコードするエンベディング・ベース・レトリーバル(EBR)の代替手段として浮上し、クロスアテンションを通じてターゲットとヒストリーの相互作用を明示的にモデル化するスケーラブルなパスを提供する。
しかし、三つの課題が続く。
1) ユーザの長期的・短期的利益のバランスをとる方法(2) 階層型セマンティックID(SID)の生成時のノイズ干渉
3) クリックのない露出アイテムなどの負のフィードバックに対する明示的なモデリングがない。
これらの課題に対処するために,ユーザ関心の2つの地平線を選択的アクティベーションで明示的にモデル化する生成検索フレームワークであるDualGRを提案する。
具体的には、DualGRはDual-Branch Long/Short-Term Router (DBR)を使用して、ユーザの長期的および短期的な振る舞いを明示的にモデル化することで、安定した好みと過渡的な意図の両方をカバーする。
一方、検索ベースSID復号法(S2D)は、微粒な(レベル2/3)SID予測において、現在の粗い(レベル1)バケットとの候補相互作用を制約することにより、文脈依存性のノイズを制御し、計算効率を向上させる。
また,クラス内整合性も強化した。
最後に,「露出するがクリックしない」項目をレベル1のハードネガティブとして扱い,タイムリーな関心のフェードアウトを可能にする,露出認識型次世代予測損失(ENTP-Loss)を提案する。
大規模なKuaishouショートビデオレコメンデーションシステムでは、DualGRは優れたパフォーマンスを実現している。
オンラインA/Bテストでは0.527%のビデオビューと+0.432%のウォッチタイムリフトがあり、DualGRは産業生成検索の実践的で効果的なパラダイムとして検証されている。
関連論文リスト
- Controllable Graph Generation with Diffusion Models via Inference-Time Tree Search Guidance [36.29334590991777]
グラフ生成は、Webスケールシステム、知識グラフ、薬物や物質発見などの科学領域にまたがる幅広い応用によるグラフ学習の基本的な問題である。
最近のアプローチでは、ステップバイステップの生成に拡散モデルを活用するが、非条件拡散は望ましい性質をほとんど制御せず、しばしば不安定な品質と新しい目的を取り入れることの難しさをもたらす。
推論時間誘導法は、再トレーニングせずにサンプリングプロセスを調整することでこれらの問題を緩和するが、それらは本質的に局所的であり、制御性に制限される。
本稿では,モンテカルロ木探索 (MCTS) で誘導される,制御可能なグラフ生成のための二空間拡散フレームワークであるTreeDiffを提案する。
論文 参考訳(メタデータ) (2025-10-12T01:40:33Z) - Modeling Long-term User Behaviors with Diffusion-driven Multi-interest Network for CTR Prediction [18.302602011055775]
本稿では,DiffuMIN (Diffusion-driven Multi-Interest Network) を提案する。
オンラインA/BテストではDiffuMINが1.52%,CPMが1.10%増加した。
論文 参考訳(メタデータ) (2025-08-21T07:10:01Z) - ENCODE: Breaking the Trade-Off Between Performance and Efficiency in Long-Term User Behavior Modeling [12.963611514800656]
EfficieNt Clustering を用いた twO-stage interest moDEling (ENCODE) と呼ばれる2段階の効率的な長期配列モデリング手法を提案する。
オフラインの抽出段階では、ENCODEは全動作シーケンスをクラスタリングし、正確な関心を抽出する。
オンライン推論の段階では、ECNODEは、ターゲットアイテムとの関連性を予測するために、既成のユーザ関心を生かしている。
論文 参考訳(メタデータ) (2025-08-19T06:58:21Z) - VISTA: Unsupervised 2D Temporal Dependency Representations for Time Series Anomaly Detection [42.694234312755285]
時系列異常検出(TSAD)は、ラベルのない時系列データの中で稀で潜在的に有害な事象を明らかにするのに不可欠である。
本稿では,これらの課題を克服するために,トレーニング不要で教師なしのTSADアルゴリズムであるVISTAを紹介する。
論文 参考訳(メタデータ) (2025-04-03T11:20:49Z) - Multi-granularity Interest Retrieval and Refinement Network for Long-Term User Behavior Modeling in CTR Prediction [68.90783662117936]
クリックスルーレート(CTR)の予測は、オンラインパーソナライズプラットフォームにとって不可欠である。
近年の進歩は、リッチなユーザの振る舞いをモデル化することで、CTR予測の性能を大幅に改善できることを示している。
マルチグラニュラリティ興味検索ネットワーク(MIRRN)を提案する。
論文 参考訳(メタデータ) (2024-11-22T15:29:05Z) - Diffusion Recommender Model [85.9640416600725]
そこで我々は,DiffRecと呼ばれる新しい拡散レコメンダモデルを提案し,その生成過程を認知的に学習する。
ユーザインタラクションにおけるパーソナライズされた情報を維持するため、DiffRecは追加のノイズを低減し、画像合成のような純粋なノイズに対するユーザのインタラクションを損なうことを避ける。
論文 参考訳(メタデータ) (2023-04-11T04:31:00Z) - BSN++: Complementary Boundary Regressor with Scale-Balanced Relation
Modeling for Temporal Action Proposal Generation [85.13713217986738]
我々は,時間的提案生成のための補完的境界回帰器と関係モデリングを利用する新しいフレームワークであるBSN++を提案する。
当然のことながら、提案されたBSN++は、時間的アクションローカライゼーションタスクに関するCVPR19 - ActivityNetのリーダーボードで1位にランクインした。
論文 参考訳(メタデータ) (2020-09-15T07:08:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。