論文の概要: Personalized Query Auto-Completion for Long and Short-Term Interests with Adaptive Detoxification Generation
- arxiv url: http://arxiv.org/abs/2505.20966v1
- Date: Tue, 27 May 2025 09:58:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.56289
- Title: Personalized Query Auto-Completion for Long and Short-Term Interests with Adaptive Detoxification Generation
- Title(参考訳): 適応的デトキシフィケーション生成を伴う長期的・短期的関心事に対するパーソナライズドクエリ自動補完
- Authors: Zhibo Wang, Xiaoze Jiang, Zhiheng Qin, Enyun Yu, Han Li,
- Abstract要約: 本稿では,長期的かつ短期的な関心事からパーソナライズされた情報をキャプチャする新しいモデル(LaD)を提案する。
LaDでは、パーソナライズされた情報は、粗い粒度ときめ細かい粒度の両方で階層的にキャプチャされる。
私たちのモデルはKuaishou検索にデプロイされ、数億人のアクティブユーザーの主要なトラフィックを駆動しています。
- 参考スコア(独自算出の注目度): 18.762185355073008
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Query auto-completion (QAC) plays a crucial role in modern search systems. However, in real-world applications, there are two pressing challenges that still need to be addressed. First, there is a need for hierarchical personalized representations for users. Previous approaches have typically used users' search behavior as a single, overall representation, which proves inadequate in more nuanced generative scenarios. Additionally, query prefixes are typically short and may contain typos or sensitive information, increasing the likelihood of generating toxic content compared to traditional text generation tasks. Such toxic content can degrade user experience and lead to public relations issues. Therefore, the second critical challenge is detoxifying QAC systems. To address these two limitations, we propose a novel model (LaD) that captures personalized information from both long-term and short-term interests, incorporating adaptive detoxification. In LaD, personalized information is captured hierarchically at both coarse-grained and fine-grained levels. This approach preserves as much personalized information as possible while enabling online generation within time constraints. To move a futher step, we propose an online training method based on Reject Preference Optimization (RPO). By incorporating a special token [Reject] during both the training and inference processes, the model achieves adaptive detoxification. Consequently, the generated text presented to users is both non-toxic and relevant to the given prefix. We conduct comprehensive experiments on industrial-scale datasets and perform online A/B tests, delivering the largest single-experiment metric improvement in nearly two years of our product. Our model has been deployed on Kuaishou search, driving the primary traffic for hundreds of millions of active users. The code is available at https://github.com/JXZe/LaD.
- Abstract(参考訳): クエリオートコンプリート(QAC)は,現代の検索システムにおいて重要な役割を担っている。
しかし、現実世界のアプリケーションでは、まだ対処する必要がある2つの課題があります。
まず、ユーザーのための階層的なパーソナライズされた表現が必要である。
従来のアプローチでは、ユーザーの検索動作を単一の全体表現として使用しており、よりニュアンスな生成シナリオでは不十分であることが証明されている。
さらに、クエリプレフィックスは一般的に短く、タイプミスやセンシティブな情報を含んでいるため、従来のテキスト生成タスクと比較して有害なコンテンツを生成する可能性が高まる。
このような有害なコンテンツは、ユーザー体験を低下させ、広報上の問題を引き起こす可能性がある。
したがって、第2の課題はQACシステムの非毒性化である。
これら2つの制約に対処するために,適応的解毒を取り入れた,長期的および短期的な関心事の両方からパーソナライズされた情報をキャプチャする新しいモデル(LaD)を提案する。
LaDでは、パーソナライズされた情報は、粗い粒度ときめ細かい粒度の両方で階層的にキャプチャされる。
このアプローチは、時間制約内でオンライン生成を可能にしながら、可能な限りパーソナライズされた情報を保存します。
本稿では,Reject Preference Optimization(RPO)に基づくオンライントレーニング手法を提案する。
トレーニングと推論の両方のプロセスで特別なトークン[リジェクト]を組み込むことで、モデルは適応的なデトックス化を実現する。
その結果、ユーザに対して提示された生成されたテキストは、いずれも無害であり、与えられたプレフィックスに関連付けられている。
産業規模のデータセットに関する包括的な実験を行い、オンラインのA/Bテストを実施しました。
私たちのモデルはKuaishou検索にデプロイされ、数億人のアクティブユーザの主要なトラフィックを駆動しています。
コードはhttps://github.com/JXZe/LaD.comで公開されている。
関連論文リスト
- AnalyticKWS: Towards Exemplar-Free Analytic Class Incremental Learning for Small-footprint Keyword Spotting [29.303650401396997]
キーワードスポッティング(KWS)は、音声対応システムにおける音声コマンドを識別するための重要なメカニズムを提供する。
主要な問題は、モデルが以前のキーワードを認識する能力を失う、破滅的な忘れ物である。
本稿では,従来のデータを再検討することなく,モデルパラメータを更新する分析連続学習(AnalyticKWS)手法を提案する。
論文 参考訳(メタデータ) (2025-05-17T03:55:28Z) - CAMeL: Cross-modality Adaptive Meta-Learning for Text-based Person Retrieval [22.01591564940522]
モデル一般化能力を高めるために,クロスモーダル適応メタラーニング(CAMeL)に基づくドメインに依存しない事前学習フレームワークを提案する。
特に,現実シナリオの多様性と複雑さを反映した一連のタスクを開発する。
提案手法は,実世界のベンチマークにおける既存手法を超越するだけでなく,ロバスト性やスケーラビリティも示す。
論文 参考訳(メタデータ) (2025-04-26T03:26:30Z) - Constrained Auto-Regressive Decoding Constrains Generative Retrieval [71.71161220261655]
ジェネレーティブ検索は、従来の検索インデックスデータ構造を1つの大規模ニューラルネットワークに置き換えようとしている。
本稿では,制約とビームサーチという2つの本質的な視点から,制約付き自己回帰生成の固有の制約について検討する。
論文 参考訳(メタデータ) (2025-04-14T06:54:49Z) - Generative Pre-trained Ranking Model with Over-parameterization at Web-Scale (Extended Abstract) [73.57710917145212]
ランク付け学習は、入力クエリに基づいて関連するWebページを優先順位付けするために、Web検索で広く使われている。
本稿では,これらの課題に対処するために,経験的 UlineSemi-uline Supervised ulinePre-trained (GS2P) モデルを提案する。
我々は,公開データセットと大規模検索エンジンから収集した実世界のデータセットの両方に対して,大規模なオフライン実験を行う。
論文 参考訳(メタデータ) (2024-09-25T03:39:14Z) - Generative Multi-modal Models are Good Class-Incremental Learners [51.5648732517187]
クラス増分学習のための新しい生成型マルチモーダルモデル(GMM)フレームワークを提案する。
提案手法は適応生成モデルを用いて画像のラベルを直接生成する。
Few-shot CIL設定では、現在の最先端のすべてのメソッドに対して少なくとも14%精度が向上し、忘れてはならない。
論文 参考訳(メタデータ) (2024-03-27T09:21:07Z) - List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - Graph Based Long-Term And Short-Term Interest Model for Click-Through
Rate Prediction [8.679270588565398]
GLSMと呼ばれるグラフに基づく長期短期利害モデルを提案する。
長期ユーザ行動のキャプチャのための多目的グラフ構造と、短期情報モデリングのための多シナリオ異種シーケンスモデルと、長期および短期行動からの融合情報に対する適応的融合機構とから構成される。
論文 参考訳(メタデータ) (2023-06-05T07:04:34Z) - CorpusBrain: Pre-train a Generative Retrieval Model for
Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。
我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文 参考訳(メタデータ) (2022-08-16T10:22:49Z) - Sampling Is All You Need on Modeling Long-Term User Behaviors for CTR
Prediction [15.97120392599086]
textbfM(textbfSampling-based textbfDeep textbfModeling)を提案する。
提案手法は, 長期ユーザ行動のモデル化において, 標準的な注意モデルと同等に機能することが理論的, 実験的に示されている。
論文 参考訳(メタデータ) (2022-05-20T15:20:52Z) - RETE: Retrieval-Enhanced Temporal Event Forecasting on Unified Query
Product Evolutionary Graph [18.826901341496143]
時間的イベント予測は、統合クエリ製品進化グラフにおける新しいユーザ行動予測タスクである。
本稿では,新しいイベント予測フレームワークを提案する。
既存手法とは違って,グラフ全体の大まかに連結されたエンティティを通じてユーザ表現を強化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-12T19:27:56Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。