論文の概要: Synthetic Prefixes to Mitigate Bias in Real-Time Neural Query Autocomplete
- arxiv url: http://arxiv.org/abs/2510.01574v1
- Date: Thu, 02 Oct 2025 01:44:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.939751
- Title: Synthetic Prefixes to Mitigate Bias in Real-Time Neural Query Autocomplete
- Title(参考訳): リアルタイムニューラルネットワークオートコンプリートにおけるバイアス軽減のための合成プレフィックス
- Authors: Adithya Rajan, Xiaoyu Liu, Prateek Verma, Vibhu Arora,
- Abstract要約: 本稿では, リアルタイムニューラルネットワーク自動補完システムにおけるプレゼンテーションバイアスを軽減するために, 合成接頭辞を用いたデータ中心型アプローチを提案する。
これらのプレフィックスは、オートコンプリートがアクティブでない通常の検索セッション中に収集された完全なユーザクエリから生成される。
本システムでは,ユーザエンゲージメントの統計的に有意な改善が示され,平均相互ランクおよび関連する指標によって測定される。
- 参考スコア(独自算出の注目度): 11.632489223177773
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a data-centric approach for mitigating presentation bias in real-time neural query autocomplete systems through the use of synthetic prefixes. These prefixes are generated from complete user queries collected during regular search sessions where autocomplete was not active. This allows us to enrich the training data for learning to rank models with more diverse and less biased examples. This method addresses the inherent bias in engagement signals collected from live query autocomplete interactions, where model suggestions influence user behavior. Our neural ranker is optimized for real-time deployment under strict latency constraints and incorporates a rich set of features, including query popularity, seasonality, fuzzy match scores, and contextual signals such as department affinity, device type, and vertical alignment with previous user queries. To support efficient training, we introduce a task-specific simplification of the listwise loss, reducing computational complexity from $O(n^2)$ to $O(n)$ by leveraging the query autocomplete structure of having only one ground-truth selection per prefix. Deployed in a large-scale e-commerce setting, our system demonstrates statistically significant improvements in user engagement, as measured by mean reciprocal rank and related metrics. Our findings show that synthetic prefixes not only improve generalization but also provide a scalable path toward bias mitigation in other low-latency ranking tasks, including related searches and query recommendations.
- Abstract(参考訳): 本稿では, リアルタイムニューラルネットワーク自動補完システムにおけるプレゼンテーションバイアスを軽減するために, 合成接頭辞を用いたデータ中心型アプローチを提案する。
これらのプレフィックスは、オートコンプリートがアクティブでない通常の検索セッション中に収集された完全なユーザクエリから生成される。
これにより、学習のためのトレーニングデータを強化して、より多様性がありバイアスの少ないモデルのランク付けが可能になります。
本手法は,ユーザ行動に影響を与えるモデル提案を行うライブクエリ・オートコンプリート相互作用から収集したエンゲージメント信号の固有バイアスに対処する。
我々のニューラルネットワークローダは、厳格なレイテンシ制約下でのリアルタイムデプロイメントに最適化されており、クエリの人気、季節性、ファジィマッチスコア、デパートアフィニティ、デバイスタイプ、以前のユーザクエリとの垂直アライメントといったコンテキスト信号など、豊富な機能セットが組み込まれています。
効率的な学習を支援するために,1プレフィックスにつき1つの接頭辞選択しか持たないクエリオートコンプリート構造を活用することにより,タスク固有の損失を単純化し,計算複雑性を$O(n^2)$から$O(n)$に低減する。
大規模なeコマース環境に展開し,ユーザエンゲージメントの統計的に有意な改善を示す。
以上の結果から, 合成接頭辞は一般化を向上するだけでなく, 関連検索やクエリレコメンデーションなど, その他の低遅延ランキングタスクにおいて, バイアス軽減に向けたスケーラブルな経路を提供することがわかった。
関連論文リスト
- Sequential Decision-Making for Inline Text Autocomplete [14.83046358936405]
テキスト入力システムにおけるインラインオートコンプリート提案の改善問題について検討する。
我々は、強化学習を用いて、ターゲットユーザとの繰り返しインタラクションを通じて提案ポリシーを学習する。
論文 参考訳(メタデータ) (2024-03-21T22:33:16Z) - Type-based Neural Link Prediction Adapter for Complex Query Answering [2.1098688291287475]
本稿では,タイプベースエンティティ関係グラフを構成する新しいモデルであるTypEベースのニューラルリンク予測アダプタ(TENLPA)を提案する。
型情報と複雑な論理的クエリを効果的に結合するために,適応学習機構を導入する。
3つの標準データセットの実験により、TENLPAモデルが複雑なクエリ応答における最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-01-29T10:54:28Z) - Wiki-En-ASR-Adapt: Large-scale synthetic dataset for English ASR
Customization [66.22007368434633]
自動音声認識(ASR)のコンテキストスペルチェックカスタマイズのための,最初の大規模公開合成データセットを提案する。
提案手法により、崩壊したASR仮説の数百万の現実的な例を作成し、カスタマイズタスクの非自明なバイアスリストをシミュレートすることができる。
提案したデータセット上で,オープンソースのカスタマイズモデルをトレーニングした実験を報告し,ハードネガティブなバイアスフレーズの注入がWERを減少させ,誤報の回数を減少させることを示す。
論文 参考訳(メタデータ) (2023-09-29T14:18:59Z) - Adapting Neural Link Predictors for Data-Efficient Complex Query
Answering [45.961111441411084]
本稿では,複雑な問合せタスクに対して,ニューラルネットワーク予測スコアを再校正するために最適化されたパラメータ効率のスコア強調モデルを提案する。
CQD$mathcalA$は現在の最先端手法よりもはるかに正確な結果が得られる。
論文 参考訳(メタデータ) (2023-01-29T00:17:16Z) - Fine-grained Retrieval Prompt Tuning [149.9071858259279]
微粒な検索プロンプトチューニングは, サンプルプロンプトと特徴適応の観点から, きめの細かい検索タスクを実行するために, 凍結した事前学習モデルを操る。
学習可能なパラメータが少ないFRPTは、広く使われている3つの細粒度データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-29T04:10:04Z) - Session-Aware Query Auto-completion using Extreme Multi-label Ranking [61.753713147852125]
本稿では,セッション対応クエリ自動補完の新たな手法を,XMR(Multi Multi-Xtreme Ranking)問題として取り上げる。
アルゴリズムのキーステップにいくつかの修正を提案することにより、この目的のために一般的なXMRアルゴリズムを適応させる。
当社のアプローチは、セッション情報を活用しながら、自動補完システムの厳しいレイテンシ要件を満たします。
論文 参考訳(メタデータ) (2020-12-09T17:56:22Z) - Automated Concatenation of Embeddings for Structured Prediction [75.44925576268052]
本稿では, 埋め込みの自動結合(ACE)を提案し, 構造予測タスクにおける埋め込みのより優れた結合を見つけるプロセスを自動化する。
我々は、強化学習の戦略に従い、制御器のパラメータを最適化し、タスクモデルの精度に基づいて報酬を計算する。
論文 参考訳(メタデータ) (2020-10-10T14:03:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。