論文の概要: Session-Aware Query Auto-completion using Extreme Multi-label Ranking
- arxiv url: http://arxiv.org/abs/2012.07654v1
- Date: Wed, 9 Dec 2020 17:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 01:49:20.999101
- Title: Session-Aware Query Auto-completion using Extreme Multi-label Ranking
- Title(参考訳): 極多ラベルランキングを用いたセッションアウェアクエリ自動補完
- Authors: Nishant Yadav, Rajat Sen, Daniel N. Hill, Arya Mazumdar, Inderjit S.
Dhillon
- Abstract要約: 本稿では,セッション対応クエリ自動補完の新たな手法を,XMR(Multi Multi-Xtreme Ranking)問題として取り上げる。
アルゴリズムのキーステップにいくつかの修正を提案することにより、この目的のために一般的なXMRアルゴリズムを適応させる。
当社のアプローチは、セッション情報を活用しながら、自動補完システムの厳しいレイテンシ要件を満たします。
- 参考スコア(独自算出の注目度): 61.753713147852125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Query auto-completion is a fundamental feature in search engines where the
task is to suggest plausible completions of a prefix typed in the search bar.
Previous queries in the user session can provide useful context for the user's
intent and can be leveraged to suggest auto-completions that are more relevant
while adhering to the user's prefix. Such session-aware query auto-completions
can be generated by sequence-to-sequence models; however, these generative
approaches often do not meet the stringent latency requirements of responding
to each user keystroke. Moreover, there is a danger of showing non-sensical
queries in a generative approach. Another solution is to pre-compute a
relatively small subset of relevant queries for common prefixes and rank them
based on the context. However, such an approach would fail if no relevant
queries for the current context are present in the pre-computed set.
In this paper, we provide a solution to this problem: we take the novel
approach of modeling session-aware query auto-completion as an eXtreme
Multi-Label Ranking (XMR) problem where the input is the previous query in the
session and the user's current prefix, while the output space is the set of
millions of queries entered by users in the recent past. We adapt a popular XMR
algorithm for this purpose by proposing several modifications to the key steps
in the algorithm. The proposed modifications yield a 230% improvement in terms
of Mean Reciprocal Rank over the baseline XMR approach on a public search logs
dataset. Our approach meets the stringent latency requirements for
auto-complete systems while leveraging session information in making
suggestions. We show that session context leads to significant improvements in
the quality of query auto-completions; in particular, for short prefixes with
up to 3 characters, we see a 32% improvement over baselines that meet latency
requirements.
- Abstract(参考訳): クエリの自動補完は検索エンジンの基本的な機能であり、検索バーで入力されたプレフィックスの適切な補完を提案するタスクである。
ユーザセッションの以前のクエリは、ユーザの意図に有用なコンテキストを提供し、ユーザのプレフィックスに固執しながらより関連性の高い自動補完を提案するために利用することができる。
このようなセッションアウェアなクエリの自動補完はシーケンスからシーケンスへのモデルによって生成されるが、これらの生成的アプローチは各ユーザキーストロークに応答する厳密なレイテンシ要件を満たさないことが多い。
さらに、生成的アプローチでは、非意味なクエリを示す危険性がある。
別の解決策は、関連するクエリの比較的小さなサブセットをプレコンパイルし、コンテキストに基づいてそれらをランク付けすることである。
しかし、現在のコンテキストに関する関連するクエリが事前に計算されたセットに存在しない場合、そのようなアプローチは失敗する。
本稿では,セッションアウェアな問合せ自動補完を,セッションの前の問合せと現在の接頭辞が入力であり,出力空間が近年ユーザが入力した数百万の問合せの集合である極端なマルチラベルランキング(xmr)問題としてモデル化する,新たな手法を提案する。
この目的のために、アルゴリズムの重要なステップにいくつかの変更を加えることで、人気のあるXMRアルゴリズムを適用する。
提案する修正により、公開検索ログデータセットにおけるベースラインxmrアプローチよりも平均相互ランクで230%改善される。
提案手法では,提案するセッション情報を活用しながら,自動補完システムの待ち時間要件を満たす。
特に,最大3文字の短いプレフィックスでは,レイテンシ要件を満たすベースラインに対して32%改善されている。
関連論文リスト
- Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - Adaptive Query Rewriting: Aligning Rewriters through Marginal Probability of Conversational Answers [66.55612528039894]
AdaQRは、シードデータセットからの限定的な書き直しアノテーションと完全にパスラベルのないクエリ書き換えモデルをトレーニングするフレームワークである。
会話クエリに条件付き回答の確率を用いて,これらの候補に対する検索者の嗜好を評価する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-16T16:09:05Z) - User Intent Recognition and Semantic Cache Optimization-Based Query Processing Framework using CFLIS and MGR-LAU [0.0]
この研究は、拡張QPのためのクエリにおける情報、ナビゲーション、およびトランザクションベースのインテントを分析した。
効率的なQPのために、データはEpanechnikov Kernel-Ordering Pointsを用いて構造化され、クラスタリング構造(EK-OPTICS)を同定する。
抽出された特徴、検出された意図、構造化データは、MGR-LAU(Multi-head Gated Recurrent Learnable Attention Unit)に入力される。
論文 参考訳(メタデータ) (2024-06-06T20:28:05Z) - Ask Optimal Questions: Aligning Large Language Models with Retriever's
Preference in Conversational Search [25.16282868262589]
RetPOは、ターゲット検索システムの好みに合わせて検索クエリを再構成するための言語モデル(LM)を最適化するように設計されている。
我々は、12Kの会話で410K以上のクエリを書き換えるRetrievers' Feedbackと呼ばれる大規模なデータセットを構築した。
このモデルにより,最近の2つの対話型検索ベンチマークにおいて,最先端の性能が得られた。
論文 参考訳(メタデータ) (2024-02-19T04:41:31Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - Context-Aware Query Rewriting for Improving Users' Search Experience on
E-commerce Websites [47.04727122209316]
電子商取引のクエリはしばしば短く曖昧である。
ユーザーは購入する前に複数の検索を入力し、それをコンテキストと呼ぶ。
本稿では,エンド・ツー・エンドのコンテキスト認識型クエリ書き換えモデルを提案する。
論文 参考訳(メタデータ) (2022-09-15T19:46:01Z) - Efficient Neural Query Auto Completion [17.58784759652327]
クエリオートコンプリートシステムでは,3つの大きな課題が報告されている。
従来のQACシステムは、検索ログのクエリ候補頻度などの手作り機能に依存している。
本稿では,これらの課題を克服するために,効果的なコンテキストモデリングを用いた効率的なニューラルネットワークQACシステムを提案する。
論文 参考訳(メタデータ) (2020-08-06T21:28:36Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。