論文の概要: Query Rewriting via Cycle-Consistent Translation for E-Commerce Search
- arxiv url: http://arxiv.org/abs/2103.00800v1
- Date: Mon, 1 Mar 2021 06:47:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-04 04:59:35.567441
- Title: Query Rewriting via Cycle-Consistent Translation for E-Commerce Search
- Title(参考訳): Eコマース検索のためのサイクル一貫性翻訳によるクエリ書き換え
- Authors: Yiming Qiu, Kang Zhang, Han Zhang, Songlin Wang, Sulong Xu, Yun Xiao,
Bo Long, Wen-Yun Yang
- Abstract要約: 本稿では,新しいディープニューラルネットワークによる問合せ書き換え手法を提案する。
繰り返し機械翻訳問題にクエリ書き換えを定式化します。
最新の機械翻訳モデルと連動した、新しいサイクル整合性トレーニングアルゴリズムを紹介します。
- 参考スコア(独自算出の注目度): 13.723266150864037
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Nowadays e-commerce search has become an integral part of many people's
shopping routines. One critical challenge in today's e-commerce search is the
semantic matching problem where the relevant items may not contain the exact
terms in the user query. In this paper, we propose a novel deep neural network
based approach to query rewriting, in order to tackle this problem.
Specifically, we formulate query rewriting into a cyclic machine translation
problem to leverage abundant click log data. Then we introduce a novel cyclic
consistent training algorithm in conjunction with state-of-the-art machine
translation models to achieve the optimal performance in terms of query
rewriting accuracy. In order to make it practical in industrial scenarios, we
optimize the syntax tree construction to reduce computational cost and online
serving latency. Offline experiments show that the proposed method is able to
rewrite hard user queries into more standard queries that are more appropriate
for the inverted index to retrieve. Comparing with human curated rule-based
method, the proposed model significantly improves query rewriting diversity
while maintaining good relevancy. Online A/B experiments show that it improves
core e-commerce business metrics significantly. Since the summer of 2020, the
proposed model has been launched into our search engine production, serving
hundreds of millions of users.
- Abstract(参考訳): 今日、eコマース検索は多くの人々のショッピングルーチンの不可欠な部分となっています。
今日のEコマース検索における重要な課題の1つは、関連する項目がユーザークエリの正確な用語を含まないセマンティックマッチングの問題である。
本稿では,この問題に対処するために,深層ニューラルネットワークを用いたクエリ書き換え手法を提案する。
具体的には,問合せ書き換えを循環機械翻訳問題に定式化し,大量のクリックログデータを活用する。
そこで本研究では,最新の機械翻訳モデルと連動して,クエリ書き換え精度の最適性能を達成するための循環型一貫性学習アルゴリズムを提案する。
産業シナリオで実用化するために,計算コストとオンラインサービス遅延を低減するため,構文木構築を最適化する。
オフライン実験により,提案手法は,逆インデックスの検索に適した,より標準的なクエリにハードユーザクエリを書き換えることができることがわかった。
提案モデルは,人間によるルールベースの手法と比較して,クエリ書き換えの多様性を有意に改善すると同時に,関連性も良好に維持する。
オンラインA/B実験では、eコマースのビジネス指標が大幅に改善されている。
2020年夏以降、提案されたモデルは当社の検索エンジン生産に投入され、数億人のユーザーに対応している。
関連論文リスト
- Aligning Query Representation with Rewritten Query and Relevance Judgments in Conversational Search [32.35446999027349]
我々は、より優れたクエリ表現モデルをトレーニングするために、リライトされたクエリと会話検索データの関連判断の両方を活用する。
提案したモデル --Query Representation Alignment Conversational Retriever(QRACDR)は、8つのデータセットでテストされる。
論文 参考訳(メタデータ) (2024-07-29T17:14:36Z) - A Use Case: Reformulating Query Rewriting as a Statistical Machine
Translation Problem [0.0]
本稿では,アラビア語検索クエリの書き直しを学習する単言語機械翻訳モデルに基づくクエリ書き換えパイプラインを提案する。
本稿では、ユーザクエリとWebページのタイトル間のマッピングを作成するための前処理手順についても述べる。
論文 参考訳(メタデータ) (2023-10-19T11:37:14Z) - Semantic Equivalence of e-Commerce Queries [6.232692545488813]
本稿では,クエリの等価性を認識・活用し,検索とビジネスの成果を高めるためのフレームワークを提案する。
提案手法は,検索意図のベクトル表現へのクエリのマッピング,等価あるいは類似の意図を表現した近傍のクエリの特定,ユーザやビジネス目的の最適化という3つの重要な問題に対処する。
論文 参考訳(メタデータ) (2023-08-07T18:40:13Z) - Improving Text Matching in E-Commerce Search with A Rationalizable,
Intervenable and Fast Entity-Based Relevance Model [78.80174696043021]
エンティティベース関連モデル(EBRM)と呼ばれる新しいモデルを提案する。
この分解により、高精度にクロスエンコーダQE関連モジュールを使用できる。
また、ユーザログから自動生成されたQEデータによるQEモジュールの事前トレーニングにより、全体的なパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-07-01T15:44:53Z) - How Does Generative Retrieval Scale to Millions of Passages? [68.98628807288972]
各種コーパス尺度における生成的検索手法の実証的研究を行った。
我々は8.8Mパスのコーパスで数百万のパスに生成検索をスケールし、モデルサイズを最大11Bパラメータまで評価する。
生成的検索は、小さなコーパス上の最先端のデュアルエンコーダと競合するが、数百万のパスへのスケーリングは依然として重要で未解決の課題である。
論文 参考訳(メタデータ) (2023-05-19T17:33:38Z) - Context-Aware Query Rewriting for Improving Users' Search Experience on
E-commerce Websites [47.04727122209316]
電子商取引のクエリはしばしば短く曖昧である。
ユーザーは購入する前に複数の検索を入力し、それをコンテキストと呼ぶ。
本稿では,エンド・ツー・エンドのコンテキスト認識型クエリ書き換えモデルを提案する。
論文 参考訳(メタデータ) (2022-09-15T19:46:01Z) - Online Learning of Optimally Diverse Rankings [63.62764375279861]
ユーザのフィードバックのみに基づいて最適なリストを効率よく学習するアルゴリズムを提案する。
我々は、$T$クエリの後に、LDRの後悔は$O((N-L)log(T))$としてスケールする。
論文 参考訳(メタデータ) (2021-09-13T12:13:20Z) - Session-Aware Query Auto-completion using Extreme Multi-label Ranking [61.753713147852125]
本稿では,セッション対応クエリ自動補完の新たな手法を,XMR(Multi Multi-Xtreme Ranking)問題として取り上げる。
アルゴリズムのキーステップにいくつかの修正を提案することにより、この目的のために一般的なXMRアルゴリズムを適応させる。
当社のアプローチは、セッション情報を活用しながら、自動補完システムの厳しいレイテンシ要件を満たします。
論文 参考訳(メタデータ) (2020-12-09T17:56:22Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。