論文の概要: Embedding based retrieval for long tail search queries in ecommerce
- arxiv url: http://arxiv.org/abs/2505.01946v2
- Date: Sun, 25 May 2025 04:10:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 14:32:54.554898
- Title: Embedding based retrieval for long tail search queries in ecommerce
- Title(参考訳): eコマースにおける長期検索クエリの埋め込みに基づく検索
- Authors: Akshay Kekuda, Yuyang Zhang, Arun Udayashankar,
- Abstract要約: 我々はBest Buyでセマンティックプロダクト検索を実装するための一連の最適化を提案する。
最初の最適化は、変換信号の空間性を改善するために、大きな言語モデルを使用することである。
2つめの最適化は、Best Buyカタログデータに基づいて、既製のトランスフォーマーベースのモデルを事前学習することである。
- 参考スコア(独自算出の注目度): 4.22966572735637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this abstract we present a series of optimizations we performed on the two-tower model architecture [14], and training and evaluation datasets to implement semantic product search at Best Buy. Search queries on bestbuy.com follow the pareto distribution whereby a minority of them account for most searches. This leaves us with a long tail of search queries that have low frequency of issuance. The queries in the long tail suffer from very spare interaction signals. Our current work focuses on building a model to serve the long tail queries. We present a series of optimizations we have done to this model to maximize conversion for the purpose of retrieval from the catalog. The first optimization we present is using a large language model to improve the sparsity of conversion signals. The second optimization is pretraining an off-the-shelf transformer-based model on the Best Buy catalog data. The third optimization we present is on the finetuning front. We use query-to-query pairs in addition to query-to-product pairs and combining the above strategies for finetuning the model. We also demonstrate how merging the weights of these finetuned models improves the evaluation metrics. Finally, we provide a recipe for curating an evaluation dataset for continuous monitoring of model performance with human-in-the-loop evaluation. We found that adding this recall mechanism to our current term match-based recall improved conversion by 3% in an online A/B test.
- Abstract(参考訳): 本稿では,2towerモデルアーキテクチャ [14] 上で実施した一連の最適化と,Best Buyにおけるセマンティックプロダクト検索を実現するためのトレーニングおよび評価データセットについて述べる。
bestbuy.comの検索クエリは、ほとんどの検索に対して少数派が占めるパーレト分布に従っている。
これにより、発行頻度の低い長い検索クエリが残されます。
長い尾のクエリは、非常に余分な相互作用信号に悩まされる。
現在の作業では、長い尾のクエリを提供するモデルの構築に重点を置いています。
我々は,このモデルに対して,カタログから検索する目的で変換を最大化するために,一連の最適化を行った。
最初の最適化は、大きな言語モデルを用いて変換信号の空間性を改善することである。
2つめの最適化は、Best Buyカタログデータに基づいて、既製のトランスフォーマーベースのモデルを事前学習することである。
第3の最適化は、微調整の面にあります。
クエリ・ツー・クエリのペアに加えて,クエリ・ツー・プロダクトのペアも使用しています。
また、これらの微調整モデルの重み付けが評価指標をどのように改善するかを示す。
最後に,Human-in-the-loop評価を用いたモデル性能の連続モニタリングのための評価データセットのキュレーション手法を提案する。
オンラインA/Bテストでは,このリコール機構を現在の長期的マッチングベースリコールに付加することで,変換率を3%向上することがわかった。
関連論文リスト
- Optimizing Compound Retrieval Systems [30.21938278062652]
本稿では,複数の予測モデルを適用したより広範な検索システムとして,複合検索システムの概念を提案する。
我々は,従来のBM25検索モデルと最先端(ペアワイズ)のLLM関連予測を組み合わせた複合手法を提案する。
実験の結果,最適化された複合検索システムは,カスケード手法よりも効率と効率のトレードオフが優れていることがわかった。
論文 参考訳(メタデータ) (2025-04-16T13:18:16Z) - Ada-Retrieval: An Adaptive Multi-Round Retrieval Paradigm for Sequential
Recommendations [50.03560306423678]
本稿では,レコメンダシステムのための適応型マルチラウンド検索パラダイムであるAda-Retrievalを提案する。
Ada-Retrievalは、ユーザー表現を反復的に洗練し、全項目領域の潜在的な候補をよりよく捉えます。
論文 参考訳(メタデータ) (2024-01-12T15:26:40Z) - Improving Text Matching in E-Commerce Search with A Rationalizable,
Intervenable and Fast Entity-Based Relevance Model [78.80174696043021]
エンティティベース関連モデル(EBRM)と呼ばれる新しいモデルを提案する。
この分解により、高精度にクロスエンコーダQE関連モジュールを使用できる。
また、ユーザログから自動生成されたQEデータによるQEモジュールの事前トレーニングにより、全体的なパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-07-01T15:44:53Z) - Unified Embedding Based Personalized Retrieval in Etsy Search [0.206242362470764]
グラフ, 変換器, 項ベース埋め込みを終末に組み込んだ統合埋め込みモデルを学習することを提案する。
我々のパーソナライズされた検索モデルは、検索購入率5.58%、サイト全体のコンバージョン率2.63%によって、検索体験を著しく改善する。
論文 参考訳(メタデータ) (2023-06-07T23:24:50Z) - Quick-Tune: Quickly Learning Which Pretrained Model to Finetune and How [62.467716468917224]
本稿では,最適事前学習モデルとハイパーパラメータを共同で探索し,微調整する手法を提案する。
本手法は,一連のデータセット上で,事前学習したモデルの性能に関する知識を伝達する。
得られたアプローチによって、新しいデータセットの正確な事前学習モデルを迅速に選択できることを実証的に実証する。
論文 参考訳(メタデータ) (2023-06-06T16:15:26Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Heterogeneous Network Embedding for Deep Semantic Relevance Match in
E-commerce Search [29.881612817309716]
Eコマースアイテム関連性のためのエンドツーエンドの第一次および第二次関連性予測モデルを設計します。
BERTから生成された外部知識を導入し,ユーザ行動のネットワークを改良する。
オフライン実験の結果,新しいモデルにより,人間関係判定における予測精度が有意に向上した。
論文 参考訳(メタデータ) (2021-01-13T03:12:53Z) - Learning Robust Models for e-Commerce Product Search [23.537201383165755]
検索クエリ意図にマッチしないアイテムを表示することは、eコマースにおける顧客エクスペリエンスを低下させる。
問題を緩和するには、大きなラベル付きデータセットが必要である。
我々は、ミスマッチを効果的に分類することを学ぶ、深いエンドツーエンドモデルを開発する。
論文 参考訳(メタデータ) (2020-05-07T17:22:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。