論文の概要: Improving E-commerce Search with Category-Aligned Retrieval
- arxiv url: http://arxiv.org/abs/2510.21711v1
- Date: Wed, 03 Sep 2025 20:43:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.099339
- Title: Improving E-commerce Search with Category-Aligned Retrieval
- Title(参考訳): カテゴリー別検索によるeコマース検索の改善
- Authors: Rauf Aliev,
- Abstract要約: カテゴリー対応検索システム(CARS)は,まずユーザのクエリから製品カテゴリを予測し,そのカテゴリ内で製品を強化することによって,検索関連性を向上させる。
本稿では,クエリの埋め込みから"Trainable Category Prototypes"を作成する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional e-commerce search systems often struggle with the semantic gap between user queries and product catalogs. In this paper, we propose a Category-Aligned Retrieval System (CARS) that improves search relevance by first predicting the product category from a user's query and then boosting products within that category. We introduce a novel method for creating "Trainable Category Prototypes" from query embeddings. We evaluate this method with two models: a lightweight all-MiniLM-L6-v2 and OpenAI's text-embedding-ada-002. Our offline evaluation shows this method is highly effective, with the OpenAI model increasing Top-3 category prediction accuracy from a zero-shot baseline of 43.8% to 83.2% after training. The end-to-end simulation, however, highlights the limitations of blindly applying category boosts in a complex retrieval pipeline: while accuracy is high, naive integration can negatively affect search relevance metrics such as nDCG@10. We argue that this is partly due to dataset-specific ambiguities (e.g., polysemous queries in the Amazon ESCI corpus) and partly due to the sensitivity of retrieval systems to over-constraining filters. Crucially, these results do not diminish the value of the approach; rather, they emphasize the need for confidence-aware and adaptive integration strategies.
- Abstract(参考訳): 従来のeコマース検索システムは、ユーザクエリと製品カタログのセマンティックなギャップに悩まされることが多い。
本稿では、まず、ユーザのクエリから製品カテゴリを予測し、そのカテゴリ内で製品を強化することにより、検索関連性を向上するカテゴリ対応検索システム(CARS)を提案する。
本稿では,クエリの埋め込みから"Trainable Category Prototypes"を作成する新しい手法を提案する。
本手法は,軽量な全MiniLM-L6-v2とOpenAIのテキスト埋め込み-ada-002の2つのモデルを用いて評価する。
オフライン評価では、この手法が極めて有効であることが示され、OpenAIモデルでは、ゼロショットベースラインの43.8%から83.2%まで、トップ3カテゴリ予測の精度が向上している。
しかし、エンドツーエンドのシミュレーションでは、複雑な検索パイプラインにおいて、カテゴリアップを盲目的に適用する制限が強調されている: 精度が高い一方で、単純統合はnDCG@10のような検索関連指標に悪影響を及ぼす可能性がある。
これは、データセット固有のあいまいさ(例えば、Amazon ESCIコーパスの多文クエリ)と、過剰制約フィルタに対する検索システムの感度によるものである、と我々は主張する。
重要な点として、これらの結果はアプローチの価値を低下させるものではなく、信頼性を認識し、適応的な統合戦略の必要性を強調している。
関連論文リスト
- OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search [43.94443394870866]
OneSearchは、eコマース検索のための最初の産業向けエンドツーエンド生成フレームワークである。
OneSearchは運用費を75.40%削減し、Model FLOPsの利用を3.26%から27.32%に改善した。
このシステムはKuaishouの複数の検索シナリオにまたがって展開され、数百万のユーザーにサービスを提供している。
論文 参考訳(メタデータ) (2025-09-03T11:50:04Z) - GLiClass: Generalist Lightweight Model for Sequence Classification Tasks [49.2639069781367]
本稿では,シーケンス分類タスクにGLiNERアーキテクチャを適用する新しい手法であるGLiClassを提案する。
提案手法は,ゼロショットおよび少数ショット学習シナリオに必要な柔軟性を維持しつつ,埋め込み方式に匹敵する高い精度と効率を実現する。
論文 参考訳(メタデータ) (2025-08-11T06:22:25Z) - Adaptive Retrieval and Scalable Indexing for k-NN Search with Cross-Encoders [77.84801537608651]
クエリ-イムペアを共同で符号化することで類似性を計算するクロスエンコーダ(CE)モデルは、クエリ-イム関連性を推定する埋め込みベースモデル(デュアルエンコーダ)よりも優れている。
本稿では,潜時クエリとアイテム埋め込みを効率的に計算してCEスコアを近似し,CE類似度を近似したk-NN探索を行うスパース行列分解法を提案する。
論文 参考訳(メタデータ) (2024-05-06T17:14:34Z) - Investigating the Limitation of CLIP Models: The Worst-Performing
Categories [53.360239882501325]
コントラスト言語-画像事前学習(CLIP)は、自然言語を視覚概念に統合する基礎モデルを提供する。
通常、十分に設計されたテキストプロンプトによって、多くの領域で満足な全体的な精度が達成できると期待されている。
しかし、最悪のカテゴリにおけるパフォーマンスは、全体的なパフォーマンスよりも著しく劣っていることがわかった。
論文 参考訳(メタデータ) (2023-10-05T05:37:33Z) - DST-Det: Simple Dynamic Self-Training for Open-Vocabulary Object Detection [72.25697820290502]
この研究は、ゼロショット分類によって潜在的に新しいクラスを特定するための単純かつ効率的な戦略を導入する。
このアプローチは、アノテーションやデータセット、再学習を必要とせずに、新しいクラスのリコールと精度を高めるセルフトレーニング戦略として言及する。
LVIS、V3Det、COCOを含む3つのデータセットに対する実証的な評価は、ベースラインのパフォーマンスを大幅に改善したことを示している。
論文 参考訳(メタデータ) (2023-10-02T17:52:24Z) - Fast Offline Policy Optimization for Large Scale Recommendation [74.78213147859236]
我々は、カタログサイズと対数的にスケールするこれらのポリシー学習アルゴリズムの近似を導出する。
私たちの貢献は3つの新しいアイデアの組み合わせに基づいている。
我々の推定器は、単純なアプローチよりも桁違いに速いが、等しく良いポリシーを生成する。
論文 参考訳(メタデータ) (2022-08-08T11:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。