論文の概要: Semantic Retrieval for Product Search in E-Commerce
- arxiv url: http://arxiv.org/abs/2606.01504v1
- Date: Sun, 31 May 2026 23:59:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.739601
- Title: Semantic Retrieval for Product Search in E-Commerce
- Title(参考訳): Eコマースにおける製品検索のセマンティック検索
- Authors: Nikhil Kothari, Saksham Samdani, Ritam Mallick, Praveen Gupta, Ankit Vijay, Surender Kumar,
- Abstract要約: 本稿では,2段パイプラインで訓練したSiamese LLMデュアルエンコーダを提案する。
優先最適化の目的は、Bradley-Terryを変数サイズのグレードレバレンスグループに拡張する。
得られたシステムは、置換品や補完品を正しく注文しながら、正確な一致を正確に検索する。
- 参考スコア(独自算出の注目度): 2.101206887508497
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic retrieval in e-commerce must handle short, noisy, and colloquial queries over large product catalogs with fine-grained attribute distinctions. We present a Siamese LLM dual-encoder trained through a two-stage pipeline: contrastive learning with a false-negative margin mask to prevent penalization of near-duplicate products, followed by Relative Odds Alignment for Retrieval (ROAR), a preference optimization objective that extends Bradley-Terry to variable-sized graded relevance groups via consecutive odds-ratio margins. The training corpus mirrors this progression - substitute query-product pairs provide coarse semantic supervision in Stage 1 and graded relevance annotations drive fine-grained ranking in Stage 2. The resulting system accurately retrieves exact matches while correctly ordering substitutes and complementary products, with gains confirmed across query-frequency strata and business verticals, and statistical significance validated through live A/B deployment at scale.
- Abstract(参考訳): 電子商取引におけるセマンティック検索は、きめ細かい属性の区別のある大規模製品カタログ上での、短く、騒々しく、口語的なクエリを処理しなければならない。
2段階のパイプラインを通して訓練されたシームズLLMデュアルエンコーダ: 偽負のマージンマスクを用いた対照的な学習により、ほぼ重複した商品のペナル化を防ぎ、続いてRelative Odds Alignment for Retrieval (ROAR) が続く。
代替クエリプロダクトペアは、ステージ1で粗いセマンティックな監視を提供し、グレードされた関連アノテーションはステージ2できめ細かいランク付けを可能にします。
得られたシステムは、クエリ頻度層とビジネスの垂直方向のゲインを確認しながら、置換品と補完品を正しく順序付けしながら、正確な一致を正確に検索し、大規模A/B展開を通じて統計的に検証する。
関連論文リスト
- Mine and Refine: Optimizing Graded Relevance in E-commerce Search Retrieval [3.1241290518951197]
大規模なeコマース検索要求は、長い尾のノイズの多いクエリに一般化される。
セマンティックテキスト埋め込みのための2段階の「Mine and Refine」コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-19T18:56:36Z) - S-GRec: Personalized Semantic-Aware Generative Recommendation with Asymmetric Advantage [20.189274601152363]
S-GRecは、オンライン軽量ジェネレータをオフラインセマンティックジャッジから切り離して、列車時の監視を行うセマンティックアウェアフレームワークである。
S-GRecは2段階のパーソナライズドセマンティックジャッジ(PSJ)を導入し、解釈可能なアスペクトエビデンスを生成し、ユーザ条件アグリゲーションを学習する。
公開ベンチマークと大規模生産システムに関する大規模な実験は、有効性とスケーラビリティの両方を検証する。
論文 参考訳(メタデータ) (2026-02-11T07:54:26Z) - LLMs as Sparse Retrievers:A Framework for First-Stage Product Search [103.70006474544364]
プロダクト検索は、現代のeコマースプラットフォームにおいて重要な要素であり、毎日何十億ものユーザークエリがある。
スパース検索法は語彙ミスマッチの問題に悩まされ, 製品検索のシナリオにおいて, 最適以下の性能が向上する。
セマンティック分析の可能性により、大言語モデル(LLM)は語彙ミスマッチ問題を緩和するための有望な道を提供する。
本稿では,SParsE Retrievers として LLM を利用した製品検索フレームワーク PROSPER を提案する。
論文 参考訳(メタデータ) (2025-10-21T11:13:21Z) - Improving E-commerce Search with Category-Aligned Retrieval [0.0]
カテゴリー対応検索システム(CARS)は,まずユーザのクエリから製品カテゴリを予測し,そのカテゴリ内で製品を強化することによって,検索関連性を向上させる。
本稿では,クエリの埋め込みから"Trainable Category Prototypes"を作成する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-09-03T20:43:52Z) - NEAR$^2$: A Nested Embedding Approach to Efficient Product Retrieval and Ranking [14.008264174074487]
NEAR$2$と呼ばれる製品検索とランキングに対するNested Embedding Approachを提案する。
提案手法は,既存のモデルと比較して,より小さな埋め込み次元よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2025-06-24T16:02:02Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Meta-Learning Adversarial Bandit Algorithms [55.72892209124227]
我々は,バンディットフィードバックを用いたオンラインメタラーニングについて研究する。
我々は自己協和障壁正規化器を用いてオンラインミラー降下一般化(OMD)をチューニングすることを学ぶ。
論文 参考訳(メタデータ) (2023-07-05T13:52:10Z) - Meta-Learning Adversarial Bandits [49.094361442409785]
本研究の目的は,複数のタスクにまたがる帯域幅フィードバックを用いてオンライン学習を学習し,タスク間の平均性能を改善することである。
敵対的設定を最初に対象とするメタアルゴリズムとして,マルチアーム・バンディット(MAB)とバンディット・最適化(BLO)の2つの重要なケースに対して,特定の保証を設定するメタアルゴリズムを設計する。
我々の保証は、非正規化されたフォローザリーダーと乗法重みを組み合わせることで、オンラインで非滑らかで非Bシーケンスを学ぶのに十分であることを示すことに依存しています。
論文 参考訳(メタデータ) (2022-05-27T17:40:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。