論文の概要: Relevance Matters: A Multi-Task and Multi-Stage Large Language Model Approach for E-commerce Query Rewriting
- arxiv url: http://arxiv.org/abs/2603.02555v1
- Date: Tue, 03 Mar 2026 03:18:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.618164
- Title: Relevance Matters: A Multi-Task and Multi-Stage Large Language Model Approach for E-commerce Query Rewriting
- Title(参考訳): 関連事項:Eコマースクエリ書き換えのためのマルチタスクおよびマルチステージ大規模言語モデルアプローチ
- Authors: Aijun Dai, Jixiang Zhang, Haiqing Hu, Guoyu Tang, Lin Liu, Ziguang Cheng,
- Abstract要約: 本研究では,大規模言語モデル(LLM)に基づくマルチタスクおよびマルチステージクエリ書き換えフレームワークを提案する。
2025年8月以降、当社のアプローチは、中国の大手オンラインショッピングプラットフォームであるJD.comで実施されている。
- 参考スコア(独自算出の注目度): 6.891672336300552
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For e-commerce search, user experience is measured by users' behavioral responses to returned products, like click-through rate and conversion rate, as well as the relevance between returned products and search queries. Consequently, relevance and user conversion constitute the two primary objectives in query rewriting, a strategy to bridge the lexical gap between user expressions and product descriptions. This research proposes a multi-task and multi-stage query rewriting framework grounded in large language models (LLMs). Critically, in contrast to previous works that primarily emphasized rewritten query generation, we inject the relevance task into query rewriting. Specifically, leveraging a pretrained model on user data and product information from JD.com, the approach initiates with multi-task supervised fine-tuning (SFT) comprising of the rewritten query generation task and the relevance tagging task between queries and rewrites. Subsequently, we employ Group Relative Policy Optimization (GRPO) for the model's objective alignment oriented toward enhancing the relevance and stimulating user conversions. Through offline evaluation and online A/B test, our framework illustrates substantial improvements in the effectiveness of e-commerce query rewriting, resulting in elevating the search results' relevance and boosting the number of purchases made per user (UCVR). Since August 2025, our approach has been implemented on JD.com, one of China's leading online shopping platforms.
- Abstract(参考訳): 電子商取引検索では、クリックスルー率やコンバージョン率などの返品品品に対するユーザの行動反応、および返品品と検索クエリとの関係からユーザエクスペリエンスを測定する。
その結果、関連性とユーザ変換は、ユーザ表現と製品記述の間の語彙的ギャップを埋める戦略である、クエリ書き換えにおける2つの主要な目的を構成する。
本研究では,大規模言語モデル(LLM)に基づくマルチタスクおよびマルチステージクエリ書き換えフレームワークを提案する。
批判的に、リライトされたクエリ生成を主に強調する以前の作業とは対照的に、クエリ書き換えに関連タスクを注入します。
具体的には、JD.comのユーザデータと製品情報に基づいて事前訓練されたモデルを利用して、リライトされたクエリ生成タスクとクエリとリライトの間の関連タグ付けタスクからなるマルチタスクによる微調整(SFT)を開始する。
次に,モデルの妥当性向上とユーザ変換の促進を目的とした目標アライメントに対して,グループ相対ポリシー最適化(GRPO)を採用する。
オフライン評価とオンラインA/Bテストにより,eコマースクエリ書き換えの有効性が大幅に向上し,検索結果の関連性が向上し,ユーザ毎の購入数(UCVR)が増加した。
2025年8月以降、当社のアプローチは、中国の大手オンラインショッピングプラットフォームであるJD.comで実施されている。
関連論文リスト
- Synthetic Data Powers Product Retrieval for Long-tail Knowledge-Intensive Queries in E-commerce Search [16.441153527403163]
製品検索はeコマース検索のバックボーンであり、高品質のランキングとユーザー体験の基礎を築いた。
メインストリームクエリの広範な最適化にもかかわらず、既存のシステムは依然としてロングテールクエリに苦戦している。
本稿では,長期の知識集約型クエリを含む検索に適した効率的なデータ合成フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-27T02:53:17Z) - Test-Time Scaling Strategies for Generative Retrieval in Multimodal Conversational Recommendations [70.94563079082751]
電子商取引は、複雑なマルチターンユーザーインタラクションを管理する上で、伝統的な製品検索システムの限界を明らかにしている。
本稿では,対話型マルチモーダル製品検索にテスト時間スケーリングを導入する新しいフレームワークを提案する。
提案手法は生成型レトリバー上に構築され,さらに検索精度の向上と,対話を通してユーザ意図の進化と結果の整合性を向上するテストタイムリグレード機構が組み込まれている。
論文 参考訳(メタデータ) (2025-08-25T15:38:56Z) - AI Guided Accelerator For Search Experience [4.832123045961485]
本稿では,ユーザの最終購入意図に向けての旅の間に生じる中間的変更を,トランジショナルなクエリを明示的にモデル化する新しいフレームワークを提案する。
このアプローチは,探索行動や意図の洗練を反映した中途半端なトランジションをユーザのショッピングファンネルをモデル化する。
我々の貢献には、(i)トランザクショナルクエリの形式的識別とモデリング、(ii)インテントフロー理解のための構造化クエリシーケンスマイニングパイプラインの導入、(iii)スケーラブルでインテント対応のクエリ拡張のためのLLMの適用が含まれる。
論文 参考訳(メタデータ) (2025-07-25T23:26:00Z) - Multi-objective Aligned Bidword Generation Model for E-commerce Search Advertising [16.8420671443003]
検索システムは、ユーザクエリを最も関連性の高い広告とマッチングするという課題に対処する。
識別器,ジェネレータ,選好アライメントモジュールで構成される多目的整列バイドワード生成モデル(MoBGM)を提案する。
提案アルゴリズムは,オフラインおよびオンライン実験において,技術の現状を著しく上回っている。
論文 参考訳(メタデータ) (2025-06-04T10:57:18Z) - MultiConIR: Towards multi-condition Information Retrieval [38.864056667809095]
MultiConIRは、複雑なマルチ条件クエリシナリオ下での検索および再ランクモデルの評価のために設計されたベンチマークである。
ほとんどのレトリバーとリランカは、クエリの複雑さが増大するにつれて、パフォーマンスが大幅に低下する。
この研究は、リランカの性能劣化の原因を解明し、クエリ内の条件位置が類似性評価にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2025-03-11T05:02:03Z) - Re-ranking the Context for Multimodal Retrieval Augmented Generation [28.63893944806149]
Retrieval-augmented Generation (RAG)は、文脈内で応答を生成するために外部知識を組み込むことで、大きな言語モデル(LLM)を強化する。
RAGシステムは固有の課題に直面している: (i) 検索プロセスはユーザクエリ(画像、文書など)への無関係なエントリを選択することができ、 (ii) 視覚言語モデルや GPT-4o のようなマルチモーダル言語モデルは、RAG出力を生成するためにこれらのエントリを処理する際に幻覚を与える。
より高度な関連性尺度を用いることで、知識ベースからより関連性の高い項目を選択して排除することにより、検索プロセスを強化することができることを示す。
論文 参考訳(メタデータ) (2025-01-08T18:58:22Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - MMGRec: Multimodal Generative Recommendation with Transformer Model [81.61896141495144]
MMGRecは、マルチモーダルレコメンデーションに生成パラダイムを導入することを目指している。
まず,階層的な量子化手法であるGraph CF-RQVAEを考案し,各項目にRec-IDを割り当てる。
次に、Transformerベースのレコメンデータをトレーニングし、過去のインタラクションシーケンスに基づいて、ユーザが推奨するアイテムのRec-IDを生成する。
論文 参考訳(メタデータ) (2024-04-25T12:11:27Z) - Selecting Query-bag as Pseudo Relevance Feedback for Information-seeking Conversations [76.70349332096693]
情報検索対話システムは電子商取引システムで広く利用されている。
クエリバッグに基づくPseudo Relevance Feedback framework(QB-PRF)を提案する。
関連クエリを備えたクエリバッグを構築し、擬似シグナルとして機能し、情報検索の会話をガイドする。
論文 参考訳(メタデータ) (2024-03-22T08:10:32Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - Context-Aware Query Rewriting for Improving Users' Search Experience on
E-commerce Websites [47.04727122209316]
電子商取引のクエリはしばしば短く曖昧である。
ユーザーは購入する前に複数の検索を入力し、それをコンテキストと呼ぶ。
本稿では,エンド・ツー・エンドのコンテキスト認識型クエリ書き換えモデルを提案する。
論文 参考訳(メタデータ) (2022-09-15T19:46:01Z) - Query Rewriting via Cycle-Consistent Translation for E-Commerce Search [13.723266150864037]
本稿では,新しいディープニューラルネットワークによる問合せ書き換え手法を提案する。
繰り返し機械翻訳問題にクエリ書き換えを定式化します。
最新の機械翻訳モデルと連動した、新しいサイクル整合性トレーニングアルゴリズムを紹介します。
論文 参考訳(メタデータ) (2021-03-01T06:47:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。