論文の概要: Generating Query-Relevant Document Summaries via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2508.08404v1
- Date: Mon, 11 Aug 2025 18:52:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.209831
- Title: Generating Query-Relevant Document Summaries via Reinforcement Learning
- Title(参考訳): 強化学習によるクエリ関連文書要約の生成
- Authors: Nitin Yadav, Changsung Kang, Hongwei Shang, Ming Sun,
- Abstract要約: ReLSumは、検索関連性に最適化された製品記述のクエリ関連要約を生成するために設計された強化学習フレームワークである。
このフレームワークは、トレーニング可能な大言語モデル(LLM)を使用して要約を生成し、その後、クロスエンコーダランキングモデルの入力として使用される。
実験の結果、オンラインユーザエンゲージメント指標と同様に、リコールやNDCGを含むオフラインメトリクスの大幅な改善が示されている。
- 参考スコア(独自算出の注目度): 5.651096645934245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: E-commerce search engines often rely solely on product titles as input for ranking models with latency constraints. However, this approach can result in suboptimal relevance predictions, as product titles often lack sufficient detail to capture query intent. While product descriptions provide richer information, their verbosity and length make them unsuitable for real-time ranking, particularly for computationally expensive architectures like cross-encoder ranking models. To address this challenge, we propose ReLSum, a novel reinforcement learning framework designed to generate concise, query-relevant summaries of product descriptions optimized for search relevance. ReLSum leverages relevance scores as rewards to align the objectives of summarization and ranking, effectively overcoming limitations of prior methods, such as misaligned learning targets. The framework employs a trainable large language model (LLM) to produce summaries, which are then used as input for a cross-encoder ranking model. Experimental results demonstrate significant improvements in offline metrics, including recall and NDCG, as well as online user engagement metrics. ReLSum provides a scalable and efficient solution for enhancing search relevance in large-scale e-commerce systems.
- Abstract(参考訳): 電子商取引検索エンジンは、遅延制約のあるランキングモデルの入力として製品タイトルのみに依存することが多い。
しかし、このアプローチは、製品タイトルがクエリインテントをキャプチャするのに十分な詳細を欠くことが多いため、最適でない関連性予測をもたらす可能性がある。
製品の説明はよりリッチな情報を提供するが、その冗長性や長さはリアルタイムのランキング、特にクロスエンコーダランキングモデルのような計算コストの高いアーキテクチャには適さない。
この課題に対処するために、検索関連性に最適化された製品記述の簡潔でクエリ関連のある要約を生成するために設計された、新しい強化学習フレームワークであるReLSumを提案する。
ReLSumは、関連スコアを報酬として活用し、要約とランク付けの目的を整合させ、非整合学習目標のような従来の手法の限界を効果的に克服する。
このフレームワークは、トレーニング可能な大言語モデル(LLM)を使用して要約を生成し、その後、クロスエンコーダランキングモデルの入力として使用される。
実験の結果、オンラインユーザエンゲージメント指標と同様に、リコールやNDCGを含むオフラインメトリクスの大幅な改善が示されている。
ReLSumは、大規模eコマースシステムにおける検索関連性を高めるスケーラブルで効率的なソリューションを提供する。
関連論文リスト
- Intent-Aware Neural Query Reformulation for Behavior-Aligned Product Search [0.0]
この作業では、大規模なバイヤークエリログのマイニングと分析用に設計された堅牢なデータパイプラインが導入されている。
パイプラインは、潜在購入意図を示すパターンを体系的にキャプチャし、高忠実でインテントリッチなデータセットの構築を可能にする。
本研究は,スパースユーザ入力と複雑な製品発見目標とのギャップを埋めることにおける意図中心モデリングの価値を強調した。
論文 参考訳(メタデータ) (2025-07-29T20:20:07Z) - Lightweight and Direct Document Relevance Optimization for Generative Information Retrieval [49.669503570350166]
生成情報検索(GenIR)は、文書識別子(ドシデント)生成タスクとして文書検索を定式化する有望なニューラル検索パラダイムである。
既存のGenIRモデルはトークンレベルのミスアライメントに悩まされており、次のトークンを予測するためにトレーニングされたモデルは、ドキュメントレベルの関連性を効果的にキャプチャできないことが多い。
本稿では,トークンレベルのドシデント生成と文書レベルのドシデンス推定をペアのランク付けによる直接最適化により整合するダイレクトドキュメントレバレンス最適化(DDRO)を提案する。
論文 参考訳(メタデータ) (2025-04-07T15:27:37Z) - Generative Retrieval and Alignment Model: A New Paradigm for E-commerce Retrieval [12.318142818707317]
本稿では,GRAM(Generative Retrieval and Alignment Model)という新しいeコマース検索パラダイムを紹介する。
GRAMは、クエリと製品の両方からのテキスト情報を共同でトレーニングして、共有テキストコードを生成する。
GRAMは従来のモデルと最新の生成的検索モデルを大きく上回っている。
論文 参考訳(メタデータ) (2025-04-02T06:40:09Z) - Self-Calibrated Listwise Reranking with Large Language Models [137.6557607279876]
大規模言語モデル (LLM) はシーケンシャル・ツー・シーケンス・アプローチによってタスクのランク付けに使用されている。
この階調のパラダイムは、より大きな候補集合を反復的に扱うためにスライディングウインドウ戦略を必要とする。
そこで本稿では,LLMを用いた自己校正リストのランク付け手法を提案する。
論文 参考訳(メタデータ) (2024-11-07T10:31:31Z) - CROSS-JEM: Accurate and Efficient Cross-encoders for Short-text Ranking Tasks [12.045202648316678]
トランスフォーマーベースのランキングモデルは、そのようなタスクに対する最先端のアプローチである。
CROSS-JEM(Joint Efficient Modeling)を用いたクロスエンコーダを提案する。
CROSS-JEMは、トランスフォーマーベースのモデルでクエリの複数の項目を共同でスコアすることを可能にする。
最先端の精度を実現し、標準のクロスエンコーダよりも4倍低いランクのレイテンシを実現している。
論文 参考訳(メタデータ) (2024-09-15T17:05:35Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - Improving Text Matching in E-Commerce Search with A Rationalizable,
Intervenable and Fast Entity-Based Relevance Model [78.80174696043021]
エンティティベース関連モデル(EBRM)と呼ばれる新しいモデルを提案する。
この分解により、高精度にクロスエンコーダQE関連モジュールを使用できる。
また、ユーザログから自動生成されたQEデータによるQEモジュールの事前トレーニングにより、全体的なパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-07-01T15:44:53Z) - Multi-Label Learning to Rank through Multi-Objective Optimization [9.099663022952496]
近年,情報検索システムではランク付け技法の学習が至るところで行われている。
あいまいさを解決するためには、多くの関連基準を用いてモデルを訓練することが望ましい。
本稿では,ラベルからの情報を様々な方法で組み合わせて,目標間のトレードオフを特徴付ける,汎用的な枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-07T03:02:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。