論文の概要: RCEM: Embedder Equipped with Query Rewriting Skill for Robust Conversational Search in Distributional Shift
- arxiv url: http://arxiv.org/abs/2606.01697v1
- Date: Mon, 01 Jun 2026 05:04:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.379545
- Title: RCEM: Embedder Equipped with Query Rewriting Skill for Robust Conversational Search in Distributional Shift
- Title(参考訳): RCEM:分散シフトにおけるロバスト会話探索のためのクエリ書き換えスキルを備えた埋め込み機
- Authors: Kilho Son, Paul Hsu, Cha Zhang, Dinei Florencio,
- Abstract要約: 本稿では,LLMの問合せ変換能力を埋込みモデルに蒸留する,対話型高密度検索モデルRCEMを提案する。
直接の会話と文書のマッチングを学習する従来の会話の密集した検索手法とは異なり、RCEMは会話クエリの埋め込みと書き直しクエリの埋め込みを整列する。
QReCC、TopiOCQA、TREC CAsTの実験は、RCEMが強い会話検索ベースラインを一貫して上回ることを示した。
- 参考スコア(独自算出の注目度): 7.4048532358172245
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Conversational search has become increasingly important in retrieval-augmented generation (RAG) systems, where users interact with AI assistants through multi-turn conversations containing context-dependent queries. We propose RCEM, a conversational dense retrieval model that distills the query reformulation capability of LLMs into the embedding model, enabling context-aware retrieval without explicit query rewriting during inference. Unlike prior conversational dense retrieval approaches that learn direct conversation-to-document matching, RCEM aligns conversational-query embeddings with rewritten-query embeddings, improving robustness under distributional shift. RCEM does not require conversational query-to-document relevance mappings for training, which are often expensive and difficult to obtain with high quality. Extensive experiments on QReCC, TopiOCQA, and TREC CAsT demonstrate that RCEM consistently outperforms strong conversational retrieval baselines, achieving particularly large gains under distributional shift, including up to 20% improvement in Recall@10. RCEM further extends the base embedding model with conversational query rewriting capability while preserving its original retrieval functionality, allowing both standalone and conversational queries to be encoded by a single model and searched against existing document indexes without rebuilding the retrieval database.
- Abstract(参考訳): 会話検索は、ユーザがコンテキスト依存クエリを含むマルチターン会話を通じてAIアシスタントと対話する検索強化世代(RAG)システムにおいて、ますます重要になっている。
提案するRCEMは,LLMの問合せ変換能力を埋め込みモデルに蒸留し,推論中に明示的な問合せ書き換えを行なわずにコンテキスト認識検索を可能にする,対話型密集検索モデルである。
直接の会話と文書のマッチングを学習する従来の会話の密集検索手法とは異なり、RCEMは、会話のクエリの埋め込みを書き換えたクエリの埋め込みと整合させ、分散シフト下での堅牢性を向上させる。
RCEMは、高い品質で入手し難い訓練のために、対話型のクエリ・ツー・ドキュメント・レバレンス・マッピングを必要としない。
QReCC、TopiOCQA、TREC CAsTの大規模な実験は、RCEMが強い会話検索ベースラインを一貫して上回り、Recall@10の最大20%の改善を含む、分散シフトの下で特に大きな利益を得ることを示した。
RCEMはさらに、元の検索機能を保ちながら、会話クエリ書き換え機能を備えたベース埋め込みモデルを拡張し、スタンドアロンおよび会話クエリを単一のモデルでエンコードし、検索データベースを再構築することなく既存のドキュメントインデックスに対して検索できるようにする。
関連論文リスト
- Aligning Query Representation with Rewritten Query and Relevance Judgments in Conversational Search [32.35446999027349]
我々は、より優れたクエリ表現モデルをトレーニングするために、リライトされたクエリと会話検索データの関連判断の両方を活用する。
提案したモデル --Query Representation Alignment Conversational Retriever(QRACDR)は、8つのデータセットでテストされる。
論文 参考訳(メタデータ) (2024-07-29T17:14:36Z) - Conversational Query Reformulation with the Guidance of Retrieved Documents [4.438698005789677]
本稿では,最初に検索したドキュメントからキー情報を活用することでクエリを洗練するフレームワークである GuideCQR を紹介する。
提案手法は,複数のデータセットにまたがる最先端性能を実現し,従来のCQR手法よりも優れていた。
論文 参考訳(メタデータ) (2024-07-17T07:39:16Z) - Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.243879779374836]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文 参考訳(メタデータ) (2024-02-20T14:31:17Z) - SSP: Self-Supervised Post-training for Conversational Search [63.28684982954115]
本稿では,対話型検索モデルを効率的に初期化するための3つの自己教師型タスクを備えた学習後パラダイムであるフルモデル(モデル)を提案する。
提案手法の有効性を検証するために,CAsT-19 と CAsT-20 の2つのベンチマークデータセットを用いて,会話検索タスクにモデルにより訓練後の会話エンコーダを適用した。
論文 参考訳(メタデータ) (2023-07-02T13:36:36Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z) - Open-Retrieval Conversational Question Answering [62.11228261293487]
オープン検索型対話型質問応答 (ORConvQA) の設定を導入する。
ORConvQAのエンド・ツー・エンドシステムを構築し,レトリバー,リランカ,およびすべてトランスフォーマーをベースとしたリーダを特徴とする。
論文 参考訳(メタデータ) (2020-05-22T19:39:50Z) - Multi-Stage Conversational Passage Retrieval: An Approach to Fusing Term
Importance Estimation and Neural Query Rewriting [56.268862325167575]
マルチステージアドホックIRシステムにクエリ再構成を組み込んだ会話経路検索(ConvPR)に取り組む。
本稿では,1項の重要度推定と2項のニューラルクエリ書き換えという2つの手法を提案する。
前者に対しては、周波数に基づく信号を用いて会話コンテキストから抽出した重要な用語を用いて会話クエリを拡張する。
後者では,会話クエリを,事前訓練されたシーケンス列列列モデルを用いて,自然な,スタンドアロンの,人間の理解可能なクエリに再構成する。
論文 参考訳(メタデータ) (2020-05-05T14:30:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。