論文の概要: RECOR: Reasoning-focused Multi-turn Conversational Retrieval Benchmark
- arxiv url: http://arxiv.org/abs/2601.05461v1
- Date: Fri, 09 Jan 2026 01:25:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.805535
- Title: RECOR: Reasoning-focused Multi-turn Conversational Retrieval Benchmark
- Title(参考訳): RECOR:マルチターン会話検索ベンチマーク
- Authors: Mohammed Ali, Abdelrahman Abdallah, Amit Agarwal, Hitesh Laxmichand Patel, Adam Jatowt,
- Abstract要約: 本稿では,11領域にわたる707の会話(2,971回)からなる推論に基づく会話情報検索のベンチマークを提案する。
品質を保証するために,複雑なクエリをファクトグラウンドのマルチターン対話に変換する分解検証フレームワークを開発した。
- 参考スコア(独自算出の注目度): 20.750773856512662
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Existing benchmarks treat multi-turn conversation and reasoning-intensive retrieval separately, yet real-world information seeking requires both. To bridge this gap, we present a benchmark for reasoning-based conversational information retrieval comprising 707 conversations (2,971 turns) across eleven domains. To ensure quality, our Decomposition-and-Verification framework transforms complex queries into fact-grounded multi-turn dialogues through multi-level validation, where atomic facts are verified against sources and explicit retrieval reasoning is generated for each turn. Comprehensive evaluation reveals that combining conversation history with reasoning doubles retrieval performance (Baseline .236 $\rightarrow$ History+Reasoning .479 nDCG@10), while reasoning-specialized models substantially outperform dense encoders. Despite these gains, further analysis highlights that implicit reasoning remains challenging, particularly when logical connections are not explicitly stated in the text.
- Abstract(参考訳): 既存のベンチマークでは、マルチターン会話と推論集約的な検索を別々に扱うが、実世界の情報検索には両方が必要である。
このギャップを埋めるために、11ドメインにわたる707の会話(2,971回)からなる推論に基づく会話情報検索のベンチマークを示す。
品質を保証するため,我々のDecomposition-and-Verificationフレームワークは,複雑なクエリをマルチレベル検証を通じて,実測に基づくマルチターン対話に変換し,各ターンに対してアトミックな事実を検証し,明示的な検索推論を生成する。
包括的評価では、会話履歴と推論の検索性能(Baseline .236 $\rightarrow$ History+Reasoning .479 nDCG@10)が2倍になる一方、推論特化モデルは高密度エンコーダを大幅に上回っている。
これらの利益にもかかわらず、さらに分析は、特に論理的接続がテキストで明示的に記述されていない場合、暗黙の推論が依然として困難であることを強調している。
関連論文リスト
- Thinking Forward and Backward: Multi-Objective Reinforcement Learning for Retrieval-Augmented Reasoning [137.33138614095435]
Retrieval-augmented Generation (RAG) は、大規模言語モデルにおける幻覚の緩和に有効であることが証明されている。
近年、検索に基づく対話をRAGに組み込んで、リアルタイム検索による反復推論を可能にしている。
提案するBi-RARは,各中間ステップを前方方向と後方方向の両方で共同で評価する,新たな検索拡張推論フレームワークである。
論文 参考訳(メタデータ) (2025-11-12T08:29:39Z) - MR$^2$-Bench: Going Beyond Matching to Reasoning in Multimodal Retrieval [86.35779264575154]
マルチモーダル検索は、現代のAIアプリケーションにおいて重要なコンポーネントになりつつあるが、その評価は、より現実的で困難なシナリオの要求に遅れている。
マルチモーダル検索のための推論集約型ベンチマークであるMR$2$-Benchを紹介する。
論文 参考訳(メタデータ) (2025-09-30T15:09:14Z) - UniConv: Unifying Retrieval and Response Generation for Large Language Models in Conversations [71.79210031338464]
会話における大規模言語モデルに対する高密度検索と応答生成の統一方法を示す。
目的の異なる共同微調整を行い、不整合リスクを低減するための2つのメカニズムを設計する。
5つの対話型検索データセットの評価は、我々の統合モデルがタスクを相互に改善し、既存のベースラインより優れていることを示す。
論文 参考訳(メタデータ) (2025-07-09T17:02:40Z) - DialogueReason: Rule-Based RL Sparks Dialogue Reasoning in LLMs [54.4857963044859]
本稿では,モノローグ型推論モデルにおける失われた役割を明らかにする推論パラダイムであるDialogueReasonを提案する。
本研究は,モノログ推論パターンの分析と対話に基づく推論手法の開発から成っている。
論文 参考訳(メタデータ) (2025-05-11T16:39:58Z) - History-Aware Conversational Dense Retrieval [31.203399110612388]
本稿では,コンテキスト依存型クエリ再構成と監視信号の自動マイニングという2つのアイデアを取り入れた,履歴認識型会話用Dense Retrieval(HAConvDR)システムを提案する。
2つの公開対話型検索データセットの実験は、HAConvDRの履歴モデリング機能の改善を実証している。
論文 参考訳(メタデータ) (2024-01-30T01:24:18Z) - Dialogue Chain-of-Thought Distillation for Commonsense-aware
Conversational Agents [35.6393824052347]
本稿では,対話連鎖推論(CoT)の枠組みを提案する。
DOCTOR, DialOgue Chain-of-Thught Reasonerについて紹介する。
我々は,DOCTORから高品質な理性を持つ対話エージェントの強化が,応答の質を著しく向上させることを示す実験を行った。
論文 参考訳(メタデータ) (2023-10-13T18:17:23Z) - Multi-Stage Conversational Passage Retrieval: An Approach to Fusing Term
Importance Estimation and Neural Query Rewriting [56.268862325167575]
マルチステージアドホックIRシステムにクエリ再構成を組み込んだ会話経路検索(ConvPR)に取り組む。
本稿では,1項の重要度推定と2項のニューラルクエリ書き換えという2つの手法を提案する。
前者に対しては、周波数に基づく信号を用いて会話コンテキストから抽出した重要な用語を用いて会話クエリを拡張する。
後者では,会話クエリを,事前訓練されたシーケンス列列列モデルを用いて,自然な,スタンドアロンの,人間の理解可能なクエリに再構成する。
論文 参考訳(メタデータ) (2020-05-05T14:30:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。