論文の概要: uva-irlab-conv at SemEval-2026 Task 8: Multi-Turn RAG with Learned Sparse Retrieval and Listwise Reranking
- arxiv url: http://arxiv.org/abs/2606.11945v1
- Date: Wed, 10 Jun 2026 11:16:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.426961
- Title: uva-irlab-conv at SemEval-2026 Task 8: Multi-Turn RAG with Learned Sparse Retrieval and Listwise Reranking
- Title(参考訳): uva-irlab-conv at SemEval-2026 Task 8:Learred Sparse Retrieval and Listwise Re rank with Multi-Turn RAG
- Authors: Simon Lupart, Kidist Amde Mekonnen, Zahra Abbasiantaeb, Mohammad Aliannejadi,
- Abstract要約: 本稿では,SemEval-2026タスク8におけるマルチターン検索と質問応答の取り組みについて述べる。
このタスクは4つのドメイン(ファイナンス、クラウドドキュメント、政府、ウィキペディア)にわたる会話システムを評価する。
学習されたスパース検索とLLMに基づく再ランク付けと生成を組み合わせたマルチターン検索拡張生成パイプラインを提案する。
- 参考スコア(独自算出の注目度): 20.55846935887221
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This report describes our participation in SemEval-2026 Task 8 on multi-turn retrieval and question answering. The task evaluates conversational systems across four domains (finance, cloud documentation, government, Wikipedia), and includes unanswerable queries where the available collection does not contain sufficient evidence to produce a complete response. We propose a multi-turn retrieval-augmented generation pipeline that combines learned sparse retrieval with LLM-based reranking and generation. Using sparse retrieval as the primary retrieval method, we leverage its strong generalization across domains. In addition, we make use of the long-context capabilities of LLMs for conversational query rewriting, pointwise and listwise reranking, and generating the final response, each conditioned on the full conversational history. This multi-step design enables effective integration of conversational context throughout retrieval and generation, improving robustness across domains.
- Abstract(参考訳): 本稿では,マルチターン検索と質問応答に関するSemEval-2026タスク8への参加について述べる。
このタスクは4つのドメイン(ファイナンス、クラウドドキュメンテーション、政府、ウィキペディア)にわたる会話システムを評価し、利用可能なコレクションが完全な応答を生成する十分な証拠を含まない、解決不可能なクエリを含む。
学習されたスパース検索とLLMに基づく再ランク付けと生成を組み合わせたマルチターン検索拡張生成パイプラインを提案する。
スパース検索を一次検索手法として利用し、ドメイン間の強い一般化を活用する。
さらに,LLMの長文長文機能を利用して,会話履歴の完全な条件付きで,問合せの書き直し,ポイントワイドおよびリストワイドの書き直し,最終応答の生成を行う。
この多段階設計により、検索と生成を通じて会話コンテキストを効果的に統合し、ドメイン間の堅牢性を向上させることができる。
関連論文リスト
- RCEM: Embedder Equipped with Query Rewriting Skill for Robust Conversational Search in Distributional Shift [7.4048532358172245]
本稿では,LLMの問合せ変換能力を埋込みモデルに蒸留する,対話型高密度検索モデルRCEMを提案する。
直接の会話と文書のマッチングを学習する従来の会話の密集した検索手法とは異なり、RCEMは会話クエリの埋め込みと書き直しクエリの埋め込みを整列する。
QReCC、TopiOCQA、TREC CAsTの実験は、RCEMが強い会話検索ベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2026-06-01T05:04:17Z) - DIVER: A Multi-Stage Approach for Reasoning-intensive Information Retrieval [36.38599923075882]
DIVERは、推論集約的な情報検索のために設計された検索パイプラインである。
ドキュメント前処理ステージ、クエリ拡張ステージ、検索ステージ、再ランクステージの4つのコンポーネントで構成されている。
BRIGHTベンチマークでは、DIVERは最先端のnDCG@10スコアを45.8点、オリジナルクエリでは28.9点と達成し、競争力のある推論モデルを上回っている。
論文 参考訳(メタデータ) (2025-08-11T13:57:49Z) - UniCoRN: Unified Commented Retrieval Network with LMMs [5.622291796324221]
合成多モーダル検索手法と生成言語アプローチを組み合わせた統一コメント検索ネットワークUniCoRNを紹介する。
合成マルチモーダル検索では+4.5%のリコールが,CoRでは+14.9%のMETEOR/+18.4%のBEMがRAGよりも改善された。
論文 参考訳(メタデータ) (2025-02-12T09:49:43Z) - IRLab@iKAT24: Learned Sparse Retrieval with Multi-aspect LLM Query Generation for Conversational Search [6.974395116689502]
iKAT 2024は、対話アシスタントの進化に焦点を当て、対話と応答をパーソナライズされたユーザー知識から適応することができる。
このトラックには、Personal Textual Knowledge Base(PTKB)と会話型AIタスク(通訳ランキングや応答生成など)が組み込まれている。
論文 参考訳(メタデータ) (2024-11-22T05:18:35Z) - MM-Embed: Universal Multimodal Retrieval with Multimodal LLMs [78.5013630951288]
本稿では,マルチモーダル大言語モデル(MLLM)を用いた情報検索手法を提案する。
まず,16個の検索タスクを持つ10個のデータセットに対して,MLLMをバイエンコーダレトリバーとして微調整する。
我々のモデルMM-Embedはマルチモーダル検索ベンチマークM-BEIR上で最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-11-04T20:06:34Z) - Learning When to Retrieve, What to Rewrite, and How to Respond in Conversational QA [16.1357049130957]
シングルターンSELF-RAGフレームワークを構築し,会話設定のためのSELF-multi-RAGを提案する。
SELF-multi-RAGは、関連するパスの検索に関して、シングルターン変種よりも改善された機能を示す。
論文 参考訳(メタデータ) (2024-09-23T20:05:12Z) - SuRe: Summarizing Retrievals using Answer Candidates for Open-domain QA of LLMs [85.54906813106683]
大規模言語モデル(LLM)を用いたオープンドメイン質問応答(ODQA)の簡易かつ効果的なフレームワークを提案する。
SuRe は LLM が与えられた質問に対するより正確な回答を予測するのに役立つ。
様々なODQAベンチマークの実験結果はSuReの優位性を示し、標準的なプロンプトアプローチよりも4.6%、F1スコアが4.0%向上した。
論文 参考訳(メタデータ) (2024-04-17T01:15:54Z) - Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.243879779374836]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文 参考訳(メタデータ) (2024-02-20T14:31:17Z) - End-to-end Knowledge Retrieval with Multi-modal Queries [50.01264794081951]
ReMuQは、テキストと画像のクエリからコンテンツを統合することで、大規模なコーパスから知識を取得するシステムを必要とする。
本稿では,入力テキストや画像を直接処理し,関連する知識をエンドツーエンドで検索する検索モデルReViz'を提案する。
ゼロショット設定下での2つのデータセットの検索において,優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-01T08:04:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。