論文の概要: H-RAG at SemEval-2026 Task 8: Hierarchical Parent-Child Retrieval for Multi-Turn RAG Conversations
- arxiv url: http://arxiv.org/abs/2605.00631v1
- Date: Fri, 01 May 2026 13:07:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.956231
- Title: H-RAG at SemEval-2026 Task 8: Hierarchical Parent-Child Retrieval for Multi-Turn RAG Conversations
- Title(参考訳): SemEval-2026 Task 8におけるH-RAG:階層型親子検索によるマルチTurn RAG会話
- Authors: Passant Elchafei, Hossam Emam, Mohamed Alansary, Monorama Swain, Markus Schedl,
- Abstract要約: H-RAG は SemEval-2026 Task 8 (MTRAGEval) における Task A (Retrieval) と Task C (Retrieved Passages の生成) の両方に対処する。
本手法では,階層型親子RAGパイプラインを実装し,子レベル検索と親レベルのコンテキスト再構築を分離する。
H-RAGはタスクAのnDCG@5スコアが0.4271、タスクCの調波平均スコアが0.3241となる。
- 参考スコア(独自算出の注目度): 6.221953137049602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present H-RAG, our submission to SemEval-2026 Task 8 (MTRAGEval), addressing both Task A (Retrieval) and Task C (Generation with Retrieved Passages). Task A evaluates standalone retrieval quality, while Task C assesses end-to-end retrieval-augmented generation (RAG) in multi-turn conversational settings, requiring both accurate answer generation and faithful grounding in retrieved evidence. Our approach implements a hierarchical parent-child RAG pipeline that separates fine-grained child-level retrieval from parent-level context reconstruction during generation. Documents are segmented into overlapping sentence-based child chunks, while full documents are preserved as parent units to provide coherent context. Retrieval combines hybrid dense-sparse search, tunable weighting, and embedding-based similarity rescoring over child chunks. Retrieved evidence is aggregated at the parent level and supplied to an instruction-tuned language model for response generation. H-RAG achieves an nDCG@5 score of 0.4271 on Task A and a harmonic mean score of 0.3241 on Task C (RB_agg: 0.2488, RL_F: 0.2703, RB_llm: 0.6508), underscoring the importance of retrieval configuration and parent-level aggregation in multi-turn RAG performance.
- Abstract(参考訳): 本稿では,SemEval-2026 Task 8 (MTRAGEval) に提案する H-RAG について述べる。
タスクAはスタンドアロンの検索品質を評価し、タスクCは複数ターンの会話設定でエンドツーエンドの検索強化生成(RAG)を評価する。
提案手法は階層型親子RAGパイプラインを実装し,子レベルでの詳細な検索と生成中の親レベルのコンテキスト再構築を分離する。
文書は重なり合う文ベースの子チャンクに分割され、完全な文書はコヒーレントなコンテキストを提供するために親単位として保存される。
Retrievalは、ハイブリッドな密度のスパース検索、チューニング可能な重み付け、および子供の塊を埋め込む埋め込みベースの類似性を組み合わせる。
得られた証拠は親レベルで集約され、応答生成のための命令調整言語モデルに供給される。
H-RAGは、タスクA上のnDCG@5スコアが0.4271、タスクC上のハーモニック平均スコアが0.3241(RB_agg: 0.2488, RL_F: 0.2703, RB_llm: 0.6508)に達し、マルチターンRAG性能における検索構成と親レベルアグリゲーションの重要性が強調される。
関連論文リスト
- AILS-NTUA at SemEval-2026 Task 8: Evaluating Multi-Turn RAG Conversations [14.20669481486209]
我々はSemEval-2026タスク8(MTRAGEval)のためのAILS-NTUAシステムを提案する。
マルチターン検索拡張生成の3つのサブタスク、すなわち、経路検索(A)、基準接地応答生成(B)、エンドツーエンドRAG(C)のすべてに対処する。
統一アーキテクチャは、(i)クエリ-ダイバーシティ-オーバー・レトリバー-ダイバーシティ戦略と(ii)マルチステージ生成パイプラインという2つの原則に基づいて構築されています。
論文 参考訳(メタデータ) (2026-03-11T08:28:31Z) - Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage [89.58253972744531]
Retrieval-augmented Generation (RAG) システムは、文書検索と生成モデルを組み合わせて、レポート生成のような複雑な情報を求める課題に対処する。
我々は,上流の検索指標が,最終生成応答の情報カバレッジの信頼性の高い早期指標として機能するかどうかを検討する。
本研究は,トピックとシステムレベルの両方で生成した応答におけるカバレッジベース検索指標とナゲットカバレッジとの間に強い相関関係を示した。
論文 参考訳(メタデータ) (2026-03-09T18:20:20Z) - SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation [0.0]
SPD-RAG(SPD-RAG)は,クロスドキュメントな質問応答のための階層型マルチエージェントフレームワークである。
各文書は、自身のコンテンツのみで動作する専用文書レベルエージェントによって処理され、集中した検索が可能となる。
SPD-RAGは58.1(GPT-5評価)のAvgスコアを達成し、正規RAG(3.0)とエージェントRAG(32.8)を上回り、フルコンテキストベースライン(68.0)のAPIコストの38%しか使用していない。
論文 参考訳(メタデータ) (2026-03-09T12:46:32Z) - RAG-E: Quantifying Retriever-Generator Alignment and Failure Modes [10.900031381533354]
RAG-Eは、数学的に基底化された帰属法により、レトリバー・ジェネレータのアライメントを定量化する、エンドツーエンドの説明可能性フレームワークである。
RAGの出力品質は、個々のコンポーネントのパフォーマンスにのみ依存せず、RAG-Eを介して監査可能な相互運用に依存していることを示す。
論文 参考訳(メタデータ) (2026-01-29T14:47:00Z) - Towards Global Retrieval Augmented Generation: A Benchmark for Corpus-Level Reasoning [50.27838512822097]
我々は,グローバルRAG機能を評価するために設計された最初のベンチマークであるGlobalQAを紹介する。
我々は,チャンクレベルの検索によって構造的コヒーレンスを保存するマルチツール協調フレームワークであるGlobalRAGを提案する。
Qwen2.5-14Bモデルでは、GlobalRAGは最強のベースラインである1.51 F1と比較して6.63 F1を達成した。
論文 参考訳(メタデータ) (2025-10-30T07:29:14Z) - ImpRAG: Retrieval-Augmented Generation with Implicit Queries [34.72864597562907]
ImpRAGは、検索と生成を統一モデルに統合するクエリフリーなRAGシステムである。
我々は、ImpRAGが、多様な形式を持つ未確認タスクの正確なマッチスコアを3.6-11.5改善したことを示す。
論文 参考訳(メタデータ) (2025-06-02T21:38:21Z) - Chain-of-Retrieval Augmented Generation [91.02950964802454]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。