論文の概要: MCompassRAG: Topic Metadata as a Semantic Compass for Paragraph-Level Retrieval
- arxiv url: http://arxiv.org/abs/2606.18508v1
- Date: Tue, 16 Jun 2026 21:50:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.906842
- Title: MCompassRAG: Topic Metadata as a Semantic Compass for Paragraph-Level Retrieval
- Title(参考訳): MCompassRAG:パラグラフレベル検索のためのセマンティックコンパスとしてのトピックメタデータ
- Authors: Amirhossein Abaskohi, Raymond Li, Gaetano Cimino, Peter West, Giuseppe Carenini, Issam H. Laradji,
- Abstract要約: MRAGはメタデータ誘導検索フレームワークであり、関連する証拠を選択するための意味コンパスとしてトピックレベルの信号を使用する。
6つのベンチマークで、MRAGは情報効率(IE)を平均8.24%改善し、最も効率的なRAGベースラインの5倍以上のレイテンシを持つ。
- 参考スコア(独自算出の注目度): 23.917976178986137
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-augmented generation (RAG) systems depend critically on how documents are chunked and searched. Fine-grained chunks can improve retrieval precision but expand the search space, increasing latency and cost; larger chunks reduce the number of candidates but make dense similarity less reliable, as the representation for each chunk mixes multiple topics and introduces more semantic noise. This trade-off becomes especially limiting in deep research tasks, where retrieval must be both fast and precise across large, heterogeneous corpora. We introduce MCompassRAG, a metadata-guided retrieval framework that uses topic-level signals as a semantic compass for selecting relevant evidence. Instead of relying only on cosine similarity between queries and noisy chunk embeddings, MCompassRAG enriches chunk representations with topic metadata in the same embedding space and trains a lightweight retriever through LLM-teacher distillation. At inference time, MCompassRAG performs topic-aware retrieval without additional LLM calls, improving both efficiency and evidence quality. Across six complex retrieval benchmarks, MCompassRAG improves information efficiency (IE) by 8.24% on average with over 5 times lower latency than the strongest efficient RAG baselines. Code is available on https://github.com/AmirAbaskohi/MCompassRAG.
- Abstract(参考訳): Retrieval-augmented Generation (RAG) システムは、文書のチャンクや検索方法に大きく依存する。
チャンクは検索精度を向上するが、検索スペースを拡大し、レイテンシとコストを増大させる; 大きなチャンクは候補数を減らすが、各チャンクの表現が複数のトピックを混在させ、セマンティックノイズを導入するため、密接な類似性がより信頼性を低下させる。
このトレードオフは、大規模で異質なコーパスにわたる検索を迅速かつ正確に行うディープリサーチタスクにおいて特に制限される。
関連証拠を選択するための意味コンパスとしてトピックレベルの信号を利用するメタデータ誘導検索フレームワークであるMCompassRAGを紹介する。
MCompassRAGは、クエリとノイズの多いチャンク埋め込みのコサイン類似性のみに頼る代わりに、同じ埋め込み空間内のトピックメタデータでチャンク表現を豊かにし、LLM-Teacher蒸留を通じて軽量レトリバーを訓練する。
推測時に、MCompassRAGはLLMコールを追加せずにトピック認識検索を行い、効率とエビデンス品質の両方を改善した。
6つの複雑な検索ベンチマークで、MCompassRAGは情報効率(IE)を平均8.24%改善し、最も効率的なRAGベースラインの5倍以上のレイテンシを持つ。
コードはhttps://github.com/AmirAbaskohi/MCompassRAGで入手できる。
関連論文リスト
- SproutRAG: Attention-Guided Tree Search with Progressive Embeddings for Long-Document RAG [23.48941508046885]
本稿では,注意誘導型階層型RAGフレームワークであるSproutRAGを紹介する。
文レベルのチャンクを徐々に大きく、意味的に一貫性のある単位に整理する。
どのアテンションヘッドとレイヤがセマンティックドキュメント構造を最もよく捉えているかを学ぶ。
論文 参考訳(メタデータ) (2026-06-16T18:28:00Z) - No More K-means: Single-Stage Sparse Coding for Efficient Multi-Vector Retrieval [51.43543998583709]
SSR(Single-stage Sparse Retrieval)は、高価なクラスタリングを効率的なスパースコーディングに置き換えるパラダイムシフトである。
ColBERTv2と比較してインデックス処理時間を15倍短縮し、検索レイテンシを半減させ、同時に検索性能を向上させる。
論文 参考訳(メタデータ) (2026-05-28T15:53:34Z) - MTR-Suite: A Framework for Evaluating and Synthesizing Conversational Retrieval Benchmarks [68.78064578688809]
MTR-Suiteは、監査、合成、ベンチマーク検索のための統合されたフレームワークである。
1)従来のベンチマークでアライメントギャップを定量化するためのLCMベースの監査装置であるMTR-Eval,(2)グリーディクラスタリングを用いたマルチエージェントシステムであるMTR-Pipeline,(3)厳格な一般ベンチマークであるMTR-Benchなどが特徴である。
論文 参考訳(メタデータ) (2026-05-20T05:26:35Z) - Multi-Vector Index Compression in Any Modality [73.7330345057813]
後期の相互作用は、テキスト、画像、ビジュアルドキュメント、ビデオにおける情報検索の主要なパラダイムとして現れてきた。
インデックス圧縮には,シーケンスリサイズ,メモリトークン,階層プール,新しいアテンション誘導クラスタリング(AGC)の4つのアプローチを導入する。
AGCは、ドキュメントの最もセマンティックな領域をクラスタセントロイドとして識別し、トークンの集合を重み付けするために注意誘導機構を使用する。
論文 参考訳(メタデータ) (2026-02-24T18:57:33Z) - Progressive Searching for Retrieval in RAG [1.1912082737504726]
Retrieval Augmented Generation (RAG)は、大規模言語モデル(LLM)の2つの重要な制限を緩和するための有望な技術である。
本稿では,コスト効率の高い検索アルゴリズムを提案する。
以上の結果から,RAGシステムにおける逐次探索は次元,速度,精度のバランスを保ち,大規模データベースにおいてもスケーラブルで高速な検索が可能であることが示唆された。
論文 参考訳(メタデータ) (2026-02-07T01:12:53Z) - M-RAG: Making RAG Faster, Stronger, and More Efficient [15.147969102210759]
大規模言語モデルのための新しいチャンクフリー検索戦略であるM-RAGを提案する。
M-RAGは構造化されたk-v分解メタマーカーを軽量で意図に整合した検索キーで抽出する。
M-RAGは高い効率で解答フレンドリーな証拠を回収できることを示す。
論文 参考訳(メタデータ) (2026-01-06T15:14:54Z) - Cluster-based Adaptive Retrieval: Dynamic Context Selection for RAG Applications [8.946586077722822]
クラスタベースのAdaptive Retrieval (CAR) は、順序付きクエリ文書類似度距離のクラスタリングパターンを分析して、最適な文書数を決定するアルゴリズムである。
CARは、常に最適な検索深度を選択し、最高TESスコアを達成し、固定されたトップkベースラインを全て上回る。
論文 参考訳(メタデータ) (2025-10-02T05:11:12Z) - SiReRAG: Indexing Similar and Related Information for Multihop Reasoning [96.60045548116584]
SiReRAGは、類似情報と関連する情報の両方を明示的に考慮する新しいRAGインデックス方式である。
SiReRAGは、3つのマルチホップデータセットの最先端インデックス手法を一貫して上回る。
論文 参考訳(メタデータ) (2024-12-09T04:56:43Z) - IRSC: A Zero-shot Evaluation Benchmark for Information Retrieval through Semantic Comprehension in Retrieval-Augmented Generation Scenarios [14.336896748878921]
本稿では,多言語RAGタスクにおける埋め込みモデルの性能評価のためのIRSCベンチマークを提案する。
このベンチマークには、クエリ検索、タイトル検索、パラグラフ検索、キーワード検索、要約検索の5つのタスクが含まれている。
1)IRSCベンチマーク,2)SSCIとRCCIメトリクス,3)埋め込みモデルの言語間制限に関する洞察などです。
論文 参考訳(メタデータ) (2024-09-24T05:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。