論文の概要: AbstRAG: Learning to Abstract for Retrieval Problems
- arxiv url: http://arxiv.org/abs/2606.09459v1
- Date: Mon, 08 Jun 2026 13:14:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:07.082806
- Title: AbstRAG: Learning to Abstract for Retrieval Problems
- Title(参考訳): AbstRAG: 検索問題の抽象化を学ぶ
- Authors: Lei Xu, Xin Quan, Daniel Pedronette, André Freitas,
- Abstract要約: AbstRAGは、クエリ-エビデンスギャップを、式、概念、インテント-エビデンス、イベントタイプコンポーネントに分解する。
21対のブートストラップのコントラストのうち18のnDCG@10よりも優れており、生成精度は1.9%、5.2%、および4.0%向上している。
- 参考スコア(独自算出の注目度): 23.379898867224355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-augmented generation often fails when the query, the document evidence, and the user's intent are expressed at different levels of abstraction. A query may ask about a class, a relation, or an event, while the document only states specific instances, indirect framings, or scoped formulations. We define this mismatch as an abstraction gap: the minimal set of typed assumptions required to align query intent with the available evidence. To close this gap, we introduce AbstRAG, which treats abstraction as an explicit retrieval object. AbstRAG decomposes the query--evidence gap into expression, conceptual, intent--evidence, and event-type components, and scores relevance by combining match quality, a query-independent utility prior, and the cost of the required bridges. Its central mechanism is reflective refinement: a critic diagnoses retrieval failures, localizes the failed abstraction operator, proposes a minimal stage-specific patch, and accepts the patch only under sufficiency and compression controls. Across three within-document retrieval benchmarks against seven baselines, AbstRAG outperforms on nDCG@10 in 18 of 21 paired-bootstrap contrasts and improves generation accuracy by 1.9%, 5.2%, and 4.0% across the three benchmarks; ablations confirm that reflective refinement drives most of the retrieval gain and the compression control alone reduces over-expansion false positives from 73.7% to 0% on a stress slice.
- Abstract(参考訳): Retrieval-augmentedジェネレーションは、クエリ、ドキュメントのエビデンス、ユーザの意図が異なる抽象化レベルで表現されるときに、しばしば失敗する。
クエリはクラス、リレーション、イベントについて尋ねることができるが、ドキュメントは特定のインスタンス、間接的なフレーミング、スコープ化された定式化のみを記述している。
私たちはこのミスマッチを抽象的なギャップとして定義します。クエリ意図と利用可能なエビデンスを一致させるために必要な型付き仮定の最小セットです。
このギャップを埋めるために、抽象を明示的な検索対象として扱うAbstRAGを導入する。
AbstRAGは、クエリ-エビデンスギャップを、表現、概念、インテント-エビデンス、イベントタイプコンポーネントに分解し、マッチ品質、クエリ非依存のユーティリティプリエント、必要なブリッジのコストを組み合わせることで、関連性を評価する。
批判者は検索障害を診断し、抽象演算子をローカライズし、最小ステージ固有のパッチを提案し、そのパッチを十分かつ圧縮制御下でのみ受け入れる。
7つのベースラインに対する3つのドキュメント内検索ベンチマークにおいて、AbstRAGは、21対のブートストラップの18のnDCG@10でパフォーマンスが向上し、3つのベンチマークで生成精度が1.9%、5.2%、4.0%向上した。
関連論文リスト
- Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - IntRec: Intent-based Retrieval with Contrastive Refinement [42.24292951933703]
IntRecは対話型オブジェクト検索フレームワークで、ユーザーのフィードバックに基づいて予測を洗練する。
中心となるIntent State(IS)は、正のアンカー(確認されたキュー)と負の制約(拒絶された仮説)のための二重メモリセットを維持する。
論文 参考訳(メタデータ) (2026-02-19T18:50:53Z) - RaCoT: Plug-and-Play Contrastive Example Generation Mechanism for Enhanced LLM Reasoning Reliability [12.67288560758937]
本稿では,RaCoT(Retrieval-aware Contrastive-of-Thought)を提案する。
RaCoTは、解答の発散を決定する重要な詳細に積極的に焦点を合わせるようモデルに誘導する。
論文 参考訳(メタデータ) (2025-10-26T15:06:44Z) - Decomposed Reasoning with Reinforcement Learning for Relevance Assessment in UGC Platforms [30.51899823655511]
Retrieval-augmented Generation (RAG)は、ユーザ生成コンテンツプラットフォームにおいて重要な役割を果たす。
1)RAGシナリオにおけるユーザフィードバックの少なさによる曖昧なユーザ意図,2)非公式言語や非構造化言語によって導入された相当なノイズ。
論文 参考訳(メタデータ) (2025-08-04T15:14:09Z) - Retrieval-Augmented Generation with Conflicting Evidence [57.66282463340297]
大規模言語モデル (LLM) エージェントは、応答の事実性を改善するために、検索強化世代 (RAG) をますます採用している。
実際には、これらのシステムは曖昧なユーザクエリを処理し、複数のソースからの情報に衝突する可能性がある。
RAMDocs(Retrieval with Ambiguity and Misinformation in Documents)は,ユーザクエリのエビデンスを矛盾させるような,複雑で現実的なシナリオをシミュレートする新しいデータセットである。
論文 参考訳(メタデータ) (2025-04-17T16:46:11Z) - Collapse of Dense Retrievers: Short, Early, and Literal Biases Outranking Factual Evidence [56.09494651178128]
検索モデルは、Retrieval-Augmented Generation (RAG)のような情報検索(IR)アプリケーションで一般的に使用される。
我々は、Dragon+やContrieverのようなリトリーバーに対する、短いドキュメントの好みなどのバイアスの影響を定量化する。
私たちは大きな脆弱性を発見し、リトリバーが短いドキュメント、早い位置、繰り返しのエンティティ、リテラルマッチを好んで、答えの存在を無視しながら表示します。
論文 参考訳(メタデータ) (2025-03-06T23:23:13Z) - Riddle Me This! Stealthy Membership Inference for Retrieval-Augmented Generation [18.098228823748617]
本稿では,RAGデータストア内の文書を対象としたメンバシップ推論手法であるInterrogation Attack (IA)を提案する。
ステルス性を維持しながら、たった30クエリで推論に成功したことを実証します。
我々は,様々なRAG構成に対する事前推論攻撃に対して,TPR@1%FPRの2倍の改善が観察された。
論文 参考訳(メタデータ) (2025-02-01T04:01:18Z) - SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。
類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。
文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文 参考訳(メタデータ) (2024-06-15T21:57:03Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。