論文の概要: Aggregation Queries over Unstructured Text: Benchmark and Agentic Method
- arxiv url: http://arxiv.org/abs/2602.01355v2
- Date: Tue, 03 Feb 2026 10:44:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 13:28:03.720683
- Title: Aggregation Queries over Unstructured Text: Benchmark and Agentic Method
- Title(参考訳): 非構造化テキスト上の集約クエリ:ベンチマークとエージェントメソッド
- Authors: Haojia Zhu, Qinyuan Xu, Haoyu Li, Yuxi Liu, Hanchen Qiu, Jiaoyan Chen, Jiahui Jin,
- Abstract要約: 我々は、厳密な完全性を必要とするコーパス境界設定において、テキスト上のエンティティレベルアグリゲーションを形式化する。
AGGBenchは、現実的な大規模コーパスの下で完全性指向のアグリゲーションを評価するために設計されたベンチマークである。
DFAはモジュール型のエージェントベースラインで、集約クエリを解釈可能なステージに分解する。
- 参考スコア(独自算出の注目度): 20.80318496130298
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aggregation query over free text is a long-standing yet underexplored problem. Unlike ordinary question answering, aggregate queries require exhaustive evidence collection and systems are required to "find all," not merely "find one." Existing paradigms such as Text-to-SQL and Retrieval-Augmented Generation fail to achieve this completeness. In this work, we formalize entity-level aggregation querying over text in a corpus-bounded setting with strict completeness requirement. To enable principled evaluation, we introduce AGGBench, a benchmark designed to evaluate completeness-oriented aggregation under realistic large-scale corpus. To accompany the benchmark, we propose DFA (Disambiguation--Filtering--Aggregation), a modular agentic baseline that decomposes aggregation querying into interpretable stages and exposes key failure modes related to ambiguity, filtering, and aggregation. Empirical results show that DFA consistently improves aggregation evidence coverage over strong RAG and agentic baselines. The data and code are available in \href{https://anonymous.4open.science/r/DFA-A4C1}.
- Abstract(参考訳): 無料テキストに対する集約クエリは、長い間続いていないが、未解決の問題である。
通常の質問応答とは異なり、集約クエリは徹底的なエビデンス収集を必要とし、システムは「全てを埋める」だけでなく、単に「全てを埋める」必要がある。
Text-to-SQLやRetrieval-Augmented Generationといった既存のパラダイムはこの完全性を達成することができない。
本研究では,厳密な完全性要件を持つコーパス境界設定において,テキスト上でのエンティティレベルの集約クエリを形式化する。
本稿では,現実的な大規模コーパスの下で完全性指向のアグリゲーションを評価するためのベンチマーク AGGBench を紹介する。
提案するDFA(Disambiguation-Filtering-Aggregation)は,アグリゲーションクエリを解釈可能なステージに分解し,あいまいさ,フィルタリング,アグリゲーションに関連する重要な障害モードを公開するモジュール型エージェントベースラインである。
実験の結果、DFAは強力なRAGおよびエージェントベースラインに対するアグリゲーションエビデンスを一貫して改善することが示された。
データとコードは \href{https://anonymous.4open.science/r/DFA-A4C1} で公開されている。
関連論文リスト
- Towards Global Retrieval Augmented Generation: A Benchmark for Corpus-Level Reasoning [50.27838512822097]
我々は,グローバルRAG機能を評価するために設計された最初のベンチマークであるGlobalQAを紹介する。
我々は,チャンクレベルの検索によって構造的コヒーレンスを保存するマルチツール協調フレームワークであるGlobalRAGを提案する。
Qwen2.5-14Bモデルでは、GlobalRAGは最強のベースラインである1.51 F1と比較して6.63 F1を達成した。
論文 参考訳(メタデータ) (2025-10-30T07:29:14Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - Hierarchical Retrieval with Evidence Curation for Open-Domain Financial Question Answering on Standardized Documents [9.173952465423966]
標準化されたドキュメントは、反復的なボイラープレートテキストや同様のテーブル構造など、同様のフォーマットを共有している。
この類似性により、従来のRAGメソッドは、ほぼ重複したテキストを誤識別し、精度と完全性を損なう重複検索につながる。
本稿では,これらの問題に対処するためのEvidence Curationフレームワークを用いた階層検索手法を提案する。
論文 参考訳(メタデータ) (2025-05-26T11:08:23Z) - Text Summarization with Latent Queries [60.468323530248945]
本稿では,LaQSumについて紹介する。LaQSumは,既存の問合せ形式と抽象的な要約のための文書から遅延クエリを学習する,最初の統一テキスト要約システムである。
本システムでは, 潜伏クエリモデルと条件付き言語モデルとを協調的に最適化し, ユーザがテスト時に任意のタイプのクエリをプラグイン・アンド・プレイできるようにする。
本システムでは,クエリタイプ,文書設定,ターゲットドメインの異なる要約ベンチマークにおいて,強力な比較システムの性能を強く向上させる。
論文 参考訳(メタデータ) (2021-05-31T21:14:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。