論文の概要: REaR: Retrieve, Expand and Refine for Effective Multitable Retrieval
- arxiv url: http://arxiv.org/abs/2511.00805v1
- Date: Sun, 02 Nov 2025 05:01:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.942437
- Title: REaR: Retrieve, Expand and Refine for Effective Multitable Retrieval
- Title(参考訳): REaR: 効果的なマルチテーブル検索のための検索、拡張、修正
- Authors: Rishita Agarwal, Himanshu Singhal, Peter Baile Chen, Manan Roy Choudhury, Dan Roth, Vivek Gupta,
- Abstract要約: REAR(Retrieve, Expand and Refine)は、効率的な高忠実なマルチテーブル検索のための3段階のフレームワークである。
Rearはクエリ整列テーブルを検索し、構造的に結合可能なテーブルで拡張し、ノイズや弱い関係のある候補を抽出することでそれらを洗練する。
Rearはレトリバー非依存であり、複雑なテーブルQAデータセット上の高密度/スパースレトリバーを一貫して改善する。
- 参考スコア(独自算出の注目度): 46.38349148493421
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Answering natural language queries over relational data often requires retrieving and reasoning over multiple tables, yet most retrievers optimize only for query-table relevance and ignore table table compatibility. We introduce REAR (Retrieve, Expand and Refine), a three-stage, LLM-free framework that separates semantic relevance from structural joinability for efficient, high-fidelity multi-table retrieval. REAR (i) retrieves query-aligned tables, (ii) expands these with structurally joinable tables via fast, precomputed column-embedding comparisons, and (iii) refines them by pruning noisy or weakly related candidates. Empirically, REAR is retriever-agnostic and consistently improves dense/sparse retrievers on complex table QA datasets (BIRD, MMQA, and Spider) by improving both multi-table retrieval quality and downstream SQL execution. Despite being LLM-free, it delivers performance competitive with state-of-the-art LLM-augmented retrieval systems (e.g.,ARM) while achieving much lower latency and cost. Ablations confirm complementary gains from expansion and refinement, underscoring REAR as a practical, scalable building block for table-based downstream tasks (e.g., Text-to-SQL).
- Abstract(参考訳): リレーショナルデータに対する自然言語クエリの回答には、複数のテーブル上での検索と推論が必要となることが多いが、ほとんどのリトリバーはクエリテーブルの関連性のみを最適化し、テーブルテーブルの互換性を無視する。
提案するREAR(Retrieve, Expand and Refine)は3段階のLCMフリーフレームワークで, 意味的関連性を構造結合性から分離し, 効率的かつ高忠実なマルチテーブル検索を実現する。
リレー
(i)クエリに整合したテーブルを検索する。
(ii) 高速で計算済みのカラム埋め込み比較により、構造的に結合可能なテーブルで拡張し、
三 騒々しい候補又は弱々しい候補を刈り取ることによりこれを洗練させる。
実証的には、REARはリトリバーに依存しず、複雑なテーブルQAデータセット(BIRD、MMQA、Spider)上で、マルチテーブルの検索品質とダウンストリームSQLの実行の両方を改善することで、リトリバー/スパースレトリバーを一貫して改善する。
LLMフリーであるにもかかわらず、最先端のLLM拡張検索システム(例えばARM)と性能を競合させ、レイテンシとコストをはるかに低くする。
REARはテーブルベースのダウンストリームタスク(例:Text-to-SQL)の実用的でスケーラブルなビルディングブロックとして位置づけられている。
関連論文リスト
- Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - Improving Table Retrieval with Question Generation from Partial Tables [2.2169618382995764]
本稿では,LLMを用いてテーブルの小さな部分に基づいて合成質問を生成する簡易かつ効果的な方法であるQGpTを提案する。
生成された質問は、生成に使用される部分テーブルセグメントに結合され、ユーザクエリとのセマンティックアライメントが強化される。
論文 参考訳(メタデータ) (2025-08-08T09:35:56Z) - Plugging Schema Graph into Multi-Table QA: A Human-Guided Framework for Reducing LLM Reliance [8.83042313837811]
本稿では,人為的な関係知識を活用して,スキーマリンクとジョインパスを明示的にエンコードするグラフベースのフレームワークを提案する。
自然言語クエリが与えられた場合,提案手法は解析可能な推論チェーンを構築するためにグラフを検索し,プルーニングとサブパスマージ戦略によって支援する。
標準ベンチマークと現実的な大規模データセットの両方の実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2025-06-04T20:21:52Z) - Bridging Queries and Tables through Entities in Table Retrieval [70.13748256886288]
エンティティは、テキスト検索の文脈でよく研究されているが、テーブル検索におけるその応用についての研究は、顕著に欠如している。
本稿では、実体表現に基づく相互作用パラダイムを設計し、エンティティ強化トレーニングフレームワークを提案する。
提案するフレームワークはプラグアンドプレイでフレキシブルで,既存のテーブルレトリバーのトレーニングプロセスに統合しやすくする。
論文 参考訳(メタデータ) (2025-04-09T03:16:33Z) - RAG over Tables: Hierarchical Memory Index, Multi-Stage Retrieval, and Benchmarking [63.253294691180635]
現実世界のシナリオでは、純粋なテキスト以外では、かなりの量の知識がテーブルに格納される。
まず、階層型メモリインデックス、多段階検索、グラフ認識プロンプトからなるテーブルコーパス対応RAGフレームワークT-RAGを提案する。
論文 参考訳(メタデータ) (2025-04-02T04:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。