論文の概要: Exploring Multi-Table Retrieval Through Iterative Search
- arxiv url: http://arxiv.org/abs/2511.13418v1
- Date: Mon, 17 Nov 2025 14:31:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.30395
- Title: Exploring Multi-Table Retrieval Through Iterative Search
- Title(参考訳): 反復探索によるマルチテーブル検索の探索
- Authors: Allaa Boutaleb, Bernd Amann, Rafael Angarita, Hubert Naacke,
- Abstract要約: データレイクに対するオープンドメインの質問応答には、複数のテーブルから情報を検索して構成する必要がある。
MIP(Mixed-Integer Programming)のような厳密な最適化手法はコヒーレンスを保証する。
本稿では,マルチテーブル検索を反復探索プロセスとして捉え,拡張性,解釈可能性,柔軟性の面での利点を論じる。
- 参考スコア(独自算出の注目度): 0.32665457005470494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-domain question answering over datalakes requires retrieving and composing information from multiple tables, a challenging subtask that demands semantic relevance and structural coherence (e.g., joinability). While exact optimization methods like Mixed-Integer Programming (MIP) can ensure coherence, their computational complexity is often prohibitive. Conversely, simpler greedy heuristics that optimize for query coverage alone often fail to find these coherent, joinable sets. This paper frames multi-table retrieval as an iterative search process, arguing this approach offers advantages in scalability, interpretability, and flexibility. We propose a general framework and a concrete instantiation: a fast, effective Greedy Join-Aware Retrieval algorithm that holistically balances relevance, coverage, and joinability. Experiments across 5 NL2SQL benchmarks demonstrate that our iterative method achieves competitive retrieval performance compared to the MIP-based approach while being 4-400x faster depending on the benchmark and search space settings. This work highlights the potential of iterative heuristics for practical, scalable, and composition-aware retrieval.
- Abstract(参考訳): データレークに対するオープンドメインの質問応答には、セマンティックな関連性や構造的一貫性(結合性など)を必要とする挑戦的なサブタスクである、複数のテーブルから情報を取得して構成する必要がある。
MIP(Mixed-Integer Programming)のような厳密な最適化手法はコヒーレンスを確保することができるが、計算の複雑さはしばしば禁じられている。
逆に、クエリカバレッジのみを最適化する単純な欲求的ヒューリスティックは、一貫性のある結合可能な集合を見つけるのに失敗することが多い。
本稿では,マルチテーブル検索を反復探索プロセスとして捉え,拡張性,解釈可能性,柔軟性の面での利点を論じる。
本稿では, 関連性, カバレッジ, 結合性を均等にバランスする高速で効果的なグリーディ・ジョイン・アウェア検索アルゴリズムを提案する。
5つのNL2SQLベンチマークに対する実験により、我々の反復的手法は、ベンチマークや検索空間の設定によって4-400倍高速でありながら、MIPベースの手法と比較して競争力のある検索性能を達成することを示した。
この研究は、実用的でスケーラブルで構成に配慮した検索のための反復的ヒューリスティックスの可能性を強調している。
関連論文リスト
- REaR: Retrieve, Expand and Refine for Effective Multitable Retrieval [46.38349148493421]
REAR(Retrieve, Expand and Refine)は、効率的な高忠実なマルチテーブル検索のための3段階のフレームワークである。
Rearはクエリ整列テーブルを検索し、構造的に結合可能なテーブルで拡張し、ノイズや弱い関係のある候補を抽出することでそれらを洗練する。
Rearはレトリバー非依存であり、複雑なテーブルQAデータセット上の高密度/スパースレトリバーを一貫して改善する。
論文 参考訳(メタデータ) (2025-11-02T05:01:04Z) - ParallelSearch: Train your LLMs to Decompose Query and Search Sub-queries in Parallel with Reinforcement Learning [20.11646932754985]
Reasoning-augmented search agent as Search-R1は、外部知識ソースからの多段階情報検索において顕著な能力を示す。
既存のアプローチは、本質的に並列化可能で論理的に独立な比較を扱う場合でも、検索クエリを厳格に処理する。
並列化可能なクエリ構造を認識し,複数の検索操作を同時に実行する,大規模言語モデルを活用した新しい強化学習フレームワークであるParallelSearchを提案する。
論文 参考訳(メタデータ) (2025-08-12T19:38:21Z) - Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.71038700559195]
The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。
SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文 参考訳(メタデータ) (2025-07-14T08:41:53Z) - SiReRAG: Indexing Similar and Related Information for Multihop Reasoning [96.60045548116584]
SiReRAGは、類似情報と関連する情報の両方を明示的に考慮する新しいRAGインデックス方式である。
SiReRAGは、3つのマルチホップデータセットの最先端インデックス手法を一貫して上回る。
論文 参考訳(メタデータ) (2024-12-09T04:56:43Z) - Retrieval with Learned Similarities [2.729516456192901]
最先端の検索アルゴリズムは、学習された類似点に移行した。
そこで本研究では,Mixture-of-Logits (MoL) を実証的に実現し,多様な検索シナリオにおいて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2024-07-22T08:19:34Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - JoinGym: An Efficient Query Optimization Environment for Reinforcement
Learning [58.71541261221863]
結合順序選択(JOS)は、クエリの実行コストを最小化するために結合操作を順序付けする問題である。
木質強化学習(RL)のためのクエリ最適化環境JoinGymを提案する。
JoinGymは内部で、事前計算されたデータセットから中間結果の濃度を調べることで、クエリプランのコストをシミュレートする。
論文 参考訳(メタデータ) (2023-07-21T17:00:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。