論文の概要: Improving Table Retrieval with Question Generation from Partial Tables
- arxiv url: http://arxiv.org/abs/2508.06168v1
- Date: Fri, 08 Aug 2025 09:35:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:06.180424
- Title: Improving Table Retrieval with Question Generation from Partial Tables
- Title(参考訳): 部分テーブルからの質問生成によるテーブル検索の改善
- Authors: Hsing-Ping Liang, Che-Wei Chang, Yao-Chung Fan,
- Abstract要約: 本稿では,LLMを用いてテーブルの小さな部分に基づいて合成質問を生成する簡易かつ効果的な方法であるQGpTを提案する。
生成された質問は、生成に使用される部分テーブルセグメントに結合され、ユーザクエリとのセマンティックアライメントが強化される。
- 参考スコア(独自算出の注目度): 2.2169618382995764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in open-domain question answering over tables have widely adopted large language models (LLMs) under the Retriever-Reader architecture. Prior works have effectively leveraged LLMs to tackle the complex reasoning demands of the Reader component, such as text-to-text, text-to-SQL, and multi hop reasoning. In contrast, the Retriever component has primarily focused on optimizing the query representation-training retrievers to retrieve relevant tables based on questions, or to select keywords from questions for matching table segments. However, little attention has been given to enhancing how tables themselves are represented in embedding space to better align with questions. To address this, we propose QGpT (Question Generation from Partial Tables), a simple yet effective method that uses an LLM to generate synthetic questions based on small portions of a table. These questions are generated to simulate how a user might query the content of the table currently under consideration. The generated questions are then jointly embedded with the partial table segments used for generation, enhancing semantic alignment with user queries. Without the need to embed entire tables, our method significantly improves retrieval performance across multiple benchmarks for both dense and late-interaction retrievers.
- Abstract(参考訳): テーブル上のオープンドメイン質問応答の最近の進歩は、Retriever-Readerアーキテクチャの下で、大きな言語モデル(LLM)を広く採用している。
それまでの作業では,テキストからテキスト,テキストからSQL,マルチホップへの推論といった,Readerコンポーネントの複雑な推論要求に対処するために,LLMを効果的に活用していた。
対照的にRetrieverコンポーネントは、質問に基づいて関連するテーブルを検索したり、テーブルセグメントにマッチする質問からキーワードを選択するために、クエリ表現訓練レトリバーの最適化に重点を置いている。
しかし、テーブル自体を埋め込み空間でどのように表現し、質問をよりよく整合させるかを強化することにはほとんど注意が払われていない。
そこで本研究では、LLMを用いてテーブルの小さな部分に基づいて合成質問を生成する簡易かつ効果的な方法であるQGpT(Question Generation from partial Tables)を提案する。
これらの質問は、ユーザが現在検討中のテーブルの内容をどのようにクエリするかをシミュレートするために生成される。
生成された質問は、生成に使用される部分テーブルセグメントに結合され、ユーザクエリとのセマンティックアライメントが強化される。
本手法は,テーブル全体を埋め込む必要がなければ,高密度および遅延相互作用検索のための複数のベンチマーク間での検索性能を大幅に向上させる。
関連論文リスト
- CORE-T: COherent REtrieval of Tables for Text-to-SQL [91.76918495375384]
CORE-Tはスケーラブルでトレーニング不要なフレームワークで、テーブルに目的のメタデータを付加し、軽量なテーブル互換キャッシュをプリコンプリートする。
バード、スパイダー、MMQAを越えて、CORE-Tはテーブル選択F1を最大22.7ポイント改善し、最大42%のテーブルを検索する。
論文 参考訳(メタデータ) (2026-01-19T14:51:23Z) - A Hybrid Search for Complex Table Question Answering in Securities Report [0.9430947207126281]
手動による識別を伴わないTQA(Table Question Answering)のためのセル抽出法を提案する。
提案手法は,与えられた質問と個々のセルの類似性を計算し,テーブルヘッダーを推定する。
次に、最も関連する行と列の交点にあるセルの答えとして選択する。
論文 参考訳(メタデータ) (2025-11-12T10:19:27Z) - REaR: Retrieve, Expand and Refine for Effective Multitable Retrieval [46.38349148493421]
REAR(Retrieve, Expand and Refine)は、効率的な高忠実なマルチテーブル検索のための3段階のフレームワークである。
Rearはクエリ整列テーブルを検索し、構造的に結合可能なテーブルで拡張し、ノイズや弱い関係のある候補を抽出することでそれらを洗練する。
Rearはレトリバー非依存であり、複雑なテーブルQAデータセット上の高密度/スパースレトリバーを一貫して改善する。
論文 参考訳(メタデータ) (2025-11-02T05:01:04Z) - Improving Table Understanding with LLMs and Entity-Oriented Search [24.3302301035859]
大規模言語モデル(LLM)を用いたテーブル理解向上のためのエンティティ指向検索手法を提案する。
このアプローチは、質問とテーブルデータ間の意味的類似性、およびテーブルセル間の暗黙的な関係を効果的に活用する。
テーブルエンティティにフォーカスし、テーブルセルがセマンティックにタイトに束縛されていることを保証する。
論文 参考訳(メタデータ) (2025-08-23T14:02:45Z) - Weaver: Interweaving SQL and LLM for Table Reasoning [63.09519234853953]
Weaverは、構造化データ検索のためのsqlとセマンティック処理のためのLLMを組み合わせたフレキシブルなステップバイステッププランを生成する。
Weaverは、4つのTableQAデータセットの最先端メソッドを一貫して上回り、API呼び出しとエラー率の両方を削減する。
論文 参考訳(メタデータ) (2025-05-25T03:27:37Z) - Bridging Queries and Tables through Entities in Table Retrieval [70.13748256886288]
エンティティは、テキスト検索の文脈でよく研究されているが、テーブル検索におけるその応用についての研究は、顕著に欠如している。
本稿では、実体表現に基づく相互作用パラダイムを設計し、エンティティ強化トレーニングフレームワークを提案する。
提案するフレームワークはプラグアンドプレイでフレキシブルで,既存のテーブルレトリバーのトレーニングプロセスに統合しやすくする。
論文 参考訳(メタデータ) (2025-04-09T03:16:33Z) - RAG over Tables: Hierarchical Memory Index, Multi-Stage Retrieval, and Benchmarking [63.253294691180635]
現実世界のシナリオでは、純粋なテキスト以外では、かなりの量の知識がテーブルに格納される。
まず、階層型メモリインデックス、多段階検索、グラフ認識プロンプトからなるテーブルコーパス対応RAGフレームワークT-RAGを提案する。
論文 参考訳(メタデータ) (2025-04-02T04:24:41Z) - Piece of Table: A Divide-and-Conquer Approach for Selecting Subtables in Table Question Answering [20.926770550682964]
PieTa - サブテーブルベースの質問応答(QA)のための新しいフレームワーク
テーブルを小さなウィンドウに分割する反復的なプロセスを通じて動作し、LMを使用して各ウィンドウ内で関連する細胞を選択し、これらの細胞をサブテーブルにマージする。
従来のサブテーブルベースのQAアプローチよりもパフォーマンスが向上している。
論文 参考訳(メタデータ) (2024-12-10T16:08:14Z) - Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval [52.592071689901196]
本稿では,テーブル検索において,任意のクエリやデータベースに対して有用な結合関係を明らかにする手法を提案する。
提案手法は,F1スコアの最大9.3%,エンドツーエンドQAの最大5.4%の精度で,テーブル検索の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-04-15T15:55:01Z) - Augment before You Try: Knowledge-Enhanced Table Question Answering via
Table Expansion [57.53174887650989]
テーブル質問応答は、構造化されたデータを理解し、相互作用するモデルの能力を評価する一般的なタスクである。
既存の方法は表と外部の知識の両方をテキストに変換し、表の構造的な性質を無視する。
そこで本稿では,表に外部情報を統合するための簡易で効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-01-28T03:37:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。