論文の概要: Improving Table Retrieval with Question Generation from Partial Tables
- arxiv url: http://arxiv.org/abs/2508.06168v1
- Date: Fri, 08 Aug 2025 09:35:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:06.180424
- Title: Improving Table Retrieval with Question Generation from Partial Tables
- Title(参考訳): 部分テーブルからの質問生成によるテーブル検索の改善
- Authors: Hsing-Ping Liang, Che-Wei Chang, Yao-Chung Fan,
- Abstract要約: 本稿では,LLMを用いてテーブルの小さな部分に基づいて合成質問を生成する簡易かつ効果的な方法であるQGpTを提案する。
生成された質問は、生成に使用される部分テーブルセグメントに結合され、ユーザクエリとのセマンティックアライメントが強化される。
- 参考スコア(独自算出の注目度): 2.2169618382995764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in open-domain question answering over tables have widely adopted large language models (LLMs) under the Retriever-Reader architecture. Prior works have effectively leveraged LLMs to tackle the complex reasoning demands of the Reader component, such as text-to-text, text-to-SQL, and multi hop reasoning. In contrast, the Retriever component has primarily focused on optimizing the query representation-training retrievers to retrieve relevant tables based on questions, or to select keywords from questions for matching table segments. However, little attention has been given to enhancing how tables themselves are represented in embedding space to better align with questions. To address this, we propose QGpT (Question Generation from Partial Tables), a simple yet effective method that uses an LLM to generate synthetic questions based on small portions of a table. These questions are generated to simulate how a user might query the content of the table currently under consideration. The generated questions are then jointly embedded with the partial table segments used for generation, enhancing semantic alignment with user queries. Without the need to embed entire tables, our method significantly improves retrieval performance across multiple benchmarks for both dense and late-interaction retrievers.
- Abstract(参考訳): テーブル上のオープンドメイン質問応答の最近の進歩は、Retriever-Readerアーキテクチャの下で、大きな言語モデル(LLM)を広く採用している。
それまでの作業では,テキストからテキスト,テキストからSQL,マルチホップへの推論といった,Readerコンポーネントの複雑な推論要求に対処するために,LLMを効果的に活用していた。
対照的にRetrieverコンポーネントは、質問に基づいて関連するテーブルを検索したり、テーブルセグメントにマッチする質問からキーワードを選択するために、クエリ表現訓練レトリバーの最適化に重点を置いている。
しかし、テーブル自体を埋め込み空間でどのように表現し、質問をよりよく整合させるかを強化することにはほとんど注意が払われていない。
そこで本研究では、LLMを用いてテーブルの小さな部分に基づいて合成質問を生成する簡易かつ効果的な方法であるQGpT(Question Generation from partial Tables)を提案する。
これらの質問は、ユーザが現在検討中のテーブルの内容をどのようにクエリするかをシミュレートするために生成される。
生成された質問は、生成に使用される部分テーブルセグメントに結合され、ユーザクエリとのセマンティックアライメントが強化される。
本手法は,テーブル全体を埋め込む必要がなければ,高密度および遅延相互作用検索のための複数のベンチマーク間での検索性能を大幅に向上させる。
関連論文リスト
- Weaver: Interweaving SQL and LLM for Table Reasoning [63.09519234853953]
Weaverは、構造化データ検索のためのsqlとセマンティック処理のためのLLMを組み合わせたフレキシブルなステップバイステッププランを生成する。
Weaverは、4つのTableQAデータセットの最先端メソッドを一貫して上回り、API呼び出しとエラー率の両方を削減する。
論文 参考訳(メタデータ) (2025-05-25T03:27:37Z) - Bridging Queries and Tables through Entities in Table Retrieval [70.13748256886288]
エンティティは、テキスト検索の文脈でよく研究されているが、テーブル検索におけるその応用についての研究は、顕著に欠如している。
本稿では、実体表現に基づく相互作用パラダイムを設計し、エンティティ強化トレーニングフレームワークを提案する。
提案するフレームワークはプラグアンドプレイでフレキシブルで,既存のテーブルレトリバーのトレーニングプロセスに統合しやすくする。
論文 参考訳(メタデータ) (2025-04-09T03:16:33Z) - Piece of Table: A Divide-and-Conquer Approach for Selecting Subtables in Table Question Answering [20.926770550682964]
PieTa - サブテーブルベースの質問応答(QA)のための新しいフレームワーク
テーブルを小さなウィンドウに分割する反復的なプロセスを通じて動作し、LMを使用して各ウィンドウ内で関連する細胞を選択し、これらの細胞をサブテーブルにマージする。
従来のサブテーブルベースのQAアプローチよりもパフォーマンスが向上している。
論文 参考訳(メタデータ) (2024-12-10T16:08:14Z) - Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval [52.592071689901196]
本稿では,テーブル検索において,任意のクエリやデータベースに対して有用な結合関係を明らかにする手法を提案する。
提案手法は,F1スコアの最大9.3%,エンドツーエンドQAの最大5.4%の精度で,テーブル検索の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-04-15T15:55:01Z) - Augment before You Try: Knowledge-Enhanced Table Question Answering via
Table Expansion [57.53174887650989]
テーブル質問応答は、構造化されたデータを理解し、相互作用するモデルの能力を評価する一般的なタスクである。
既存の方法は表と外部の知識の両方をテキストに変換し、表の構造的な性質を無視する。
そこで本稿では,表に外部情報を統合するための簡易で効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-01-28T03:37:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。