論文の概要: MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering
- arxiv url: http://arxiv.org/abs/2305.12820v2
- Date: Wed, 24 May 2023 17:13:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 11:13:36.449564
- Title: MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering
- Title(参考訳): multitabqa:マルチテーブル質問応答のための表回答生成
- Authors: Vaishali Pal, Andrew Yates, Evangelos Kanoulas, Maarten de Rijke
- Abstract要約: 実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
- 参考スコア(独自算出の注目度): 61.48881995121938
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in tabular question answering (QA) with large language models
are constrained in their coverage and only answer questions over a single
table. However, real-world queries are complex in nature, often over multiple
tables in a relational database or web page. Single table questions do not
involve common table operations such as set operations, Cartesian products
(joins), or nested queries. Furthermore, multi-table operations often result in
a tabular output, which necessitates table generation capabilities of tabular
QA models. To fill this gap, we propose a new task of answering questions over
multiple tables. Our model, MultiTabQA, not only answers questions over
multiple tables, but also generalizes to generate tabular answers. To enable
effective training, we build a pre-training dataset comprising of 132,645 SQL
queries and tabular answers. Further, we evaluate the generated tables by
introducing table-specific metrics of varying strictness assessing various
levels of granularity of the table structure. MultiTabQA outperforms
state-of-the-art single table QA models adapted to a multi-table QA setting by
finetuning on three datasets: Spider, Atis and GeoQuery.
- Abstract(参考訳): 大規模言語モデルを用いた表型質問応答(QA)の最近の進歩は,そのカバレッジに制約があり,単一のテーブル上でのみ回答できる。
しかし、現実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
単一のテーブルの質問は、セット操作、Cartesian製品(ジョイン)、ネストクエリといった一般的なテーブル操作を含まない。
さらに、マルチテーブル操作は表の出力をもたらすことが多く、表のQAモデルのテーブル生成能力を必要とする。
このギャップを埋めるために,複数のテーブルにまたがる質問に答える新しいタスクを提案する。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
効果的なトレーニングを実現するために,132,645のSQLクエリと表解からなる事前学習データセットを構築した。
さらに, テーブル構造の様々な粒度を評価するために, 異なる厳密さのテーブル固有指標を導入することにより, 生成されたテーブルを評価する。
MultiTabQAは、Spider、Atis、GeoQueryの3つのデータセットを微調整することで、マルチテーブルのQA設定に適合する、最先端のシングルテーブルQAモデルを上回っている。
関連論文リスト
- KET-QA: A Dataset for Knowledge Enhanced Table Question Answering [63.56707527868466]
本研究では,TableQAの外部知識源として知識ベース(KB)を用いることを提案する。
すべての質問は、答えるテーブルとサブグラフの両方からの情報を統合する必要がある。
我々は,膨大な知識サブグラフから関連する情報を抽出するために,レトリバー・レゾナー構造パイプラインモデルを設計する。
論文 参考訳(メタデータ) (2024-05-13T18:26:32Z) - Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval [52.592071689901196]
本稿では,テーブル検索において,任意のクエリやデータベースに対して有用な結合関係を明らかにする手法を提案する。
提案手法は,F1スコアの最大9.3%,エンドツーエンドQAの最大5.4%の精度で,テーブル検索の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-04-15T15:55:01Z) - Augment before You Try: Knowledge-Enhanced Table Question Answering via
Table Expansion [57.53174887650989]
テーブル質問応答は、構造化されたデータを理解し、相互作用するモデルの能力を評価する一般的なタスクである。
既存の方法は表と外部の知識の両方をテキストに変換し、表の構造的な性質を無視する。
そこで本稿では,表に外部情報を統合するための簡易で効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-01-28T03:37:11Z) - TabIQA: Table Questions Answering on Business Document Images [3.9993134366218857]
本稿では,ビジネス文書イメージに関する疑問に答えるために,TabIQAという新しいパイプラインを提案する。
TabIQAは、1)最先端のディープラーニング技術を組み合わせて、画像からテーブルの内容と構造情報を抽出し、2)数値データ、テキストベース情報、構造化テーブルからの複雑なクエリに関する様々な質問に答える。
論文 参考訳(メタデータ) (2023-03-27T06:31:21Z) - ReasTAP: Injecting Table Reasoning Skills During Pre-training via
Synthetic Reasoning Examples [15.212332890570869]
複雑なテーブル固有のアーキテクチャ設計を必要とせずに、事前学習中に高レベルのテーブル推論スキルをモデルに注入できることを示すためにReasTAPを開発した。
ReasTAPはすべてのベンチマークで最新のパフォーマンスを実現し、低リソース設定で大幅に改善されている。
論文 参考訳(メタデータ) (2022-10-22T07:04:02Z) - OmniTab: Pretraining with Natural and Synthetic Data for Few-shot
Table-based Question Answering [106.73213656603453]
最小限のアノテーションによるテーブルベースのQAモデルを構築した。
本稿では、自然データと合成データの両方を消費する全能事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-07-08T01:23:45Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - AIT-QA: Question Answering Dataset over Complex Tables in the Airline
Industry [30.330772077451048]
ドメイン固有のテーブルQAデータセットAIT-QA(Industry Table QA)を紹介する。
このデータセットは、米国証券取引委員会(SEC)の提出書類から抽出された116のテーブル上で、人間のアノテータによって書かれた515の質問から成り立っている。
また、階層的ヘッダー、ドメイン固有の用語、言い換え形を必要とするものをマークして、質問の性質に関するアノテーションも提供します。
論文 参考訳(メタデータ) (2021-06-24T12:14:18Z) - CLTR: An End-to-End, Transformer-Based System for Cell Level Table
Retrieval and Table Question Answering [8.389189333083513]
本稿では,最初のエンドツーエンドのテーブル質問応答(QA)システムを提案する。
自然言語の質問と大量のテーブルコーパスを入力として、最も関係のあるテーブルを検索し、質問に答えるために正しいテーブルセルを見つける。
76,242テーブル上の2,005の自然言語質問からなる2つの新しいオープンドメインベンチマークであるE2E_WTQとE2E_GNQを導入する。
論文 参考訳(メタデータ) (2021-06-08T15:22:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。