論文の概要: CLTR: An End-to-End, Transformer-Based System for Cell Level Table
Retrieval and Table Question Answering
- arxiv url: http://arxiv.org/abs/2106.04441v2
- Date: Wed, 9 Jun 2021 17:09:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-10 10:49:22.554977
- Title: CLTR: An End-to-End, Transformer-Based System for Cell Level Table
Retrieval and Table Question Answering
- Title(参考訳): CLTR: セルレベルテーブル検索とテーブル質問応答のためのエンド・ツー・エンド変換システム
- Authors: Feifei Pan, Mustafa Canim, Michael Glass, Alfio Gliozzo, Peter Fox
- Abstract要約: 本稿では,最初のエンドツーエンドのテーブル質問応答(QA)システムを提案する。
自然言語の質問と大量のテーブルコーパスを入力として、最も関係のあるテーブルを検索し、質問に答えるために正しいテーブルセルを見つける。
76,242テーブル上の2,005の自然言語質問からなる2つの新しいオープンドメインベンチマークであるE2E_WTQとE2E_GNQを導入する。
- 参考スコア(独自算出の注目度): 8.389189333083513
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present the first end-to-end, transformer-based table question answering
(QA) system that takes natural language questions and massive table corpus as
inputs to retrieve the most relevant tables and locate the correct table cells
to answer the question. Our system, CLTR, extends the current state-of-the-art
QA over tables model to build an end-to-end table QA architecture. This system
has successfully tackled many real-world table QA problems with a simple,
unified pipeline. Our proposed system can also generate a heatmap of candidate
columns and rows over complex tables and allow users to quickly identify the
correct cells to answer questions. In addition, we introduce two new
open-domain benchmarks, E2E_WTQ and E2E_GNQ, consisting of 2,005 natural
language questions over 76,242 tables. The benchmarks are designed to validate
CLTR as well as accommodate future table retrieval and end-to-end table QA
research and experiments. Our experiments demonstrate that our system is the
current state-of-the-art model on the table retrieval task and produces
promising results for end-to-end table QA.
- Abstract(参考訳): 本稿では,自然言語質問と膨大なテーブルコーパスを入力として,最も関係のあるテーブルを検索し,質問に答えるために正しいテーブルセルを見つける,最初のエンドツーエンドのトランスフォーマーベースのテーブル質問応答(qa)システムを提案する。
我々のシステムであるCLTRは、現在の最先端QAをテーブルモデル上に拡張し、エンドツーエンドのテーブルQAアーキテクチャを構築します。
このシステムは、単純な統一パイプラインで多くの現実世界のテーブルQA問題に取り組むことに成功した。
提案システムでは,複雑なテーブル上の候補列と行のヒートマップを生成することができ,質問に答える正しいセルを素早く特定できる。
さらに,76,242テーブル上の2,005の自然言語質問からなる2つの新しいオープンドメインベンチマークであるE2E_WTQとE2E_GNQを導入する。
ベンチマークはCLTRを検証するとともに、将来のテーブル検索とエンドツーエンドのテーブルQAの研究と実験に対応するように設計されている。
実験により,本システムはテーブル検索タスクにおける最先端モデルであり,エンドツーエンドのテーブルQAに対して有望な結果が得られた。
関連論文リスト
- Augment before You Try: Knowledge-Enhanced Table Question Answering via
Table Expansion [57.53174887650989]
テーブル質問応答は、構造化されたデータを理解し、相互作用するモデルの能力を評価する一般的なタスクである。
既存の方法は表と外部の知識の両方をテキストに変換し、表の構造的な性質を無視する。
そこで本稿では,表に外部情報を統合するための簡易で効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-01-28T03:37:11Z) - QTSumm: Query-Focused Summarization over Tabular Data [58.62152746690958]
人々は主に、データ分析を行うか、特定の質問に答えるためにテーブルをコンサルティングします。
そこで本研究では,テキスト生成モデルに人間的な推論を行なわなければならない,クエリ中心のテーブル要約タスクを新たに定義する。
このタスクには,2,934テーブル上の7,111の人間注釈付きクエリ-サマリーペアを含む,QTSummという新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:43:51Z) - MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering [61.48881995121938]
実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文 参考訳(メタデータ) (2023-05-22T08:25:15Z) - A Survey on Table Question Answering: Recent Advances [10.874446530132087]
テーブル質問回答(Table Question Answering, 表QA)は、ユーザの質問に答えるために、テーブルから正確な回答を提供する。
既存のテーブルQAの手法を,その手法により5つのカテゴリに分類する。
本稿では,いくつかの重要な課題を特定し,今後のテーブルQAの方向性について論じる。
論文 参考訳(メタデータ) (2022-07-12T02:44:40Z) - OmniTab: Pretraining with Natural and Synthetic Data for Few-shot
Table-based Question Answering [106.73213656603453]
最小限のアノテーションによるテーブルベースのQAモデルを構築した。
本稿では、自然データと合成データの両方を消費する全能事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-07-08T01:23:45Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - End-to-End Table Question Answering via Retrieval-Augmented Generation [19.89730342792824]
本稿では、T-RAGというテーブルQAモデルを紹介し、非パラメトリックな高密度ベクトルインデックスをパラメトリックシーケンス・ツー・シーケンスモデルであるBARTと組み合わせて微調整し、応答トークンを生成する。
自然言語の問題があれば、T-RAGは統合パイプラインを使用してテーブルコーパスを自動で検索し、テーブルセルから正しい回答を直接見つけ出す。
論文 参考訳(メタデータ) (2022-03-30T23:30:16Z) - Multi-Row, Multi-Span Distant Supervision For Table+Text Question [33.809732338627136]
テーブル上の質問応答(QA)と、TextTableQAとも呼ばれるリンクされたテキストは、近年重要な研究を目撃している。
両軸に沿って遠隔監視を行うように設計された変換器ベースのTextTableQAシステムであるMITQAを提案する。
論文 参考訳(メタデータ) (2021-12-14T12:48:19Z) - Capturing Row and Column Semantics in Transformer Based Question
Answering over Tables [9.347393642549806]
これらの特化事前学習技術を用いることなく、テーブルQAタスクにおいて優れた性能が得られることを示す。
最近のベンチマーク実験では、提案手法が表上のセル値を効果的に検出できることが証明されている(ウィキ検索質問のhit@1精度は最大98%)。
論文 参考訳(メタデータ) (2021-04-16T18:22:30Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。