論文の概要: Multi-Row, Multi-Span Distant Supervision For Table+Text Question
- arxiv url: http://arxiv.org/abs/2112.07337v3
- Date: Sun, 11 Jun 2023 18:46:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 03:29:20.096477
- Title: Multi-Row, Multi-Span Distant Supervision For Table+Text Question
- Title(参考訳): タブレット+テキスト質問のためのマルチロー・マルチスパン距離スーパービジョン
- Authors: Vishwajeet Kumar, Yash Gupta, Saneem Chemmengath, Jaydeep Sen, Soumen
Chakrabarti, Samarth Bharadwaj, FeiFei Pan
- Abstract要約: テーブル上の質問応答(QA)と、TextTableQAとも呼ばれるリンクされたテキストは、近年重要な研究を目撃している。
両軸に沿って遠隔監視を行うように設計された変換器ベースのTextTableQAシステムであるMITQAを提案する。
- 参考スコア(独自算出の注目度): 33.809732338627136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Question answering (QA) over tables and linked text, also called TextTableQA,
has witnessed significant research in recent years, as tables are often found
embedded in documents along with related text. HybridQA and OTT-QA are the two
best-known TextTableQA datasets, with questions that are best answered by
combining information from both table cells and linked text passages. A common
challenge in both datasets, and TextTableQA in general, is that the training
instances include just the question and answer, where the gold answer may match
not only multiple table cells across table rows but also multiple text spans
within the scope of a table row and its associated text. This leads to a noisy
multi instance training regime. We present MITQA, a transformer-based
TextTableQA system that is explicitly designed to cope with distant supervision
along both these axes, through a multi-instance loss objective, together with
careful curriculum design. Our experiments show that the proposed
multi-instance distant supervision approach helps MITQA get state-of-the-art
results beating the existing baselines for both HybridQA and OTT-QA, putting
MITQA at the top of HybridQA leaderboard with best EM and F1 scores on a held
out test set.
- Abstract(参考訳): テーブルとリンクされたテキストに対する質問応答(QA)、またはTextTableQA(英語版)は、近年、テーブルが関連するテキストとともにドキュメントに埋め込まれることがしばしば見られるため、重要な研究を目撃している。
HybridQAとOTT-QAは2つの最もよく知られているTextTableQAデータセットであり、テーブルセルとリンクされたテキストパスからの情報を組み合わせることで最もよく答えられる質問である。
両方のデータセットとTextTableQAの一般的な課題は、トレーニングインスタンスには質問と回答のみが含まれており、ゴールドの回答はテーブル行をまたいだ複数のテーブルセルだけでなく、テーブル行とその関連するテキストの範囲内に複数のテキストが分散している可能性があることだ。
これにより、騒がしいマルチインスタンストレーニング体制が生まれる。
MITQAはトランスフォーマーをベースとしたTextTableQAシステムで、これら2つの軸に沿った遠隔監視を多インスタンス損失目標を通じて明示的に設計し、慎重にカリキュラム設計を行う。
提案手法は,HybridQAとOTT-QAの両方の既存のベースラインを破り,HybridQAのリーダーボードの上位にMITQAを配置し,EMとF1のスコアが得られた。
関連論文リスト
- TTQA-RS- A break-down prompting approach for Multi-hop Table-Text Question Answering with Reasoning and Summarization [3.531533402602335]
マルチホップテーブル-テキストQAは、テーブルとテキストの間に複数のホップを必要とする。
我々のモデルはテーブルテキスト情報検索に拡張された検索器を使用する。
我々の実験は、素早いアプローチの可能性を実証している。
論文 参考訳(メタデータ) (2024-06-20T20:55:38Z) - MFORT-QA: Multi-hop Few-shot Open Rich Table Question Answering [3.1651118728570635]
今日の急成長する業界では、専門家は大量の文書を要約し、毎日重要な情報を抽出するという課題に直面している。
この課題に対処するために、テーブル質問回答(QA)のアプローチを開発し、関連する情報を抽出した。
近年のLarge Language Models (LLMs) の進歩により,プロンプトを用いて表データから情報を取り出す新たな可能性が高まっている。
論文 参考訳(メタデータ) (2024-03-28T03:14:18Z) - MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering [61.48881995121938]
実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文 参考訳(メタデータ) (2023-05-22T08:25:15Z) - PACIFIC: Towards Proactive Conversational Question Answering over
Tabular and Textual Data in Finance [96.06505049126345]
我々はPACIFICという新しいデータセットを提案する。既存のCQAデータセットと比較すると、PACIFICは(i)活動性、(ii)数値推論、(iii)表とテキストのハイブリッドコンテキストの3つの重要な特徴を示す。
質問生成とCQAを組み合わせたPCQA(Proactive Conversational Question Answering)に基づいて,新しいタスクを定義する。
UniPCQAはPCQAのすべてのサブタスク上でマルチタスク学習を行い、Seeq2Seqの上位$kのサンプルをクロスバリデーションすることで、マルチタスク学習におけるエラー伝搬問題を緩和するための単純なアンサンブル戦略を取り入れている。
論文 参考訳(メタデータ) (2022-10-17T08:06:56Z) - Mixed-modality Representation Learning and Pre-training for Joint
Table-and-Text Retrieval in OpenQA [85.17249272519626]
最適化された OpenQA Table-Text Retriever (OTTeR) を提案する。
検索中心の混合モード合成事前学習を行う。
OTTeRはOTT-QAデータセット上でのテーブル・アンド・テキスト検索の性能を大幅に改善する。
論文 参考訳(メタデータ) (2022-10-11T07:04:39Z) - OmniTab: Pretraining with Natural and Synthetic Data for Few-shot
Table-based Question Answering [106.73213656603453]
最小限のアノテーションによるテーブルベースのQAモデルを構築した。
本稿では、自然データと合成データの両方を消費する全能事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-07-08T01:23:45Z) - CLTR: An End-to-End, Transformer-Based System for Cell Level Table
Retrieval and Table Question Answering [8.389189333083513]
本稿では,最初のエンドツーエンドのテーブル質問応答(QA)システムを提案する。
自然言語の質問と大量のテーブルコーパスを入力として、最も関係のあるテーブルを検索し、質問に答えるために正しいテーブルセルを見つける。
76,242テーブル上の2,005の自然言語質問からなる2つの新しいオープンドメインベンチマークであるE2E_WTQとE2E_GNQを導入する。
論文 参考訳(メタデータ) (2021-06-08T15:22:10Z) - TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and
Textual Content in Finance [71.76018597965378]
TAT-QAと呼ばれるタブラデータとテクスチャデータの両方を含む新しい大規模な質問応答データセットを構築します。
本稿では,テーブルとテキストの両方を推論可能な新しいQAモデルであるTAGOPを提案する。
論文 参考訳(メタデータ) (2021-05-17T06:12:06Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。