論文の概要: Multi-Instance Training for Question Answering Across Table and Linked
Text
- arxiv url: http://arxiv.org/abs/2112.07337v1
- Date: Tue, 14 Dec 2021 12:48:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 23:01:52.870687
- Title: Multi-Instance Training for Question Answering Across Table and Linked
Text
- Title(参考訳): 表とリンクテキスト間の質問応答のためのマルチインスタンス学習
- Authors: Vishwajeet Kumar, Saneem Chemmengath, Yash Gupta, Jaydeep Sen, Samarth
Bharadwaj, Soumen Chakrabarti
- Abstract要約: テーブル行選択とテキストスパン選択の異なるが密接に関連する確率空間を明示的にモデル化する新しいTextTableQAシステムを提案する。
我々の実験は、最近のベースラインと比較して、我々のアプローチの優位性を示している。
- 参考スコア(独自算出の注目度): 21.163251917876067
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Answering natural language questions using information from tables (TableQA)
is of considerable recent interest. In many applications, tables occur not in
isolation, but embedded in, or linked to unstructured text. Often, a question
is best answered by matching its parts to either table cell contents or
unstructured text spans, and extracting answers from either source. This leads
to a new space of TextTableQA problems that was introduced by the HybridQA
dataset. Existing adaptations of table representation to transformer-based
reading comprehension (RC) architectures fail to tackle the diverse modalities
of the two representations through a single system. Training such systems is
further challenged by the need for distant supervision. To reduce cognitive
burden, training instances usually include just the question and answer, the
latter matching multiple table rows and text passages. This leads to a noisy
multi-instance training regime involving not only rows of the table, but also
spans of linked text. We respond to these challenges by proposing MITQA, a new
TextTableQA system that explicitly models the different but closely-related
probability spaces of table row selection and text span selection. Our
experiments indicate the superiority of our approach compared to recent
baselines. The proposed method is currently at the top of the HybridQA
leaderboard with a held out test set, achieving 21 % absolute improvement on
both EM and F1 scores over previous published results.
- Abstract(参考訳): 表からの情報(TableQA)を使って自然言語の質問に答えることは、最近の関心事である。
多くのアプリケーションでは、テーブルは独立したものではなく、非構造化テキストに埋め込まれているか、リンクされている。
多くの場合、質問は、その部分と表セルの内容または非構造化テキストスパンを一致させ、どちらの情報源から回答を抽出することで答えられる。
これは、HybridQAデータセットによって導入されたTextTableQA問題の新しいスペースにつながります。
テーブル表現をトランスフォーマーベースの読み取り理解(RC)アーキテクチャに適応させることは、単一のシステムを通して2つの表現の多様さに対処できない。
このようなシステムの訓練は、遠隔監視の必要性により、さらに課題となる。
認知的負担を軽減するため、トレーニングインスタンスは通常、質問と回答だけを含み、後者は複数のテーブル行とテキストパスにマッチする。
これは、テーブルの行だけでなく、リンクされたテキストも含む、ノイズの多いマルチインスタンストレーニング体制につながる。
我々は、テーブル行選択とテキストスパン選択の異なるが密接に関連する確率空間を明示的にモデル化する新しいTextTableQAシステムであるMITQAを提案することで、これらの課題に対処する。
我々の実験は、最近のベースラインと比較して、我々のアプローチの優位性を示している。
提案手法は現在hybridqaリーダボードの最上位にあり,これまで公表された結果に対して,emスコアとf1スコアの両方において,21パーセントの絶対的な改善を達成している。
関連論文リスト
- TTQA-RS- A break-down prompting approach for Multi-hop Table-Text Question Answering with Reasoning and Summarization [3.531533402602335]
マルチホップテーブル-テキストQAは、テーブルとテキストの間に複数のホップを必要とする。
我々のモデルはテーブルテキスト情報検索に拡張された検索器を使用する。
我々の実験は、素早いアプローチの可能性を実証している。
論文 参考訳(メタデータ) (2024-06-20T20:55:38Z) - MFORT-QA: Multi-hop Few-shot Open Rich Table Question Answering [3.1651118728570635]
今日の急成長する業界では、専門家は大量の文書を要約し、毎日重要な情報を抽出するという課題に直面している。
この課題に対処するために、テーブル質問回答(QA)のアプローチを開発し、関連する情報を抽出した。
近年のLarge Language Models (LLMs) の進歩により,プロンプトを用いて表データから情報を取り出す新たな可能性が高まっている。
論文 参考訳(メタデータ) (2024-03-28T03:14:18Z) - MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering [61.48881995121938]
実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文 参考訳(メタデータ) (2023-05-22T08:25:15Z) - PACIFIC: Towards Proactive Conversational Question Answering over
Tabular and Textual Data in Finance [96.06505049126345]
我々はPACIFICという新しいデータセットを提案する。既存のCQAデータセットと比較すると、PACIFICは(i)活動性、(ii)数値推論、(iii)表とテキストのハイブリッドコンテキストの3つの重要な特徴を示す。
質問生成とCQAを組み合わせたPCQA(Proactive Conversational Question Answering)に基づいて,新しいタスクを定義する。
UniPCQAはPCQAのすべてのサブタスク上でマルチタスク学習を行い、Seeq2Seqの上位$kのサンプルをクロスバリデーションすることで、マルチタスク学習におけるエラー伝搬問題を緩和するための単純なアンサンブル戦略を取り入れている。
論文 参考訳(メタデータ) (2022-10-17T08:06:56Z) - Mixed-modality Representation Learning and Pre-training for Joint
Table-and-Text Retrieval in OpenQA [85.17249272519626]
最適化された OpenQA Table-Text Retriever (OTTeR) を提案する。
検索中心の混合モード合成事前学習を行う。
OTTeRはOTT-QAデータセット上でのテーブル・アンド・テキスト検索の性能を大幅に改善する。
論文 参考訳(メタデータ) (2022-10-11T07:04:39Z) - OmniTab: Pretraining with Natural and Synthetic Data for Few-shot
Table-based Question Answering [106.73213656603453]
最小限のアノテーションによるテーブルベースのQAモデルを構築した。
本稿では、自然データと合成データの両方を消費する全能事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-07-08T01:23:45Z) - CLTR: An End-to-End, Transformer-Based System for Cell Level Table
Retrieval and Table Question Answering [8.389189333083513]
本稿では,最初のエンドツーエンドのテーブル質問応答(QA)システムを提案する。
自然言語の質問と大量のテーブルコーパスを入力として、最も関係のあるテーブルを検索し、質問に答えるために正しいテーブルセルを見つける。
76,242テーブル上の2,005の自然言語質問からなる2つの新しいオープンドメインベンチマークであるE2E_WTQとE2E_GNQを導入する。
論文 参考訳(メタデータ) (2021-06-08T15:22:10Z) - TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and
Textual Content in Finance [71.76018597965378]
TAT-QAと呼ばれるタブラデータとテクスチャデータの両方を含む新しい大規模な質問応答データセットを構築します。
本稿では,テーブルとテキストの両方を推論可能な新しいQAモデルであるTAGOPを提案する。
論文 参考訳(メタデータ) (2021-05-17T06:12:06Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。