論文の概要: TabIQA: Table Questions Answering on Business Document Images
- arxiv url: http://arxiv.org/abs/2303.14935v1
- Date: Mon, 27 Mar 2023 06:31:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 16:45:24.411630
- Title: TabIQA: Table Questions Answering on Business Document Images
- Title(参考訳): TabIQA: ビジネスドキュメントイメージに関する質問に対する回答
- Authors: Phuc Nguyen, Nam Tuan Ly, Hideaki Takeda, and Atsuhiro Takasu
- Abstract要約: 本稿では,ビジネス文書イメージに関する疑問に答えるために,TabIQAという新しいパイプラインを提案する。
TabIQAは、1)最先端のディープラーニング技術を組み合わせて、画像からテーブルの内容と構造情報を抽出し、2)数値データ、テキストベース情報、構造化テーブルからの複雑なクエリに関する様々な質問に答える。
- 参考スコア(独自算出の注目度): 3.9993134366218857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Table answering questions from business documents has many challenges that
require understanding tabular structures, cross-document referencing, and
additional numeric computations beyond simple search queries. This paper
introduces a novel pipeline, named TabIQA, to answer questions about business
document images. TabIQA combines state-of-the-art deep learning techniques 1)
to extract table content and structural information from images and 2) to
answer various questions related to numerical data, text-based information, and
complex queries from structured tables. The evaluation results on VQAonBD 2023
dataset demonstrate the effectiveness of TabIQA in achieving promising
performance in answering table-related questions. The TabIQA repository is
available at https://github.com/phucty/itabqa.
- Abstract(参考訳): ビジネス文書から質問に答えるテーブルには、表構造、クロスドキュメント参照、単純な検索クエリ以上の数値計算を必要とする多くの課題がある。
本稿では,ビジネス文書イメージに関する疑問に答えるために,TabIQAという新しいパイプラインを提案する。
TabIQAが最先端のディープラーニング技術を融合
1) 画像から表の内容や構造情報を抽出すること
2) 数値データ,テキストベースの情報,構造化テーブルからの複雑なクエリに関する様々な質問に答える。
VQAonBD 2023データセットの評価結果は、テーブル関連質問への回答において、有望なパフォーマンスを達成するためのTabIQAの有効性を示す。
tabiqaリポジトリはhttps://github.com/phucty/itabqaで入手できる。
関連論文リスト
- Evaluation of Table Representations to Answer Questions from Tables in Documents : A Case Study using 3GPP Specifications [0.650923326742559]
関連するチャンクの点におけるテーブルの表現は明確ではない。
各セルに対応するテーブルヘッダ情報を含むローレベル表現は、検索性能を向上させる。
論文 参考訳(メタデータ) (2024-08-30T04:40:35Z) - DocTabQA: Answering Questions from Long Documents Using Tables [16.3130447078524]
本稿では,DocTabQAと呼ばれる質問応答(QA)の新たな問題設定について検討する。
この設定内では、長いドキュメントが与えられたら、答を文書の内容から直接導かれる構造化テーブルに整理することで質問に答えることが目的である。
我々はQTabAデータセットを導入し,300の財務文書と1.5kの質問表を手作業でアノテートした。
本稿では,DocTabTalkと呼ばれる2段階のフレームワークについて述べる。
論文 参考訳(メタデータ) (2024-08-21T10:01:12Z) - KET-QA: A Dataset for Knowledge Enhanced Table Question Answering [63.56707527868466]
本研究では,TableQAの外部知識源として知識ベース(KB)を用いることを提案する。
すべての質問は、答えるテーブルとサブグラフの両方からの情報を統合する必要がある。
我々は,膨大な知識サブグラフから関連する情報を抽出するために,レトリバー・レゾナー構造パイプラインモデルを設計する。
論文 参考訳(メタデータ) (2024-05-13T18:26:32Z) - MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering [61.48881995121938]
実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文 参考訳(メタデータ) (2023-05-22T08:25:15Z) - Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text
Documents via Semantic-Oriented Hierarchical Graphs [79.0426838808629]
視覚的にリッチなテーブルテキスト文書に答えるTAT-DQAを提案する。
具体的には、離散推論機能を強化した新しいDoc2SoarGraphフレームワークを提案する。
我々は,TAT-DQAデータセットに関する広範な実験を行い,提案したフレームワークは,テストセット上でのエクサクティマッチ(EM)とF1スコアでそれぞれ17.73%,F1スコアで16.91%の最高のベースラインモデルを上回る結果を得た。
論文 参考訳(メタデータ) (2023-05-03T07:30:32Z) - Towards Complex Document Understanding By Discrete Reasoning [77.91722463958743]
VQA(Document Visual Question Answering)は、自然言語による質問に答えるために、視覚的に豊富なドキュメントを理解することを目的としている。
我々は3,067の文書ページと16,558の質問応答ペアからなる新しいドキュメントVQAデータセットTAT-DQAを紹介する。
我々は,テキスト,レイアウト,視覚画像など,多要素の情報を考慮に入れたMHSTという新しいモデルを開発し,異なるタイプの質問にインテリジェントに対処する。
論文 参考訳(メタデータ) (2022-07-25T01:43:19Z) - FeTaQA: Free-form Table Question Answering [33.018256483762386]
FeTaQAは10Kのウィキペディアベースのテーブル、質問、自由形式の回答、テーブルセルペアをサポートする新しいデータセットである。
FeTaQAは、構造化された知識ソースから複数の不連続な事実の検索、推論、および統合後に自由形式のテキスト回答を生成する必要があるため、より困難なテーブル質問回答設定を提供する。
論文 参考訳(メタデータ) (2021-04-01T09:59:40Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。