論文の概要: Document Visual Question Answering Challenge 2020
- arxiv url: http://arxiv.org/abs/2008.08899v2
- Date: Sun, 18 Jul 2021 03:09:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 04:10:26.854009
- Title: Document Visual Question Answering Challenge 2020
- Title(参考訳): ドキュメント ビジュアル質問応答チャレンジ2020
- Authors: Minesh Mathew, Ruben Tito, Dimosthenis Karatzas, R. Manmatha, C.V.
Jawahar
- Abstract要約: 本稿では,CVPR 2020における「深層学習時代のテキストと文書」ワークショップの一環として組織された文書ビジュアル質問回答チャレンジの結果について述べる。
この課題は、ドキュメントイメージに対する視覚的質問回答という、新しい問題を導入している。
- 参考スコア(独自算出の注目度): 31.36458851232662
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents results of Document Visual Question Answering Challenge
organized as part of "Text and Documents in the Deep Learning Era" workshop, in
CVPR 2020. The challenge introduces a new problem - Visual Question Answering
on document images. The challenge comprised two tasks. The first task concerns
with asking questions on a single document image. On the other hand, the second
task is set as a retrieval task where the question is posed over a collection
of images. For the task 1 a new dataset is introduced comprising 50,000
questions-answer(s) pairs defined over 12,767 document images. For task 2
another dataset has been created comprising 20 questions over 14,362 document
images which share the same document template.
- Abstract(参考訳): 本稿では,CVPR 2020における「深層学習時代のテキストと文書」ワークショップの一環として組織された文書ビジュアル質問回答チャレンジの結果について述べる。
この課題は、文書画像に対する視覚的質問応答という新しい問題をもたらす。
挑戦は2つの課題で構成された。
最初のタスクは、単一のドキュメントイメージに関する質問に関するものです。
一方、第2のタスクは、画像の集合の上に質問が出される検索タスクとして設定される。
タスク1では、12,767以上の文書イメージで定義された5万の質問・回答ペアからなる新しいデータセットが導入される。
タスク2では、同じドキュメントテンプレートを共有する14,362のドキュメントイメージに20の質問を含む別のデータセットが作成されている。
関連論文リスト
- Ask Questions with Double Hints: Visual Question Generation with Answer-awareness and Region-reference [107.53380946417003]
本稿では,応答認識と領域参照を用いた視覚的質問生成のための新しい学習パラダイムを提案する。
我々は、追加の人間のアノテーションを導入することなく、視覚的ヒントを自己学習する簡単な手法を開発した。
論文 参考訳(メタデータ) (2024-07-06T15:07:32Z) - JDocQA: Japanese Document Question Answering Dataset for Generative Language Models [15.950718839723027]
本稿では,大規模文書ベースのQAデータセットであるJDocQAについて紹介する。
PDF形式で5,504件の文書と日本語で11,600件の質問・回答文からなる。
現実的な質問応答アプリケーションのために,複数のカテゴリの質問と,文書から解答不能な質問を取り入れた。
論文 参考訳(メタデータ) (2024-03-28T14:22:54Z) - PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。
本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。
ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文 参考訳(メタデータ) (2023-09-16T04:29:05Z) - SlideVQA: A Dataset for Document Visual Question Answering on Multiple
Images [10.207285051832258]
52k以上のスライド画像と14.5kのスライドデッキに関する質問からなる2.6k以上のスライドデッキを含む,新しいマルチイメージ文書VQAデータセットであるSlideVQAを提案する。
我々は、証拠選択と質問応答を統一的なシーケンス・ツー・シーケンス形式で扱う、新しいエンドツーエンド文書VQAモデルを開発した。
論文 参考訳(メタデータ) (2023-01-12T09:00:42Z) - Doc2Bot: Accessing Heterogeneous Documents via Conversational Bots [103.54897676954091]
Doc2Botは、ユーザーが会話を通じて情報を求めるのを助けるマシンを構築するためのデータセットである。
われわれのデータセットには、5つのドメインの中国の文書に基づく10万回以上のターンが含まれている。
論文 参考訳(メタデータ) (2022-10-20T07:33:05Z) - Task2Dial: A Novel Task and Dataset for Commonsense enhanced Task-based
Dialogue Grounded in Documents [0.304585143845864]
本稿では,文書に埋もれたコモンセンス強化タスクベース対話に関する新しい課題を提案する。
Task2Dialデータセットは、文書ベースのタスクベースの対話の新しいデータセットである。
論文 参考訳(メタデータ) (2022-04-03T12:15:56Z) - ICDAR 2021 Competition on Document VisualQuestion Answering [31.084392784258032]
このエディションは、Single Document VQAとDocument Collection VQAに関する以前のタスクを補完する。
Infographics VQAタスクで0.6120 ANLS、Document Collection VQAタスクで0.7743 ANLSL、Single Document VQAで0.8705 ANLSを獲得した。
論文 参考訳(メタデータ) (2021-11-10T06:52:07Z) - Inquisitive Question Generation for High Level Text Comprehension [60.21497846332531]
InQUISITIVEは、文書を読みながら19K質問を抽出するデータセットである。
我々は,読者が情報を求めるための実践的な戦略に携わることを示す。
我々は, GPT-2に基づく質問生成モデルを評価し, 妥当な質問を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-04T19:03:39Z) - Visual Question Answering on Image Sets [70.4472272672716]
本稿では,一般に研究されているシングルイメージVQA問題をマルチイメージ設定に一般化する,画像セット視覚質問応答(ISVQA)の課題を紹介する。
自然言語の質問と画像の集合を入力として、画像の内容に基づいて質問に答えることを目的としている。
質問は1つ以上の画像のオブジェクトと関係、あるいは画像セットによって描かれたシーン全体についてである。
論文 参考訳(メタデータ) (2020-08-27T08:03:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。