論文の概要: Representations for Question Answering from Documents with Tables and
Text
- arxiv url: http://arxiv.org/abs/2101.10573v1
- Date: Tue, 26 Jan 2021 05:52:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 19:58:05.061786
- Title: Representations for Question Answering from Documents with Tables and
Text
- Title(参考訳): 表とテキストを用いた文書からの質問応答表現
- Authors: Vicky Zayats, Kristina Toutanova, and Mari Ostendorf
- Abstract要約: 周囲のテキストからの情報をもとに表表現を精緻化することで、表からの質問応答の向上を目指します。
また,全文からの質問応答のためのテキストと表に基づく予測を組み合わせるための有効な方法を提案する。
- 参考スコア(独自算出の注目度): 22.522986299412807
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tables in Web documents are pervasive and can be directly used to answer many
of the queries searched on the Web, motivating their integration in question
answering. Very often information presented in tables is succinct and hard to
interpret with standard language representations. On the other hand, tables
often appear within textual context, such as an article describing the table.
Using the information from an article as additional context can potentially
enrich table representations. In this work we aim to improve question answering
from tables by refining table representations based on information from
surrounding text. We also present an effective method to combine text and
table-based predictions for question answering from full documents, obtaining
significant improvements on the Natural Questions dataset.
- Abstract(参考訳): Webドキュメントのテーブルは広く普及しており、Webで検索されたクエリの多くに答えるために直接使用することができる。
表に示される情報はしばしば簡潔であり、標準言語表現では解釈が難しい。
一方、テーブルは、表を記述した記事など、テキストのコンテキスト内に現れることが多い。
記事の情報を追加のコンテキストとして使用すると、テーブル表現が強化される可能性があります。
本研究は,周辺テキストの情報に基づいて表表現を精査することで,表からの質問応答を改善することを目的とする。
また,全文書からの質問応答に対して,テキストと表に基づく予測を併用し,自然質問データセットの大幅な改善を実現するための効果的な手法を提案する。
関連論文リスト
- OmniTab: Pretraining with Natural and Synthetic Data for Few-shot
Table-based Question Answering [106.73213656603453]
最小限のアノテーションによるテーブルベースのQAモデルを構築した。
本稿では、自然データと合成データの両方を消費する全能事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-07-08T01:23:45Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - Learning Better Representation for Tables by Self-Supervised Tasks [23.69766883380125]
本稿では,表表現の学習を支援するために,数値順序付けと有意順序付けという2つの自己教師型タスクを提案する。
本手法はNBAゲーム統計と関連ニュースからなるROTOWIREを用いて検証する。
論文 参考訳(メタデータ) (2020-10-15T09:03:38Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z) - Summarizing and Exploring Tabular Data in Conversational Search [36.14882974814593]
会話指向のオープンドメインテーブル要約データセットを新たに構築する。
注釈付きテーブルサマリーが含まれており、質問に答えるだけでなく、テーブル内の他の情報を探索するのに役立つ。
本データセットを用いて,SOTAベースラインとして自動テーブル要約システムの開発を行う。
論文 参考訳(メタデータ) (2020-05-23T08:29:51Z) - ToTTo: A Controlled Table-To-Text Generation Dataset [61.83159452483026]
ToTToはオープンドメインの英語のテーブル・トゥ・テキストのデータセットで、12万以上のトレーニングサンプルがある。
本稿では、ウィキペディアから既存の候補文を直接修正するデータセット構築プロセスを紹介する。
通常流動的であるが、既存の方法は多くの場合、表がサポートしていないフレーズを幻覚させる。
論文 参考訳(メタデータ) (2020-04-29T17:53:45Z) - Open Domain Question Answering Using Web Tables [8.25461115955717]
ファクトイドクエリと非ファクトイドクエリの両方に対応可能なWebテーブルを用いたオープンドメインQAアプローチを開発した。
当社のソリューションは,主要な商用Web検索エンジンで実運用に使用されており,毎月数千万の実際のユーザクエリに対して直接回答を提供する。
論文 参考訳(メタデータ) (2020-01-10T01:25:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。