論文の概要: Open-WikiTable: Dataset for Open Domain Question Answering with Complex
Reasoning over Table
- arxiv url: http://arxiv.org/abs/2305.07288v1
- Date: Fri, 12 May 2023 07:24:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-15 13:57:55.942505
- Title: Open-WikiTable: Dataset for Open Domain Question Answering with Complex
Reasoning over Table
- Title(参考訳): Open-WikiTable: テーブル上の複雑な推論を伴うオープンドメイン質問回答データセット
- Authors: Sunjun Kweon, Yeonsu Kwon, Seonhee Cho, Yohan Jo, Edward Choi
- Abstract要約: Open-WikiTableは、テーブル上の複雑な推論を必要とする最初のODQAデータセットである。
Open-WikiTableはWikiとWikiTableQuestions上に構築されている。
- 参考スコア(独自算出の注目度): 6.436886630398141
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Despite recent interest in open domain question answering (ODQA) over tables,
many studies still rely on datasets that are not truly optimal for the task
with respect to utilizing structural nature of table. These datasets assume
answers reside as a single cell value and do not necessitate exploring over
multiple cells such as aggregation, comparison, and sorting. Thus, we release
Open-WikiTable, the first ODQA dataset that requires complex reasoning over
tables. Open-WikiTable is built upon WikiSQL and WikiTableQuestions to be
applicable in the open-domain setting. As each question is coupled with both
textual answers and SQL queries, Open-WikiTable opens up a wide range of
possibilities for future research, as both reader and parser methods can be
applied. The dataset and code are publicly available.
- Abstract(参考訳): テーブル上でのオープンドメイン質問応答(ODQA)に対する近年の関心にもかかわらず、テーブルの構造的性質の活用に関してタスクに真に最適でないデータセットに依存している研究は多い。
これらのデータセットは、回答が単一のセル値として存在すると仮定し、アグリゲーション、比較、ソートなどの複数のセルを探索する必要がない。
そこで我々は,テーブル上の複雑な推論を必要とする最初のODQAデータセットであるOpen-WikiTableをリリースした。
Open-WikiTableはWikiSQLとWikiTableQuestions上に構築されており、オープンドメイン設定に適用できる。
各質問はテキストの回答とSQLクエリの両方と結合されているため、Open-WikiTableは、読者とパーサの両方のメソッドを適用することができるため、将来の研究に幅広い可能性を開く。
データセットとコードは公開されている。
関連論文リスト
- TANQ: An open domain dataset of table answered questions [15.323690523538572]
TANQは、複数のソースにまたがる情報からテーブルを構築する必要がある、最初のオープンドメイン質問応答データセットである。
結果の表にあるすべてのセルに対する完全なソース属性を公開し、オープン、オラクル、クローズドブックのセットアップで最先端の言語モデルをベンチマークします。
最も優れたベースラインであるGPT4は、全体的なF1スコア29.1に達し、人間のパフォーマンスを19.7ポイント遅れています。
論文 参考訳(メタデータ) (2024-05-13T14:07:20Z) - Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval [52.592071689901196]
本稿では,テーブル検索において,任意のクエリやデータベースに対して有用な結合関係を明らかにする手法を提案する。
提案手法は,F1スコアの最大9.3%,エンドツーエンドQAの最大5.4%の精度で,テーブル検索の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-04-15T15:55:01Z) - MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL [51.48239006107272]
MURRE (Multi-hop table search with removal) は、未検索のテーブルへ誘導するために、質問から以前検索した情報を削除する。
2つのオープンドメインのテキスト・ツー・レトリバーデータセットの実験は、以前の最先端結果よりも平均5.7%改善したことを示している。
論文 参考訳(メタデータ) (2024-02-16T13:14:35Z) - Augment before You Try: Knowledge-Enhanced Table Question Answering via
Table Expansion [57.53174887650989]
テーブル質問応答は、構造化されたデータを理解し、相互作用するモデルの能力を評価する一般的なタスクである。
既存の方法は表と外部の知識の両方をテキストに変換し、表の構造的な性質を無視する。
そこで本稿では,表に外部情報を統合するための簡易で効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-01-28T03:37:11Z) - MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering [61.48881995121938]
実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文 参考訳(メタデータ) (2023-05-22T08:25:15Z) - Open Domain Question Answering over Virtual Documents: A Unified
Approach for Data and Text [62.489652395307914]
我々は、知識集約型アプリケーションのための構造化知識を符号化する手段として、Data-to-text法、すなわち、オープンドメイン質問応答(QA)を用いる。
具体的には、ウィキペディアとウィキソースの3つのテーブルを付加知識源として使用する、データとテキスト上でのオープンドメインQAのための冗長化-レトリバー・リーダー・フレームワークを提案する。
UDT-QA(Unified Data and Text QA)は,知識インデックスの拡大を効果的に活用できることを示す。
論文 参考訳(メタデータ) (2021-10-16T00:11:21Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - AIT-QA: Question Answering Dataset over Complex Tables in the Airline
Industry [30.330772077451048]
ドメイン固有のテーブルQAデータセットAIT-QA(Industry Table QA)を紹介する。
このデータセットは、米国証券取引委員会(SEC)の提出書類から抽出された116のテーブル上で、人間のアノテータによって書かれた515の質問から成り立っている。
また、階層的ヘッダー、ドメイン固有の用語、言い換え形を必要とするものをマークして、質問の性質に関するアノテーションも提供します。
論文 参考訳(メタデータ) (2021-06-24T12:14:18Z) - Open Domain Question Answering Using Web Tables [8.25461115955717]
ファクトイドクエリと非ファクトイドクエリの両方に対応可能なWebテーブルを用いたオープンドメインQAアプローチを開発した。
当社のソリューションは,主要な商用Web検索エンジンで実運用に使用されており,毎月数千万の実際のユーザクエリに対して直接回答を提供する。
論文 参考訳(メタデータ) (2020-01-10T01:25:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。