論文の概要: Enhancing Open-Domain Table Question Answering via Syntax- and
Structure-aware Dense Retrieval
- arxiv url: http://arxiv.org/abs/2309.10506v1
- Date: Tue, 19 Sep 2023 10:40:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 15:04:16.103195
- Title: Enhancing Open-Domain Table Question Answering via Syntax- and
Structure-aware Dense Retrieval
- Title(参考訳): 構文と構造を考慮したDense Retrievalによるオープンドメインテーブル質問応答の強化
- Authors: Nengzheng Jin, Dongfang Li, Junying Chen, Joanna Siebert, Qingcai Chen
- Abstract要約: オープンドメインのテーブル質問応答は、大量のテーブルから情報を検索して抽出することで、質問に対する回答を提供することを目的としている。
オープンドメインテーブルQAの既存の研究は、直接テキスト検索手法を採用するか、テーブル検索のための符号化層にのみテーブル構造を考慮する。
オープンドメインテーブルQAタスクに対する構文と構造を意識した検索手法を提案する。
- 参考スコア(独自算出の注目度): 21.585255812861632
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-domain table question answering aims to provide answers to a question by
retrieving and extracting information from a large collection of tables.
Existing studies of open-domain table QA either directly adopt text retrieval
methods or consider the table structure only in the encoding layer for table
retrieval, which may cause syntactical and structural information loss during
table scoring. To address this issue, we propose a syntax- and structure-aware
retrieval method for the open-domain table QA task. It provides syntactical
representations for the question and uses the structural header and value
representations for the tables to avoid the loss of fine-grained syntactical
and structural information. Then, a syntactical-to-structural aggregator is
used to obtain the matching score between the question and a candidate table by
mimicking the human retrieval process. Experimental results show that our
method achieves the state-of-the-art on the NQ-tables dataset and overwhelms
strong baselines on a newly curated open-domain Text-to-SQL dataset.
- Abstract(参考訳): open-domain table question answeringは、大量のテーブルから情報を検索し抽出することで、質問への答えを提供することを目的としている。
オープンドメインテーブルqaの既存の研究は、直接テキスト検索法を採用するか、テーブル検索のためのエンコーディング層でのみテーブル構造を検討するかのいずれかであり、テーブルスコアリング中に構文的および構造的情報損失を引き起こす可能性がある。
この問題に対処するために,オープンドメインテーブルQAタスクの構文と構造を意識した検索手法を提案する。
質問に対する構文的表現を提供し、テーブルの構造的ヘッダと値表現を使用して、微粒な構文的および構造的情報の損失を回避する。
そして、構文から構造への集約を用いて、人間の検索プロセスを模倣して、質問と候補テーブルとのマッチングスコアを得る。
実験の結果,提案手法はNQ-tablesデータセットの最先端性を達成し,オープンドメインのText-to-SQLデータセットに強いベースラインを圧倒することがわかった。
関連論文リスト
- Augment before You Try: Knowledge-Enhanced Table Question Answering via
Table Expansion [57.53174887650989]
テーブル質問応答は、構造化されたデータを理解し、相互作用するモデルの能力を評価する一般的なタスクである。
既存の方法は表と外部の知識の両方をテキストに変換し、表の構造的な性質を無視する。
そこで本稿では,表に外部情報を統合するための簡易で効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-01-28T03:37:11Z) - Beyond Extraction: Contextualising Tabular Data for Efficient
Summarisation by Language Models [0.0]
Retrieval-Augmented Generation アーキテクチャの従来の利用は、様々な文書から情報を取得するのに有効であることが証明されている。
本研究では,RAGに基づくシステムにおいて,複雑なテーブルクエリの精度を高めるための革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-04T16:16:14Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - DrugEHRQA: A Question Answering Dataset on Structured and Unstructured
Electronic Health Records For Medicine Related Queries [7.507210439502174]
本稿では, 質問応答データセット(DrugEHRQA)を開発した。
我々のデータセットには、70,000以上の質問応答対を含む、医薬品関連のクエリがある。
論文 参考訳(メタデータ) (2022-05-03T03:50:50Z) - Representations for Question Answering from Documents with Tables and
Text [22.522986299412807]
周囲のテキストからの情報をもとに表表現を精緻化することで、表からの質問応答の向上を目指します。
また,全文からの質問応答のためのテキストと表に基づく予測を組み合わせるための有効な方法を提案する。
論文 参考訳(メタデータ) (2021-01-26T05:52:20Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - DART: Open-Domain Structured Data Record to Text Generation [91.23798751437835]
82k以上のインスタンス(DART)を持つオープンドメイン構造化DAta Record to Text生成データセットであるDARTを提案する。
本稿では,テーブルヘッダとテーブルタイトル間の意味的依存関係を利用して,その構造を符号化するテーブルから意味的三重項を抽出する手法を提案する。
我々のデータセット構築フレームワークは、オープンドメイン意味解析と対話行動に基づく意味表現タスクからヘテロジニアスソースを効果的に統合する。
論文 参考訳(メタデータ) (2020-07-06T16:35:30Z) - Identifying Table Structure in Documents using Conditional Generative
Adversarial Networks [0.0]
多くの産業や学術研究において、情報は主に構造化されていない文書の形で伝達される。
本稿では,まず,テーブルイメージを標準化されたスケルトンテーブル形式にマッピングするために,条件付き生成逆数ネットワークを用いたトップダウンアプローチを提案する。
次に、xy-cutプロジェクションと遺伝的アルゴリズムを用いた潜在テーブル構造を導出する。
論文 参考訳(メタデータ) (2020-01-13T20:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。