論文の概要: Multi-Hop Table Retrieval for Open-Domain Text-to-SQL
- arxiv url: http://arxiv.org/abs/2402.10666v1
- Date: Fri, 16 Feb 2024 13:14:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-19 16:16:50.705822
- Title: Multi-Hop Table Retrieval for Open-Domain Text-to-SQL
- Title(参考訳): Open-Domain Text-to-SQLのためのマルチホップテーブル検索
- Authors: Xuanliang Zhang, Dingzirui Wang, Longxu Dou, Qingfu Zhu, Wanxiang Che
- Abstract要約: 我々はリライトとビームサーチによるマルチホップテーブル検索を提案する(Murre)。
我々はSpiderUnionとBirdUnion+の実験を行い、6.38%の平均的な改善で新しい最先端の結果を得た。
- 参考スコア(独自算出の注目度): 55.2326738851157
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Open-domain text-to-SQL is an important task that retrieves question-relevant
tables from massive databases and then generates SQL. However, existing
retrieval methods that retrieve in a single hop do not pay attention to the
text-to-SQL challenge of schema linking, which is aligning the entities in the
question with table entities, reflected in two aspects: similar irrelevant
entity and domain mismatch entity. Therefore, we propose our method, the
multi-hop table retrieval with rewrite and beam search (Murre). To reduce the
effect of the similar irrelevant entity, our method focuses on unretrieved
entities at each hop and considers the low-ranked tables by beam search. To
alleviate the limitation of domain mismatch entity, Murre rewrites the question
based on retrieved tables in multiple hops, decreasing the domain gap with
relevant tables. We conduct experiments on SpiderUnion and BirdUnion+, reaching
new state-of-the-art results with an average improvement of 6.38%.
- Abstract(参考訳): オープンドメインのテキスト-to-SQLは、巨大なデータベースから質問関連テーブルを取得し、SQLを生成する重要なタスクである。
しかし、単一のホップで検索する既存の検索方法は、テーブルエンティティと問題内のエンティティを一致させるスキーマリンクのテキストからSQLへの挑戦には注意を払わない。
そこで本研究では,リライトとビームサーチによるマルチホップテーブル検索(Murre)を提案する。
類似の非関連エンティティの効果を低減するため,本手法ではホップ毎の未検索エンティティに着目し,ビームサーチによる低ランクテーブルの検討を行う。
ドメインミスマッチエンティティの制限を軽減するため、Murre氏は複数のホップで取得したテーブルに基づいて質問を書き直し、関連するテーブルとのドメインギャップを減らした。
我々はSpiderUnionとBirdUnion+の実験を行い、6.38%の平均的な改善で新しい最先端の結果を得た。
関連論文リスト
- Augment before You Try: Knowledge-Enhanced Table Question Answering via
Table Expansion [57.53174887650989]
テーブル質問応答は、構造化されたデータを理解し、相互作用するモデルの能力を評価する一般的なタスクである。
既存の方法は表と外部の知識の両方をテキストに変換し、表の構造的な性質を無視する。
そこで本稿では,表に外部情報を統合するための簡易で効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-01-28T03:37:11Z) - Enhancing Open-Domain Table Question Answering via Syntax- and
Structure-aware Dense Retrieval [21.585255812861632]
オープンドメインのテーブル質問応答は、大量のテーブルから情報を検索して抽出することで、質問に対する回答を提供することを目的としている。
オープンドメインテーブルQAの既存の研究は、直接テキスト検索手法を採用するか、テーブル検索のための符号化層にのみテーブル構造を考慮する。
オープンドメインテーブルQAタスクに対する構文と構造を意識した検索手法を提案する。
論文 参考訳(メタデータ) (2023-09-19T10:40:09Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Towards Multi-Modal DBMSs for Seamless Querying of Texts and Tables [14.249508312922334]
マルチモーダルリレーショナル演算子(MMOps)によるデータベースの拡張を提案する。
MMOpsでは、手動でデータ変換することなく、テキストコレクションをテーブルとして扱うことができる。
我々のMMDBプロトタイプは、テキスト・ツー・テーブルのような最先端のアプローチを精度と性能の点で上回りません。
論文 参考訳(メタデータ) (2023-04-26T13:31:04Z) - SADGA: Structure-Aware Dual Graph Aggregation Network for Text-to-SQL [29.328698264910596]
Text-to-Graphの最も難しい問題の1つは、トレーニングされたモデルを見えないデータベーススキーマに一般化する方法である。
クロスドメインテキスト・トゥ・グラフのための構造対応デュアルグラフアグリゲーションネットワーク(SADGA)を提案する。
執筆時点では、挑戦的なText-to-GraphベンチマークのSpiderで3位を獲得しました。
論文 参考訳(メタデータ) (2021-11-01T01:50:28Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - BERT Meets Relational DB: Contextual Representations of Relational
Databases [4.029818252558553]
複数のテーブルからなる関係データベース上でエンティティの低次元表現を学習する問題に対処する。
これらの注意に基づくモデルを使用して、リレーショナルデータベース内のエンティティの埋め込みを学ぶ方法を検討します。
論文 参考訳(メタデータ) (2021-04-30T11:23:26Z) - DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using
Bi-Directional Recurrent Neural Networks [0.2578242050187029]
NLQのPOSタグを利用した新しいディープラーニングに基づく教師付きアプローチを提案する。
8つの異なるデータセットに対するアプローチを評価し、最新の精度結果、平均92.4%$を報告します。
論文 参考訳(メタデータ) (2021-01-11T22:54:39Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。