論文の概要: Semantic Decomposition of Question and SQL for Text-to-SQL Parsing
- arxiv url: http://arxiv.org/abs/2310.13575v1
- Date: Fri, 20 Oct 2023 15:13:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 22:12:28.350570
- Title: Semantic Decomposition of Question and SQL for Text-to-SQL Parsing
- Title(参考訳): テキストからSQLへのパーシングのための質問とSQLのセマンティック分解
- Authors: Ben Eyal, Amir Bachar, Ophir Haroche, Moran Mahabi, Michael Elhadad
- Abstract要約: 本稿では,sqlクエリを単純かつ正規のサブクエリに体系的に分解するモジュール型クエリプラン言語(QPL)を提案する。
実験の結果,QPLは意味論的に等価なクエリに対して,テキスト対QPLよりも有効であることがわかった。
- 参考スコア(独自算出の注目度): 2.684900573255764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-SQL semantic parsing faces challenges in generalizing to cross-domain
and complex queries. Recent research has employed a question decomposition
strategy to enhance the parsing of complex SQL queries. However, this strategy
encounters two major obstacles: (1) existing datasets lack question
decomposition; (2) due to the syntactic complexity of SQL, most complex queries
cannot be disentangled into sub-queries that can be readily recomposed. To
address these challenges, we propose a new modular Query Plan Language (QPL)
that systematically decomposes SQL queries into simple and regular sub-queries.
We develop a translator from SQL to QPL by leveraging analysis of SQL server
query optimization plans, and we augment the Spider dataset with QPL programs.
Experimental results demonstrate that the modular nature of QPL benefits
existing semantic-parsing architectures, and training text-to-QPL parsers is
more effective than text-to-SQL parsing for semantically equivalent queries.
The QPL approach offers two additional advantages: (1) QPL programs can be
paraphrased as simple questions, which allows us to create a dataset of
(complex question, decomposed questions). Training on this dataset, we obtain a
Question Decomposer for data retrieval that is sensitive to database schemas.
(2) QPL is more accessible to non-experts for complex queries, leading to more
interpretable output from the semantic parser.
- Abstract(参考訳): テキストからSQLへのセマンティック解析は、クロスドメインおよび複雑なクエリへの一般化において課題に直面している。
最近の研究では、複雑なSQLクエリのパースを強化するために、質問分解戦略を採用している。
しかし、この戦略は2つの大きな障害に直面する: (1) 既存のデータセットには疑問の分解がない; (2) SQLの構文上の複雑さのため、ほとんどの複雑なクエリは簡単に再コンパイルできるサブクエリに切り離せない。
これらの課題に対処するため,我々は,sqlクエリを単純かつ正規なサブクエリに体系的に分解するモジュール型クエリプラン言語 (qpl) を提案する。
我々はSQLサーバクエリ最適化計画の分析を利用してSQLからQPLへのトランスレータを開発し、QPLプログラムでスパイダーデータセットを増強する。
実験の結果,QPLのモジュール性は既存のセマンティックパーシングアーキテクチャの恩恵を受けており,テキスト対QPLパーサのトレーニングは意味論的に等価なクエリに対するテキスト対SQLパーシングよりも効果的であることがわかった。
qplアプローチには2つの利点がある。 (1) qplプログラムは単純な質問としてパラフレーズすることができ、(複雑な質問、分解された質問)データセットを作成することができる。
このデータセットのトレーニングでは、データベーススキーマに敏感なデータ検索のための質問分解器を得る。
2) QPLは、複雑なクエリの非専門家によりアクセスしやすく、セマンティックパーサからのより解釈可能な出力をもたらす。
関連論文リスト
- Semantic Parsing for Complex Data Retrieval: Targeting Query Plans vs.
SQL for No-Code Access to Relational Databases [2.933060994339853]
より単純な構文と複雑なクエリのモジュール仕様を備えた代替クエリ言語の可能性について検討する。
提案されている代替クエリ言語はQuery Plan Language (QPL) と呼ばれる。
複雑なクエリの課題に対して,反復的かつユーザ制御的な方法で対処する方法を提案する。
論文 参考訳(メタデータ) (2023-12-22T16:16:15Z) - Retrieval-augmented GPT-3.5-based Text-to-SQL Framework with
Sample-aware Prompting and Dynamic Revision Chain [21.593701177605652]
サンプルと動的リビジョンチェーンを含むテキスト・ツー・アウェア・プロンプト・フレームワークを提案する。
提案手法は,質問項目のサンプルと詳細な情報を含む。
人間の介入なしに実行可能で正確なスクルを生成するために、我々は、きめ細かいフィードバックを反復的に適応する動的リビジョンチェーンを設計する。
論文 参考訳(メタデータ) (2023-07-11T07:16:22Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Prompting GPT-3.5 for Text-to-SQL with De-semanticization and Skeleton
Retrieval [17.747079214502673]
Text-to-は、自然言語の質問を構造化されたクエリ言語()に変換し、データベースから情報を取得するタスクである。
本稿では,テキスト・トゥ・テキストのための LLM ベースのフレームワークを提案する。
我々は,疑問骨格を抽出する非意味化機構を設計し,その構造的類似性に基づいて類似した例を検索する。
論文 参考訳(メタデータ) (2023-04-26T06:02:01Z) - Successive Prompting for Decomposing Complex Questions [50.00659445976735]
最近の研究は、大規模言語モデル(LM)の機能を活用して、数ショットで複雑な質問応答を行う。
そこでは、複雑なタスクを単純なタスクに繰り返し分解し、それを解決し、最終解を得るまでプロセスを繰り返します。
我々の最良のモデル(逐次プロンプト付き)は、DROPデータセットの数ショットバージョンにおいて、5%の絶対F1の改善を実現します。
論文 参考訳(メタデータ) (2022-12-08T06:03:38Z) - Towards Generalizable and Robust Text-to-SQL Parsing [77.18724939989647]
本稿では,タスク分解,知識獲得,知識構成からなる新しいTKKフレームワークを提案する。
このフレームワークは,Spider,SParC,Co.データセット上でのすべてのシナリオと最先端のパフォーマンスに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T09:21:27Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - SPARQLing Database Queries from Intermediate Question Decompositions [7.475027071883912]
自然言語の質問をデータベースクエリに変換するために、ほとんどのアプローチは、完全に注釈付けされたトレーニングセットに依存している。
データベースの中間問題表現を基盤として,この負担を軽減する。
我々のパイプラインは、自然言語質問を中間表現に変換するセマンティックと、訓練不能なトランスパイラをQLSPARクエリ言語に変換する2つの部分から構成される。
論文 参考訳(メタデータ) (2021-09-13T17:57:12Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - A Tale of Two Linkings: Dynamically Gating between Schema Linking and
Structural Linking for Text-to-SQL Parsing [25.81069211061945]
Text-to- semantic parsingでは、生成したsqlクエリの正しいエンティティを選択することは重要かつ困難である。
この課題に対処するための2つのリンクプロセス: 明示的なNLの言及をデータベースにリンクするスキーマリンクと、出力sqlのエンティティとデータベーススキーマの構造的関係をリンクする構造的リンク。
提案手法を2つのグラフニューラルネットワークに基づくセマンティクスとBERT表現と統合することにより,課題となるスパイダーデータセットのパース精度が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2020-09-30T17:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。