論文の概要: Natural SQL: Making SQL Easier to Infer from Natural Language
Specifications
- arxiv url: http://arxiv.org/abs/2109.05153v1
- Date: Sat, 11 Sep 2021 01:53:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:51:54.313052
- Title: Natural SQL: Making SQL Easier to Infer from Natural Language
Specifications
- Title(参考訳): Natural SQL: 自然言語仕様からの推論を容易にするSQL
- Authors: Yujian Gan and Xinyun Chen and Jinxia Xie and Matthew Purver and John
R. Woodward and John Drake and Qiaofu Zhang
- Abstract要約: 我々はNatural SQL(Nat)と呼ばれるSQL中間表現を提案する。
挑戦的なテキスト・ツー・スキーマのベンチマークであるSpiderでは、Natが他のIRより優れており、以前のSOTAモデルの性能が大幅に向上することを示した。
実行可能生成をサポートしない既存のモデルでは、Natは実行可能クエリを容易に生成することができ、新しい最先端実行精度を実現する。
- 参考スコア(独自算出の注目度): 15.047104267689052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Addressing the mismatch between natural language descriptions and the
corresponding SQL queries is a key challenge for text-to-SQL translation. To
bridge this gap, we propose an SQL intermediate representation (IR) called
Natural SQL (NatSQL). Specifically, NatSQL preserves the core functionalities
of SQL, while it simplifies the queries as follows: (1) dispensing with
operators and keywords such as GROUP BY, HAVING, FROM, JOIN ON, which are
usually hard to find counterparts for in the text descriptions; (2) removing
the need for nested subqueries and set operators; and (3) making schema linking
easier by reducing the required number of schema items. On Spider, a
challenging text-to-SQL benchmark that contains complex and nested SQL queries,
we demonstrate that NatSQL outperforms other IRs, and significantly improves
the performance of several previous SOTA models. Furthermore, for existing
models that do not support executable SQL generation, NatSQL easily enables
them to generate executable SQL queries, and achieves the new state-of-the-art
execution accuracy.
- Abstract(参考訳): 自然言語記述と対応するSQLクエリのミスマッチに対処することは、テキストからSQLへの変換において重要な課題である。
このギャップを埋めるために、Natural SQL(NatSQL)と呼ばれるSQL中間表現(IR)を提案する。
具体的には、natsqlはsqlの中核的な機能を維持しながら、クエリを単純化している。 1) テキスト記述で対応するものを見つけるのが難しいgroup by、from、joinといった演算子やキーワードを不要にする、2) ネストしたサブクエリとセット演算子を不要にする、3) 必要なスキーマ項目の数を減らすことでスキーマリンクを容易にする。
複雑でネストしたSQLクエリを含む挑戦的なテキスト-SQLベンチマークであるSpiderでは、NatSQLが他のIRより優れており、いくつかのSOTAモデルの性能が大幅に向上していることを示す。
さらに、実行可能SQL生成をサポートしない既存のモデルでは、NatSQLは実行可能SQLクエリを容易に生成することができ、新しい最先端実行精度を実現する。
関連論文リスト
- KeyInst: Keyword Instruction for Improving SQL Formulation in Text-to-SQL [0.5755004576310334]
KeyInstは、最後のクエリの一部である可能性が高いピボットキーワードに関するガイダンスを提供する。
SQLの定式化評価に特化して設計されたベンチマークであるStrucQLを開発した。
論文 参考訳(メタデータ) (2024-10-18T02:45:36Z) - SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL Translation [16.07396492960869]
本稿では,テキストからテキストへの変換処理に特化して設計されたトランスフォーマーアーキテクチャを提案する。
我々のモデルは、実行可能層とデコーダ層に構造的帰納バイアスを組み込んで、クエリを自動で抽象構文木(AST)として予測する。
論文 参考訳(メタデータ) (2023-10-27T00:13:59Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Towards Generalizable and Robust Text-to-SQL Parsing [77.18724939989647]
本稿では,タスク分解,知識獲得,知識構成からなる新しいTKKフレームワークを提案する。
このフレームワークは,Spider,SParC,Co.データセット上でのすべてのシナリオと最先端のパフォーマンスに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T09:21:27Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder
for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。
また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。
スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-03-14T09:49:15Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z) - RYANSQL: Recursively Applying Sketch-based Slot Fillings for Complex
Text-to-SQL in Cross-Domain Databases [6.349764856675643]
我々は、ドメイン間データベースのテキスト・トゥ・スケッチタスクを解決するために、RYANと呼ばれるニューラルネットワークアプローチを提案する。
RYANは挑戦的なスパイダーベンチマークで58.2%の精度を達成した。
論文 参考訳(メタデータ) (2020-04-07T04:51:04Z) - Bertrand-DR: Improving Text-to-SQL using a Discriminative Re-ranker [1.049360126069332]
生成テキスト-リミモデルの性能向上を図るために,新しい離散型リランカを提案する。
テキスト・ト・リミモデルとリランカモデルの相対強度を最適性能として解析する。
本稿では,2つの最先端テキスト-リミモデルに適用することで,リランカの有効性を実証する。
論文 参考訳(メタデータ) (2020-02-03T04:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。