論文の概要: Feature Representation Learning for NL2SQL Generation Based on Coupling
and Decoupling
- arxiv url: http://arxiv.org/abs/2306.17646v1
- Date: Fri, 30 Jun 2023 13:34:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-03 12:14:58.466936
- Title: Feature Representation Learning for NL2SQL Generation Based on Coupling
and Decoupling
- Title(参考訳): カップリングとデカップリングに基づくNL2SQL生成のための特徴表現学習
- Authors: Chenduo Hao, Xu Zhang, Chuanbao Gao, Deyu Zhou
- Abstract要約: NL2タスクに対するClauuse Feature correlation Decoupling and Coupling(CFCDC)モデルを提案する。
提案モデルでは,ウィキデータセットの性能が向上し,論理精度と実行精度が大幅に向上した。
CFCDCモデルのソースコードはGitHubで公開されている。
- 参考スコア(独自算出の注目度): 13.860197506312538
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The NL2SQL task involves parsing natural language statements into SQL
queries. While most state-of-the-art methods treat NL2SQL as a slot-filling
task and use feature representation learning techniques, they overlook explicit
correlation features between the SELECT and WHERE clauses and implicit
correlation features between sub-tasks within a single clause. To address this
issue, we propose the Clause Feature Correlation Decoupling and Coupling
(CFCDC) model, which uses a feature representation decoupling method to
separate the SELECT and WHERE clauses at the parameter level. Next, we
introduce a multi-task learning architecture to decouple implicit correlation
feature representation between different SQL tasks in a specific clause.
Moreover, we present an improved feature representation coupling module to
integrate the decoupled tasks in the SELECT and WHERE clauses and predict the
final SQL query. Our proposed CFCDC model demonstrates excellent performance on
the WikiSQL dataset, with significant improvements in logic precision and
execution accuracy. The source code for the model will be publicly available on
GitHub
- Abstract(参考訳): nl2sqlタスクは自然言語ステートメントをsqlクエリに解析する。
多くの最先端の手法は、NL2SQLをスロットフルタスクとして扱い、特徴表現学習技術を使用するが、SELECTとWHERE節と1つの節内のサブタスク間の暗黙的な相関特徴を見落としている。
本稿では,特徴表現デカップリング手法を用いてパラメータレベルでのSELECTとWHEREの節を分離するClauuse Feature correlation Decoupling and Coupling(CFCDC)モデルを提案する。
次に、異なるSQLタスク間の暗黙的相関特徴表現を特定の節で分離するマルチタスク学習アーキテクチャを提案する。
さらに,select文とwhere節の切り離されたタスクを統合し,最終的なsqlクエリを予測するための改良された機能表現結合モジュールを提案する。
提案するcfcdcモデルはwikisqlデータセット上で優れた性能を示し,論理精度と実行精度を大幅に改善した。
モデルのソースコードはGitHubで公開されている。
関連論文リスト
- SQL-GEN: Bridging the Dialect Gap for Text-to-SQL Via Synthetic Data And Model Merging [30.306023265985658]
あらゆる方言に対して高品質な合成学習データを生成するためのフレームワークを提案する。
本稿では,方言間の共有知識を活用する新しいMixture-of-Experts(MoE)を提案する。
論文 参考訳(メタデータ) (2024-08-22T20:50:48Z) - FuncEvalGMN: Evaluating Functional Correctness of SQL via Graph Matching Network [8.517407780079207]
本稿では,SQL生成の機能的正しさを評価するためのグラフベースの新しい手法を提案する。
提案手法であるtextttFuncEvalGMN は,テストデータの十分な準備に依存しない。
論文 参考訳(メタデータ) (2024-07-09T03:05:27Z) - SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing [64.80483736666123]
文脈依存型テキスト・ツー・パースのための新しい事前学習フレームワークSTARを提案する。
さらに,STARを事前学習するための大規模コンテキスト依存型テキスト対話コーパスを構築した。
大規模な実験により、STARは2つの下流ベンチマークで新しい最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2022-10-21T11:30:07Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder
for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。
また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。
スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-03-14T09:49:15Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z) - A Tale of Two Linkings: Dynamically Gating between Schema Linking and
Structural Linking for Text-to-SQL Parsing [25.81069211061945]
Text-to- semantic parsingでは、生成したsqlクエリの正しいエンティティを選択することは重要かつ困難である。
この課題に対処するための2つのリンクプロセス: 明示的なNLの言及をデータベースにリンクするスキーマリンクと、出力sqlのエンティティとデータベーススキーマの構造的関係をリンクする構造的リンク。
提案手法を2つのグラフニューラルネットワークに基づくセマンティクスとBERT表現と統合することにより,課題となるスパイダーデータセットのパース精度が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2020-09-30T17:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。