論文の概要: Feature Representation Learning for NL2SQL Generation Based on Coupling
and Decoupling
- arxiv url: http://arxiv.org/abs/2306.17646v1
- Date: Fri, 30 Jun 2023 13:34:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-03 12:14:58.466936
- Title: Feature Representation Learning for NL2SQL Generation Based on Coupling
and Decoupling
- Title(参考訳): カップリングとデカップリングに基づくNL2SQL生成のための特徴表現学習
- Authors: Chenduo Hao, Xu Zhang, Chuanbao Gao, Deyu Zhou
- Abstract要約: NL2タスクに対するClauuse Feature correlation Decoupling and Coupling(CFCDC)モデルを提案する。
提案モデルでは,ウィキデータセットの性能が向上し,論理精度と実行精度が大幅に向上した。
CFCDCモデルのソースコードはGitHubで公開されている。
- 参考スコア(独自算出の注目度): 13.860197506312538
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The NL2SQL task involves parsing natural language statements into SQL
queries. While most state-of-the-art methods treat NL2SQL as a slot-filling
task and use feature representation learning techniques, they overlook explicit
correlation features between the SELECT and WHERE clauses and implicit
correlation features between sub-tasks within a single clause. To address this
issue, we propose the Clause Feature Correlation Decoupling and Coupling
(CFCDC) model, which uses a feature representation decoupling method to
separate the SELECT and WHERE clauses at the parameter level. Next, we
introduce a multi-task learning architecture to decouple implicit correlation
feature representation between different SQL tasks in a specific clause.
Moreover, we present an improved feature representation coupling module to
integrate the decoupled tasks in the SELECT and WHERE clauses and predict the
final SQL query. Our proposed CFCDC model demonstrates excellent performance on
the WikiSQL dataset, with significant improvements in logic precision and
execution accuracy. The source code for the model will be publicly available on
GitHub
- Abstract(参考訳): nl2sqlタスクは自然言語ステートメントをsqlクエリに解析する。
多くの最先端の手法は、NL2SQLをスロットフルタスクとして扱い、特徴表現学習技術を使用するが、SELECTとWHERE節と1つの節内のサブタスク間の暗黙的な相関特徴を見落としている。
本稿では,特徴表現デカップリング手法を用いてパラメータレベルでのSELECTとWHEREの節を分離するClauuse Feature correlation Decoupling and Coupling(CFCDC)モデルを提案する。
次に、異なるSQLタスク間の暗黙的相関特徴表現を特定の節で分離するマルチタスク学習アーキテクチャを提案する。
さらに,select文とwhere節の切り離されたタスクを統合し,最終的なsqlクエリを予測するための改良された機能表現結合モジュールを提案する。
提案するcfcdcモデルはwikisqlデータセット上で優れた性能を示し,論理精度と実行精度を大幅に改善した。
モデルのソースコードはGitHubで公開されている。
関連論文リスト
- SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - Improved NL2SQL based on Multi-layer Expert Network [5.921227229250013]
本研究では,マルチタスク階層型ネットワークを利用したMulti-Layer Expert Generate SQL (MLEG-)という新しい手法を提案する。
ネットワークの下位層は自然言語文のセマンティックな特徴を抽出し、上位層は特定の分類タスクのための専門的なシステムを構築する。
この階層的なアプローチは、異なるタスクの競合に起因するパフォーマンス低下を緩和します。
論文 参考訳(メタデータ) (2023-06-30T15:16:52Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - Wav2SQL: Direct Generalizable Speech-To-SQL Parsing [55.10009651476589]
Speech-to-Spider (S2Spider) は、与えられたデータベースに対する音声質問をsqlクエリに変換することを目的としている。
ケースドシステム間の誤り合成を回避した,最初の直接音声-話者パーシングモデルWav2を提案する。
実験結果から,Wav2は誤差混成を回避し,ベースラインの精度を最大2.5%向上させることで最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-05-21T19:26:46Z) - STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing [64.80483736666123]
文脈依存型テキスト・ツー・パースのための新しい事前学習フレームワークSTARを提案する。
さらに,STARを事前学習するための大規模コンテキスト依存型テキスト対話コーパスを構築した。
大規模な実験により、STARは2つの下流ベンチマークで新しい最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2022-10-21T11:30:07Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder
for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。
また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。
スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-03-14T09:49:15Z) - Tracking Interaction States for Multi-Turn Text-to-SQL Semantic Parsing [44.0348697408427]
マルチターンテキスト・ツー・セマンティクスのタスクは、自然言語発話を対話からsqlクエリに変換することを目的としている。
グラフ関係ネットワークと非線形層は、2つの状態の表現をそれぞれ更新するように設計されている。
提案手法の有効性を示すため,coデータセットに挑戦する実験を行った。
論文 参考訳(メタデータ) (2020-12-09T11:59:58Z) - A Tale of Two Linkings: Dynamically Gating between Schema Linking and
Structural Linking for Text-to-SQL Parsing [25.81069211061945]
Text-to- semantic parsingでは、生成したsqlクエリの正しいエンティティを選択することは重要かつ困難である。
この課題に対処するための2つのリンクプロセス: 明示的なNLの言及をデータベースにリンクするスキーマリンクと、出力sqlのエンティティとデータベーススキーマの構造的関係をリンクする構造的リンク。
提案手法を2つのグラフニューラルネットワークに基づくセマンティクスとBERT表現と統合することにより,課題となるスパイダーデータセットのパース精度が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2020-09-30T17:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。