論文の概要: CUBES: A Parallel Synthesizer for SQL Using Examples
- arxiv url: http://arxiv.org/abs/2203.04995v2
- Date: Thu, 1 Feb 2024 13:49:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-02 20:12:17.768470
- Title: CUBES: A Parallel Synthesizer for SQL Using Examples
- Title(参考訳): CUBES: 例を使ってSQLの並列シンセサイザー
- Authors: Ricardo Brancas, Miguel Terra-Neves, Miguel Ventura, Vasco Manquinho
and Ruben Martins
- Abstract要約: CUBESはインプット・アウトプットの例を用いたSQLクエリのドメインのための並列プログラムシンセサイザーである。
CUBESは、ユーザと対話し、返されるクエリがユーザの意図と一致するという自信を高めるファジィング技術に基づく、新たな曖昧化手順を取り入れている。
- 参考スコア(独自算出の注目度): 2.4374097382908477
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years, more people have seen their work depend on data manipulation
tasks. However, many of these users do not have the background in programming
required to write complex programs, particularly SQL queries. One way of
helping these users is automatically synthesizing the SQL query given a small
set of examples. Several program synthesizers for SQL have been recently
proposed, but they do not leverage multicore architectures.
This paper proposes CUBES, a parallel program synthesizer for the domain of
SQL queries using input-output examples. Since input-output examples are an
under-specification of the desired SQL query, sometimes, the synthesized query
does not match the user's intent. CUBES incorporates a new disambiguation
procedure based on fuzzing techniques that interacts with the user and
increases the confidence that the returned query matches the user intent.
We perform an extensive evaluation on around 4000 SQL queries from different
domains. Experimental results show that our sequential version can solve more
instances than other state-of-the-art SQL synthesizers. Moreover, the parallel
approach can scale up to 16 processes with super-linear speedups for many hard
instances. Our disambiguation approach is critical to achieving an accuracy of
around 60%, significantly larger than other SQL synthesizers.
- Abstract(参考訳): 近年、多くの人が自分の仕事がデータ操作のタスクに依存していると見ている。
しかし、これらのユーザの多くは複雑なプログラム、特にSQLクエリを書くのに必要なプログラミングのバックグラウンドを持っていません。
これらのユーザを支援する一つの方法は、少数の例からSQLクエリを自動的に合成することです。
SQL用のプログラムシンセサイザーが最近提案されているが、マルチコアアーキテクチャは利用していない。
本稿では,入力出力例を用いてSQLクエリのドメインを並列に生成するCUBESを提案する。
入力出力の例は所望のsqlクエリの下位仕様であるため、合成されたクエリはユーザの意図と一致しない場合がある。
CUBESは、ユーザと対話し、返されるクエリがユーザの意図と一致するという自信を高めるファジィング技術に基づく、新たな曖昧化手順を取り入れている。
我々は、異なるドメインから約4000のSQLクエリを広範囲に評価する。
実験の結果、シーケンシャルバージョンは他の最先端sqlシンセサイザーよりも多くのインスタンスを解決できることがわかった。
さらに、並列アプローチは16プロセスまでスケールアップでき、多くのハードインスタンスで超線形スピードアップを行うことができる。
我々の曖昧なアプローチは、他のSQLシンセサイザーよりもはるかに大きい約60%の精度を達成するために重要である。
関連論文リスト
- SAFE-SQL: Self-Augmented In-Context Learning with Fine-grained Example Selection for Text-to-SQL [4.252699657665555]
骨格メイク選択のような従来のアプローチは、大きな言語モデル(LLM)をガイドするために類似したトレーニング例を取得することで、関連性を示している。
テキスト・トゥ・コンテクスト・フィルタリング(SAFE--)のためのきめ細かい例選択による学習における自己拡張を提案する。
SAFEの生成したサンプルは、以前の強力なパフォーマンスと、より高い実行精度を達成するために、テキストからテキストへのほとんどショットのフレームワークを上回っている。
特に、我々のアプローチは、従来のメソッドがしばしば失敗する、余分な困難で目に見えないシナリオにおいて、さらなるパフォーマンス向上を提供します。
論文 参考訳(メタデータ) (2025-02-17T04:52:24Z) - Exploring the Use of LLMs for SQL Equivalence Checking [15.42143912008553]
2sqlクエリの等価チェックは難解な問題である。
既存の方法は、有界同値チェックであっても、sqlの小さなサブセットのみを扱うことができる。
本稿では,大言語モデル (LLM) が withsql クエリを推論する能力を示すことができるかどうかを考察する。
論文 参考訳(メタデータ) (2024-12-07T06:50:12Z) - MSc-SQL: Multi-Sample Critiquing Small Language Models For Text-To-SQL Translation [10.205010004198757]
テキスト・ツー・ジェネレーションは、非専門家が自然言語でデータベースと対話することを可能にする。
GPT-4のような大規模クローズドソースモデルの最近の進歩は、アクセシビリティ、プライバシ、レイテンシの課題を提示している。
我々は、小型で効率的でオープンソースのテキスト・ツー・ジェネレーション・モデルの開発に注力する。
論文 参考訳(メタデータ) (2024-10-16T18:03:24Z) - SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Wav2SQL: Direct Generalizable Speech-To-SQL Parsing [55.10009651476589]
Speech-to-Spider (S2Spider) は、与えられたデータベースに対する音声質問をsqlクエリに変換することを目的としている。
ケースドシステム間の誤り合成を回避した,最初の直接音声-話者パーシングモデルWav2を提案する。
実験結果から,Wav2は誤差混成を回避し,ベースラインの精度を最大2.5%向上させることで最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-05-21T19:26:46Z) - S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder
for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。
また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。
スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-03-14T09:49:15Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z) - "What Do You Mean by That?" A Parser-Independent Interactive Approach
for Enhancing Text-to-SQL [49.85635994436742]
ループ内に人間を包含し,複数質問を用いてユーザと対話する,新規非依存型対話型アプローチ(PIIA)を提案する。
PIIAは、シミュレーションと人的評価の両方を用いて、限られたインタラクションターンでテキストとドメインのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-11-09T02:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。