論文の概要: On Repairing Natural Language to SQL Queries
- arxiv url: http://arxiv.org/abs/2310.03866v1
- Date: Thu, 5 Oct 2023 19:50:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 04:23:56.292123
- Title: On Repairing Natural Language to SQL Queries
- Title(参考訳): SQLクエリに対する自然言語の修復について
- Authors: Aidan Z.H. Yang, Ricardo Brancas, Pedro Esteves, Sofia Aparicio, Joao
Pedro Nadkarni, Miguel Terra-Neves, Vasco Manquinho, Ruben Martins
- Abstract要約: テキスト・ツー・ツールが正しいクエリーを返すことができないときの分析を行う。
返されるクエリが正しいクエリに近い場合がよくあります。
突然変異に基づく手法を用いて、これらの故障クエリを修復することを提案する。
- 参考スコア(独自算出の注目度): 2.5442795971328307
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Data analysts use SQL queries to access and manipulate data on their
databases. However, these queries are often challenging to write, and small
mistakes can lead to unexpected data output. Recent work has explored several
ways to automatically synthesize queries based on a user-provided
specification. One promising technique called text-to-SQL consists of the user
providing a natural language description of the intended behavior and the
database's schema. Even though text-to-SQL tools are becoming more accurate,
there are still many instances where they fail to produce the correct query.
In this paper, we analyze when text-to-SQL tools fail to return the correct
query and show that it is often the case that the returned query is close to a
correct query. We propose to repair these failing queries using a
mutation-based approach that is agnostic to the text-to-SQL tool being used. We
evaluate our approach on two recent text-to-SQL tools, RAT-SQL and SmBoP, and
show that our approach can repair a significant number of failing queries.
- Abstract(参考訳): データアナリストはSQLクエリを使用して、データベース上のデータにアクセスし、操作する。
しかし、これらのクエリは書き込みが難しく、小さなミスが予期しないデータ出力につながる可能性がある。
最近の研究は、ユーザが提供する仕様に基づいてクエリを自動的に合成する方法をいくつか検討している。
Text-to-SQLと呼ばれる有望なテクニックは、ユーザが意図した振る舞いとデータベースのスキーマを自然言語で記述することである。
テキストからSQLへのツールはより正確になっていますが、正しいクエリを生成できないケースはたくさんあります。
本稿では,text-to-sqlツールが正しいクエリを返さない場合を分析し,返されたクエリが正しいクエリに近い場合が多いことを示す。
我々は、使用するテキストからSQLツールに依存しない突然変異ベースのアプローチを用いて、これらのエラークエリを修復することを提案する。
RAT-SQLとSmBoPという2つの最近のテキスト-SQLツールに対する我々のアプローチを評価し、我々のアプローチが大量の失敗するクエリを修復できることを示す。
関連論文リスト
- E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.187832944550453]
E-レポジトリは、直接スキーマリンクと候補述語拡張による課題に対処するために設計された新しいパイプラインである。
E-は、関連するデータベースアイテム(テーブル、列、値)と条件を質問に直接組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。
本研究では,従来の研究で広く研究されてきた手法であるスキーマフィルタリングの影響について検討し,先進的な大規模言語モデルと並行して適用した場合のリターンの低下を実証する。
論文 参考訳(メタデータ) (2024-09-25T09:02:48Z) - DAC: Decomposed Automation Correction for Text-to-SQL [51.48239006107272]
De Automation Correction (DAC)を導入し、エンティティリンクとスケルトン解析を分解することでテキストから合成を補正する。
また,本手法では,ベースライン法と比較して,スパイダー,バード,カグルDBQAの平均値が平均3.7%向上することを示した。
論文 参考訳(メタデータ) (2024-08-16T14:43:15Z) - SQLFixAgent: Towards Semantic-Accurate Text-to-SQL Parsing via Consistency-Enhanced Multi-Agent Collaboration [26.193588535592767]
本稿では,SQLの誤検出と修復を目的とした,新しい一貫性向上型マルチエージェント協調フレームワークを提案する。
提案したフレームワークを5つのテキスト・テキスト・ベンチマークで評価し,特にBirdベンチマークで3%以上の改善を実現した。
当社のフレームワークは,他の高度なメソッドと比較してトークン効率も高く,競争力も向上しています。
論文 参考訳(メタデータ) (2024-06-19T09:57:19Z) - SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL Translation [16.07396492960869]
本稿では,テキストからテキストへの変換処理に特化して設計されたトランスフォーマーアーキテクチャを提案する。
我々のモデルは、実行可能層とデコーダ層に構造的帰納バイアスを組み込んで、クエリを自動で抽象構文木(AST)として予測する。
論文 参考訳(メタデータ) (2023-10-27T00:13:59Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Interactive Text-to-SQL Generation via Editable Step-by-Step
Explanations [31.3376894001311]
本稿では,ユーザがクエリのステップバイステップ説明を直接編集してエラーを修正する,新たなインタラクションメカニズムを提案する。
複数のデータセットに対する我々の実験は、24人の参加者を持つユーザとともに、我々のアプローチが複数のSOTAアプローチより優れていることを実証している。
論文 参考訳(メタデータ) (2023-05-12T10:45:29Z) - Know What I don't Know: Handling Ambiguous and Unanswerable Questions
for Text-to-SQL [36.5089235153207]
既存のtext-to-Yourself は任意のユーザ質問に対して "plausible" クエリを生成する。
本稿では,不明瞭かつ解決不可能な例を自動的に生成する,シンプルで効果的な生成手法を提案する。
実験結果から,実例と生成例の両方において,本モデルが最も優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2022-12-17T15:32:00Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。