論文の概要: Knowledge-to-SQL: Enhancing SQL Generation with Data Expert LLM
- arxiv url: http://arxiv.org/abs/2402.11517v2
- Date: Thu, 7 Mar 2024 13:43:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 16:57:09.426043
- Title: Knowledge-to-SQL: Enhancing SQL Generation with Data Expert LLM
- Title(参考訳): Knowledge-to-SQL: データエキスパートLLMによるSQL生成の強化
- Authors: Zijin Hong, Zheng Yuan, Hao Chen, Qinggang Zhang, Feiran Huang, Xiao
Huang
- Abstract要約: 既存のモデルは、データベーススキーマに従ってthesqlを生成するために、Large Language Modelsの能力に依存している。
我々は,あらゆるタイプのテキスト・トゥ・エキスパート・モデルに対して,適切な知識を利用する知識・ツー・エキスパート・フレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.836007408933693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating accurate SQL for user queries (text-to-SQL) is a long-standing
problem since the generation of the SQL requires comprehending the query and
database and retrieving the accurate data from the database accordingly.
Existing models rely on the comprehensive ability of Large Language Models
(LLMs) to generate the SQL according to the database schema. However, there is
some necessary knowledge that is not explicitly included in the database schema
or has been learned by LLMs. Thus, the generated SQL of the
knowledge-insufficient queries may be inaccurate, which negatively impacts the
robustness of the text-to-SQL models. To deal with this situation, we propose
the Knowledge-to-SQL framework, which employs tailored Data Expert LLM (DELLM)
to provide helpful knowledge for all types of text-to-SQL models. Specifically,
we provide the detailed design of DELLM, in terms of table reading, and the
basic fine-tuning process. We further provide a Preference Learning via
Database Feedback (PLDBF) training strategy to guide the DELLM to generate more
helpful knowledge for LLMs. Extensive experiments verify DELLM can enhance the
state-of-the-art LLMs on text-to-SQL tasks. The model structure and the
parameter weight of DELLM are released for further research.
- Abstract(参考訳): ユーザクエリ(text-to-SQL)に対する正確なSQLの生成は、SQLの生成がクエリとデータベースを補完し、データベースから正確なデータを取得する必要があるため、長年にわたる問題である。
既存のモデルはデータベーススキーマに従ってSQLを生成するためのLLM(Large Language Models)の包括的な能力に依存している。
しかし、データベーススキーマに明示的に含まれていない、あるいはllmsによって学習された必要な知識がある。
したがって、生成した知識不足クエリのsqlは不正確であり、テキスト対sqlモデルのロバスト性に悪影響を及ぼす可能性がある。
この状況に対処するため,データエキスパートのLLM(DELLM)を用いて,すべてのタイプのテキスト・トゥ・SQLモデルに有用な知識を提供するKnowledge-to-SQLフレームワークを提案する。
具体的には,DELLMの詳細設計とテーブル読解,および基礎的な微調整プロセスについて述べる。
さらに、PLDBF(Preference Learning via Database Feedback)トレーニング戦略を提供し、DELLMを誘導し、LLMのより有用な知識を生成する。
大規模な実験により、DELLMはテキストからSQLタスクにおける最先端のLLMを強化することができる。
DELLMのモデル構造とパラメータ重量は、さらなる研究のために公表される。
関連論文リスト
- CoE-SQL: In-Context Learning for Multi-Turn Text-to-SQL with Chain-of-Editions [22.493487741249716]
大規模言語モデル(LLM)は、様々なドメインやタスクにおいて印象的な機能を持つことが実証されている。
マルチターンテキスト・ツー・タスクにおけるプロンプト設計の問題について検討し,LLMの推論能力の向上を図る。
論文 参考訳(メタデータ) (2024-05-04T16:56:14Z) - PURPLE: Making a Large Language Model a Better SQL Writer [14.627323505405327]
NL2タスクに必要な論理演算子構成を含む実演を検索することで精度を向上させるPURPLEを提案する。
PURPLEは、一般的なNL2ベンチマークの検証セット上で80.5%の正確な一致精度と87.8%の実行一致精度という、最先端の新たなパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-03-29T07:01:29Z) - PET-SQL: A Prompt-enhanced Two-stage Text-to-SQL Framework with Cross-consistency [19.067737007347613]
スパイダーベンチマークで新しいSOTA結果が得られ、実行精度は87.6%である。
提案手法は, 87.6%の精度で, スパイダーベンチマークで新しいSOTA結果が得られる。
論文 参考訳(メタデータ) (2024-03-13T02:32:41Z) - Optimizing LLM Queries in Relational Workloads [58.254894049950366]
本稿では,LLMをリレーショナルクエリ内で実行する解析処理に対して,LLM(Large Language Models)推論を最適化する方法を示す。
私たちはこれらの最適化をApache Sparkで実装し、vLLMをバックエンドとして提供しています。
実データセット上の多様なLLMベースのクエリのベンチマークで、エンドツーエンドのレイテンシを最大4.4倍改善する。
論文 参考訳(メタデータ) (2024-03-09T07:01:44Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [48.523327752786585]
我々は,新しいテキスト・ツー・データベース・ベースのマルチエージェント・コラボレーティブ・フレームワークであるMACを紹介する。
本フレームワークは,テキスト・ツー・ジェネレーションのためのコア・デコンポーザ・エージェントと,数発のチェーン・オブ・シークレット・推論を備える。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、GPT-4のようにCode 7Bを活用して、オープンソースの命令フォローモデルsql-Llamaを微調整する。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z) - SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文 参考訳(メタデータ) (2023-08-29T14:59:54Z) - Interleaving Pre-Trained Language Models and Large Language Models for
Zero-Shot NL2SQL Generation [23.519727682763644]
ZeroNL2は、新しい環境に適応する自然言語のtosqlの実現に不可欠である。
既存のアプローチは、データに基づいた微調整事前学習言語モデル(PLM)か、ChatGPTのような固定された大言語モデル(LLM)をガイドするプロンプトを使用する。
ゼロショットNL2をサポートするために, PLM と LLM の相補的な利点を組み合わせた ZeroNL2 フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-15T06:50:51Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - Table Meets LLM: Can Large Language Models Understand Structured Table
Data? A Benchmark and Empirical Study [47.6239689986714]
大規模言語モデル(LLM)は、自然言語(NL)に関連する課題を解決するために、数ショットの推論器として魅力的になってきている。
我々は,LLMの構造理解能力(SUC)を評価するためのベンチマークを設計することで,これを理解しようとしている。
その結果、テーブル入力形式、コンテンツ順序、ロールプロンプト、パーティションマークなど、いくつかの入力選択によってパフォーマンスが変化していることが判明した。
論文 参考訳(メタデータ) (2023-05-22T14:23:46Z) - Querying Large Language Models with SQL [16.383179496709737]
多くのユースケースでは、情報はテキストに格納されるが、構造化データでは利用できない。
事前訓練されたLarge Language Models (LLMs) の台頭に伴い、大量のテキストコーパスから抽出された情報を保存および使用するための効果的なソリューションが現在存在する。
本稿では,従来のデータベースアーキテクチャに基づくプロトタイプであるGaloisについて紹介する。
論文 参考訳(メタデータ) (2023-04-02T06:58:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。