論文の概要: Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL
- arxiv url: http://arxiv.org/abs/2406.08426v4
- Date: Sun, 23 Feb 2025 22:22:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:49:41.592835
- Title: Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL
- Title(参考訳): 次世代データベースインタフェース: LLM-based Text-to-SQL の調査
- Authors: Zijin Hong, Zheng Yuan, Qinggang Zhang, Hao Chen, Junnan Dong, Feiran Huang, Xiao Huang,
- Abstract要約: 大規模言語モデル(LLM)は、モデルスケールが増大するにつれて、自然言語理解において重要な能力を示している。
LLMは、テキスト・ツー・リサーチにユニークな機会、改善、ソリューションをもたらすことができる。
- 参考スコア(独自算出の注目度): 15.75829309721909
- License:
- Abstract: Generating accurate SQL from users' natural language questions (text-to-SQL) remains a long-standing challenge due to the complexities involved in user question understanding, database schema comprehension, and SQL generation. Traditional text-to-SQL systems, which combine human engineering and deep neural networks, have made significant progress. Subsequently, pre-trained language models (PLMs) have been developed for text-to-SQL tasks, achieving promising results. However, as modern databases and user questions grow more complex, PLMs with a limited parameter size often produce incorrect SQL. This necessitates more sophisticated and tailored optimization methods, which restricts the application of PLM-based systems. Recently, large language models (LLMs) have shown significant capabilities in natural language understanding as model scale increases. Thus, integrating LLM-based solutions can bring unique opportunities, improvements, and solutions to text-to-SQL research. In this survey, we provide a comprehensive review of existing LLM-based text-to-SQL studies. Specifically, we offer a brief overview of the technical challenges and evolutionary process of text-to-SQL. Next, we introduce the datasets and metrics designed to evaluate text-to-SQL systems. Subsequently, we present a systematic analysis of recent advances in LLM-based text-to-SQL. Finally, we make a summarization and discuss the remaining challenges in this field and suggest expectations for future research directions.
- Abstract(参考訳): ユーザの自然言語質問(text-to-SQL)から正確なSQLを生成することは、ユーザ質問の理解、データベーススキーマの理解、SQL生成にまつわる複雑さのため、長年にわたる課題である。
人間のエンジニアリングとディープニューラルネットワークを組み合わせた従来のテキスト・トゥ・SQLシステムは、大きな進歩を遂げた。
その後、テキストからSQLタスクのための事前学習言語モデル(PLM)が開発され、有望な結果が得られた。
しかし、現代のデータベースやユーザ質問が複雑化するにつれて、パラメータサイズが制限されたPLMは、しばしば誤ったSQLを生成する。
これはより洗練された最適化手法を必要とし、PLMベースのシステムの適用を制限する。
近年,大規模言語モデル (LLM) は,モデルスケールが増大するにつれて,自然言語理解において重要な能力を示している。
したがって、LLMベースのソリューションを統合することで、テキスト-SQL研究にユニークな機会、改善、ソリューションをもたらすことができる。
本調査では,既存の LLM ベースのテキスト-SQL 研究の総合的なレビューを行う。
具体的には,テキストからSQLへの技術的課題と進化過程について概説する。
次に,テキスト・トゥ・SQLシステムを評価するために設計されたデータセットとメトリクスを紹介する。
その後、LLMベースのテキスト・トゥ・SQLの最近の進歩を体系的に分析する。
最後に,本分野における課題を要約し,今後の研究方向性への期待を述べる。
関連論文リスト
- Bridging the Gap: Enabling Natural Language Queries for NoSQL Databases through Text-to-NoSQL Translation [25.638927795540454]
自然言語クエリをアクセス可能なクエリに変換することを目的としたText-to-Noタスクを導入する。
この分野での研究を促進するために、我々はTEND(Text-to-Noデータセットのショートインターフェース)という、このタスクのための大規模かつオープンソースのデータセットをリリースした。
また,SLM(Small Language Model)支援とRAG(Retrieval-augmented Generation)支援の多段階フレームワークSMARTを設計した。
論文 参考訳(メタデータ) (2025-02-16T17:01:48Z) - A Survey of Large Language Model-Based Generative AI for Text-to-SQL: Benchmarks, Applications, Use Cases, and Challenges [0.7889270818022226]
自然言語クエリを構造化クエリ言語(技術)に変換することで,データベースとのスムーズな対話を容易にする
この調査は、AI駆動のテキスト・ツー・ワンシステムの進化の概要を提供する。
医療、教育、金融といった分野におけるテキスト・ツー・ワンの適用について検討する。
論文 参考訳(メタデータ) (2024-12-06T17:36:28Z) - PTD-SQL: Partitioning and Targeted Drilling with LLMs in Text-to-SQL [54.304872649870575]
大規模言語モデル(LLM)は、テキスト・トゥ・センス・タスクの強力なツールとして登場した。
本研究では,クエリグループパーティショニングを用いることで,単一問題に特有の思考プロセスの学習に集中できることを示す。
論文 参考訳(メタデータ) (2024-09-21T09:33:14Z) - A Survey on Employing Large Language Models for Text-to-SQL Tasks [9.527891544418805]
リレーショナルデータベースにおけるデータ量の増加は、ユーザがデータにアクセスして分析する上での課題を引き起こします。
Text-to-sql (Text2) は自然言語処理(NLP)技術を用いて自然言語のintsqlクエリを変換することで問題を解決する。
LLM(Large Language Models)の開発により、LLMベースのText2メソッドが出現した。
論文 参考訳(メタデータ) (2024-07-21T14:48:23Z) - Relational Database Augmented Large Language Model [59.38841050766026]
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクに優れる。
彼らは、トレーニングや教師付き微調整プロセスを通じてのみ、新しい知識を取り入れることができる。
この正確で最新のプライベート情報は、通常リレーショナルデータベースに格納される。
論文 参考訳(メタデータ) (2024-07-21T06:19:10Z) - RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL [48.516004807486745]
文脈内学習を伴う大規模言語モデル(LLM)は、テキスト・ツー・タスクの性能を大幅に改善した。
In-context prompt Engineering のための新しい検索ベースフレームワーク RB- を提案する。
実験により,我々のモデルは,公開データセットのBIRDとSpiderの競合ベースラインよりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2024-07-11T08:19:58Z) - Knowledge-to-SQL: Enhancing SQL Generation with Data Expert LLM [15.888784472807775]
既存のメソッドは、クエリを生成するための大規模言語モデル(LLM)の包括的な機能に依存している。
我々は,すべてのテキスト・トゥ・モデルに対して適切な知識を利用する知識・ツー・データ・エキスパート・フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-18T09:10:04Z) - Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文 参考訳(メタデータ) (2023-08-29T14:59:54Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。