論文の概要: Datrics Text2SQL: A Framework for Natural Language to SQL Query Generation
- arxiv url: http://arxiv.org/abs/2506.12234v1
- Date: Thu, 03 Apr 2025 21:09:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.634428
- Title: Datrics Text2SQL: A Framework for Natural Language to SQL Query Generation
- Title(参考訳): Datrics Text2SQL:SQLクエリ生成のための自然言語フレームワーク
- Authors: Tetiana Gladkykh, Kyrylo Kirykov,
- Abstract要約: 本稿では,構造化ドキュメンテーション,サンプルベース学習,ドメイン固有のルールを活用することで,正確なsqlクエリを生成するためのRAG(Retrieval-Augmented Generation)ベースのフレームワークを提案する。
アーキテクチャ、トレーニング方法論、検索ロジックについて詳述し、システムがどのようにユーザ意図とデータベース構造の間のギャップを、専門知識を必要とせずに埋めるかを強調した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-SQL systems enable users to query databases using natural language, democratizing access to data analytics. However, they face challenges in understanding ambiguous phrasing, domain-specific vocabulary, and complex schema relationships. This paper introduces Datrics Text2SQL, a Retrieval-Augmented Generation (RAG)-based framework designed to generate accurate SQL queries by leveraging structured documentation, example-based learning, and domain-specific rules. The system builds a rich Knowledge Base from database documentation and question-query examples, which are stored as vector embeddings and retrieved through semantic similarity. It then uses this context to generate syntactically correct and semantically aligned SQL code. The paper details the architecture, training methodology, and retrieval logic, highlighting how the system bridges the gap between user intent and database structure without requiring SQL expertise.
- Abstract(参考訳): テキストからSQLへのシステムでは、自然言語を使ってデータベースをクエリでき、データ分析へのアクセスを民主化できる。
しかし、あいまいな言い回し、ドメイン固有の語彙、複雑なスキーマ関係を理解することの難しさに直面している。
本稿では,構造化ドキュメンテーション,例ベースの学習,ドメイン固有のルールを活用することで,正確なSQLクエリを生成するように設計された検索型生成(RAG)ベースのフレームワークであるDatrics Text2SQLを紹介する。
このシステムは、データベースドキュメントと質問クエリの例からリッチな知識ベースを構築し、ベクター埋め込みとして格納され、セマンティックな類似性を通じて検索される。
次に、このコンテキストを使用して、構文的に正確でセマンティックに整合したSQLコードを生成する。
この記事では、アーキテクチャ、トレーニング方法論、検索ロジックを詳述し、SQLの専門知識を必要とせずに、システムがユーザ意図とデータベース構造の間のギャップを埋める方法について説明している。
関連論文リスト
- Text2VectorSQL: Bridging Text-to-SQL and Vector Search for Unified Natural Language Queries [19.61835087779078]
Text2 - Text-to-とベクトル検索を統合する新しいフレームワークを紹介する。
Text2はセマンティックフィルタリング、マルチモーダルマッチング、検索アクセラレーションを可能にする。
合成データを用いた専用Text2モデルを開発し,ベースライン法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-06-29T03:17:42Z) - Knowledge Base Construction for Knowledge-Augmented Text-to-SQL [37.87911346522774]
本稿では,与えられたクエリに必要な知識を生成する基礎となる知識源であるテキスト・ツー・ワンの知識基盤を構築することを提案する。
私たちの知識ベースは包括的であり、利用可能なすべての質問と関連するデータベーススキーマの組み合わせに基づいて構築されます。
重なり合うデータベースシナリオと非重なり合うデータベースシナリオの両方を考慮して、複数のテキストから1つのデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2025-05-28T08:17:58Z) - Structure Guided Large Language Model for SQL Generation [14.079764882536077]
構造対応型テキスト・ツー・クエリ・フレームワーク(SGU)を提案する。
SGU対応のテキスト・ツー・クエリ・フレームワーク(SGU)は、最先端のテキスト・ツー・モデルよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-02-19T09:07:59Z) - dIR -- Discrete Information Retrieval: Conversational Search over
Unstructured (and Structured) Data with Large Language Models [0.16060477887377675]
本稿では,自由テキストと構造化知識の両方を問う統一インターフェースとして,dIR,disrete Information Retrievalを提案する。
我々は、独自の質問/回答データセットを用いて、我々のアプローチを検証し、dIRがフリーテキスト上で全く新しいクエリーのクラスを作成できると結論付けた。
論文 参考訳(メタデータ) (2023-12-20T18:41:44Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Prompting GPT-3.5 for Text-to-SQL with De-semanticization and Skeleton
Retrieval [17.747079214502673]
Text-to-は、自然言語の質問を構造化されたクエリ言語()に変換し、データベースから情報を取得するタスクである。
本稿では,テキスト・トゥ・テキストのための LLM ベースのフレームワークを提案する。
我々は,疑問骨格を抽出する非意味化機構を設計し,その構造的類似性に基づいて類似した例を検索する。
論文 参考訳(メタデータ) (2023-04-26T06:02:01Z) - Towards Generalizable and Robust Text-to-SQL Parsing [77.18724939989647]
本稿では,タスク分解,知識獲得,知識構成からなる新しいTKKフレームワークを提案する。
このフレームワークは,Spider,SParC,Co.データセット上でのすべてのシナリオと最先端のパフォーマンスに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T09:21:27Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。