論文の概要: SQL Query Engine: A Self-Healing LLM Pipeline for Natural Language to PostgreSQL Translation
- arxiv url: http://arxiv.org/abs/2604.16511v1
- Date: Wed, 15 Apr 2026 06:59:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.039824
- Title: SQL Query Engine: A Self-Healing LLM Pipeline for Natural Language to PostgreSQL Translation
- Title(参考訳): SQL Query Engine: 自然言語からPostgreSQL翻訳のための自己修復型LLMパイプライン
- Authors: Muhammad Adeel Ijaz,
- Abstract要約: 自然言語質問を2段階のLLMパイプラインを通じて検証されたクエリに変換する,オープンソースのセルフホストサービスを提案する。
5つのLCMバックエンド(75の質問、3のデータベース)で自己修復ループが+9.3ppの精度で得られるように評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present SQL Query Engine, an open-source, self-hosted service that translates natural language questions into validated PostgreSQL queries through a two-stage LLM pipeline. The first stage performs automatic schema introspection and SQL generation; a multi-strategy response parser extracts SQL from any LLM output format (JSON, code blocks, or raw text) without requiring structured output APIs. The second stage executes the query against PostgreSQL and, upon failure or empty results, enters an iterative self-healing loop in which the LLM diagnoses the error using full SQLSTATE codes and PostgreSQL diagnostic messages. Two mechanisms prevent regressions: early-accept returns successful queries immediately without LLM re-evaluation, and best-result tracking preserves the best partial result across retries. Schema context is cached per session in Redis, progress events stream via Redis Pub/Sub and SSE, and an OpenAI-compatible /v1/chat/completions endpoint lets existing tools work without modification. All database connections are read-only at the driver level. We evaluate across five LLM backends on a synthetic benchmark (75 questions, three databases) where the self-healing loop yields up to +9.3pp accuracy gains with zero regressions on the best model (Llama 4 Scout 17B, 57.3%), and on BIRD (437 questions, 11 databases migrated from SQLite to PostgreSQL) where the full pipeline reaches 49.0% execution accuracy (GPT-OSS-120B, +4.6pp). Source code: https://github.com/codeadeel/sqlqueryengine.
- Abstract(参考訳): SQL Query Engineはオープンソースのセルフホスト型サービスで、自然言語の質問を2段階のLLMパイプラインを通じて検証済みのPostgreSQLクエリに変換する。
マルチストラテジー応答パーサは、構造化された出力APIを必要とせずに、任意のLCM出力フォーマット(JSON、コードブロック、あるいは生のテキスト)からSQLを抽出する。
第2ステージはPostgreSQLに対するクエリを実行し、失敗または空の結果として、LLMが完全なSQLSTATEコードとPostgreSQL診断メッセージを使用してエラーを診断する反復的な自己修復ループに入る。
早期アクセプションはLSMの再評価なしに即座にクエリを返却し、ベストリサートトラッキングは再試行で最高の部分的な結果を保持する。
スキーマコンテキストはRedisのセッション毎にキャッシュされ、Redis Pub/SubおよびSSE経由でのプログレッシブイベントストリーム、OpenAI互換の/v1/chat/completionsエンドポイントにより、既存のツールが変更することなく動作する。
すべてのデータベース接続はドライバレベルで読み取り専用である。
Llama 4 Scout 17B, 57.3%)とBIRD(437の質問、SQLiteからPostgreSQLへ移行した11のデータベース)では、完全なパイプラインが49.0%の実行精度(GPT-OSS-120B, +4.6pp)に達する。
ソースコードはhttps://github.com/codeadeel/sqlqueryengine。
関連論文リスト
- Dialect-Agnostic SQL Parsing via LLM-Based Segmentation [7.41731253317229]
本稿では,文法に基づく構文解析とLLMに基づくセグメンテーションを統合し,方言を頑健に解析する新しい問合せ書き換えフレームワークを提案する。
我々の中核となる考え方は、階層解析を逐次セグメンテーションタスクに分解することであり、LLMの強度とよりよく一致する。
独立した評価では、8つの方言で91.55%から100%のクエリを解析し、すべてのベースラインを上回っている。
論文 参考訳(メタデータ) (2026-03-17T06:18:37Z) - LLMSQL: Upgrading WikiSQL for the LLM Era of Text-to-SQL [0.2799896314754614]
本稿では,Wiki の体系的な改訂と変換である LLM について述べる。
これらのエラーを分類し、クリーニングと再アノテーションのための自動メソッドを実装します。
LLMはアップデートとして機能するのではなく、LLM対応のベンチマークとして導入された。
論文 参考訳(メタデータ) (2025-09-27T15:08:43Z) - PARROT: A Benchmark for Evaluating LLMs in Cross-System SQL Translation [21.0303026118673]
本稿では CrOss-System SQL Translation のための実践的で現実的なベンチマック PARROT を紹介する。
PARROTは38のオープンソースベンチマークと実世界のビジネスサービスから598の翻訳ペアで構成されている。
28,003 の PARROT-Diverse や 5,306 のサンプルを持つ PARROT-Simple など,複数のベンチマーク版も提供しています。
論文 参考訳(メタデータ) (2025-09-27T14:41:13Z) - SQLens: An End-to-End Framework for Error Detection and Correction in Text-to-SQL [20.93676525997898]
テキスト・トゥ・ザ・ボックス・システムによって生成される大規模言語モデル(LLM)における意味的誤りの詳細な検出と修正のためのエンドツーエンドフレームワークを提案する。
提案手法は誤り検出のためのF1の25.78%の自己評価法よりも優れた性能を示し,アウト・オブ・ザ・ボックスシステムの実行精度を最大20%向上させる。
論文 参考訳(メタデータ) (2025-06-04T22:25:47Z) - Weaver: Interweaving SQL and LLM for Table Reasoning [62.55797244714265]
Weaverは、構造化データ検索のためのsqlとセマンティック処理のためのLLMを組み合わせたフレキシブルなステップバイステッププランを生成する。
Weaverは、4つのTableQAデータセットで、最先端のメソッドを一貫して上回る。
論文 参考訳(メタデータ) (2025-05-25T03:27:37Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - Analyzing the Effectiveness of Large Language Models on Text-to-SQL
Synthesis [4.412170175171256]
本研究では,大規模言語モデルを用いたテキスト・ツー・プログラム合成における様々なアプローチについて検討する。
目標は、データベーススキーマと共に自然言語の質問を入力し、正しいSELECTクエリを出力することであった。
論文 参考訳(メタデータ) (2024-01-22T22:05:42Z) - Allies: Prompting Large Language Model with Beam Search [107.38790111856761]
本研究では,ALIESと呼ばれる新しい手法を提案する。
入力クエリが与えられた場合、ALLIESはLLMを活用して、元のクエリに関連する新しいクエリを反復的に生成する。
元のクエリのスコープを反復的に精錬して拡張することにより、ALLIESは直接検索できない隠れた知識をキャプチャし、利用する。
論文 参考訳(メタデータ) (2023-05-24T06:16:44Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。