論文の概要: Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System
- arxiv url: http://arxiv.org/abs/2603.07449v1
- Date: Sun, 08 Mar 2026 03:56:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.599273
- Title: Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System
- Title(参考訳): Dial: 知識集約型方言特化NL2SQLシステム
- Authors: Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu,
- Abstract要約: ダイアル(Dial)は、方言固有のNL2のための知識基盤フレームワークである。
ダイアルは翻訳精度を10.25%、方言の特徴を15.77%改善している。
- 参考スコア(独自算出の注目度): 25.3445257884901
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Enterprises commonly deploy heterogeneous database systems, each of which owns a distinct SQL dialect with different syntax rules, built-in functions, and execution constraints. However, most existing NL2SQL methods assume a single dialect (e.g., SQLite) and struggle to produce queries that are both semantically correct and executable on target engines. Prompt-based approaches tightly couple intent reasoning with dialect syntax, rule-based translators often degrade native operators into generic constructs, and multi-dialect fine-tuning suffers from cross-dialect interference. In this paper, we present Dial, a knowledge-grounded framework for dialect-specific NL2SQL. Dial introduces: (1) a Dialect-Aware Logical Query Planning module that converts natural language into a dialect-aware logical query plan via operator-level intent decomposition and divergence-aware specification; (2) HINT-KB, a hierarchical intent-aware knowledge base that organizes dialect knowledge into (i) a canonical syntax reference, (ii) a declarative function repository, and (iii) a procedural constraint repository; and (3) an execution-driven debugging and semantic verification loop that separates syntactic recovery from logic auditing to prevent semantic drift. We construct DS-NL2SQL, a benchmark covering six major database systems with 2,218 dialect-specific test cases. Experimental results show that Dial consistently improves translation accuracy by 10.25% and dialect feature coverage by 15.77% over state-of-the-art baselines. The code is at https://github.com/weAIDB/Dial.
- Abstract(参考訳): 企業は一般的に異質なデータベースシステムをデプロイし、それぞれが異なる構文ルール、組み込み関数、実行制約を持つ異なるSQL方言を所有している。
しかし、既存のほとんどのNL2SQLメソッドは単一の方言(例えばSQLite)を仮定し、ターゲットエンジン上で意味論的に正しいクエリを生成するのに苦労している。
Promptベースのアプローチは、方言構文による密接に結合した推論、ルールベースのトランスレータはしばしばネイティブ演算子をジェネリックな構成に分解し、マルチダイアレクト微調整はクロスダイアレクト干渉に悩まされる。
本稿では,方言固有のNL2SQLのための知識基盤フレームワークであるDialについて述べる。
ダイアルは,(1)自然言語を操作者レベルでの意図分解と発散認識による論理的クエリ計画に変換するダイアレクト対応論理的クエリ計画モジュール,(2)方言知識を組織化する階層的意図認識知識基盤HINT-KB
(i)標準構文参照
(ii)宣言関数リポジトリ、及び
3)手続き的制約リポジトリ,(3)セマンティックリカバリとロジック監査を分離してセマンティックリカバリを防止する実行駆動デバッグとセマンティックバリデーションループ。
2,218の方言固有のテストケースを持つ6つの主要データベースシステムを対象としたベンチマークであるDS-NL2SQLを構築した。
実験の結果、ダイアルは翻訳精度を10.25%改善し、方言の特徴は最先端のベースラインよりも15.77%向上した。
コードはhttps://github.com/weAIDB/Dial.comにある。
関連論文リスト
- Datrics Text2SQL: A Framework for Natural Language to SQL Query Generation [0.0]
本稿では,構造化ドキュメンテーション,サンプルベース学習,ドメイン固有のルールを活用することで,正確なsqlクエリを生成するためのRAG(Retrieval-Augmented Generation)ベースのフレームワークを提案する。
アーキテクチャ、トレーニング方法論、検索ロジックについて詳述し、システムがどのようにユーザ意図とデータベース構造の間のギャップを、専門知識を必要とせずに埋めるかを強調した。
論文 参考訳(メタデータ) (2025-04-03T21:09:59Z) - Valid Text-to-SQL Generation with Unification-based DeepStochLog [13.798222228959132]
本稿では,統一に基づく定節文法を用いた構文制約とスキーマ制約を課すニューロシンボリック・フレームワークを提案する。
私たちのフレームワークは、自然言語理解能力を活用するために、言語モデルに対する双方向インターフェースも構築しています。
この作業は、統一ベースの文法で言語モデルを拡張するための最初のステップである。
論文 参考訳(メタデータ) (2025-03-17T16:21:10Z) - Disambiguate First, Parse Later: Generating Interpretations for Ambiguity Resolution in Semantic Parsing [56.82807063333088]
本稿では, 自然言語の解釈を論理形式にマッピングする前に, あいまいさを解消するモジュラー手法を提案する。
我々のアプローチは解釈のカバレッジを改善し、異なるアノテーションスタイル、データベース構造、あいまいさタイプを持つデータセットをまたいだ一般化を行う。
論文 参考訳(メタデータ) (2025-02-25T18:42:26Z) - SQL-GEN: Bridging the Dialect Gap for Text-to-SQL Via Synthetic Data And Model Merging [30.306023265985658]
あらゆる方言に対して高品質な合成学習データを生成するためのフレームワークを提案する。
本稿では,方言間の共有知識を活用する新しいMixture-of-Experts(MoE)を提案する。
論文 参考訳(メタデータ) (2024-08-22T20:50:48Z) - Improved NL2SQL based on Multi-layer Expert Network [5.921227229250013]
本研究では,マルチタスク階層型ネットワークを利用したMulti-Layer Expert Generate SQL (MLEG-)という新しい手法を提案する。
ネットワークの下位層は自然言語文のセマンティックな特徴を抽出し、上位層は特定の分類タスクのための専門的なシステムを構築する。
この階層的なアプローチは、異なるタスクの競合に起因するパフォーマンス低下を緩和します。
論文 参考訳(メタデータ) (2023-06-30T15:16:52Z) - Wav2SQL: Direct Generalizable Speech-To-SQL Parsing [55.10009651476589]
Speech-to-Spider (S2Spider) は、与えられたデータベースに対する音声質問をsqlクエリに変換することを目的としている。
ケースドシステム間の誤り合成を回避した,最初の直接音声-話者パーシングモデルWav2を提案する。
実験結果から,Wav2は誤差混成を回避し,ベースラインの精度を最大2.5%向上させることで最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-05-21T19:26:46Z) - Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge
Base and Database [86.03294330305097]
知識ベース(KB)とデータベース(DB)の両方で質問応答(QA)を統一した意味的要素を提案する。
フレームワークに不可欠な要素としてプリミティブ(KBのリレーションとエンティティ、テーブル名、列名、DBのセル値)を導入します。
生成元を利用して、異なる操作でトップランクプリミティブを変更・構成することで、最終的な論理形式を予測する。
論文 参考訳(メタデータ) (2022-11-09T19:33:27Z) - xDBTagger: Explainable Natural Language Interface to Databases Using
Keyword Mappings and Schema Graph [0.17188280334580192]
自然言語クエリをインターフェース内の構造化クエリ言語(NLQ)にリレーショナルデータベースに変換することは、難しい作業である。
我々は xDBTagger を提案する。xDBTagger は説明可能なハイブリッド翻訳パイプラインで,ユーザがテキストと視覚の両方で行う決定について説明する。
xDBTaggerは精度の点で有効であり、クエリを最先端のパイプラインベースシステムと比較して最大10000倍の効率で変換する。
論文 参考訳(メタデータ) (2022-10-07T18:17:09Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Photon: A Robust Cross-Domain Text-to-SQL System [189.1405317853752]
私たちは、マッピングを即座に決定できない自然言語入力にフラグを付けることができる、堅牢でモジュール化されたクロスドメインなNLIDBPhotonを紹介します。
提案手法は,翻訳不能なユーザ入力に対して,テキストからネイティブシステムへのロバストさを効果的に向上させる。
論文 参考訳(メタデータ) (2020-07-30T07:44:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。