論文の概要: RISE: Rule-Driven SQL Dialect Translation via Query Reduction
- arxiv url: http://arxiv.org/abs/2601.05579v1
- Date: Fri, 09 Jan 2026 07:00:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.879935
- Title: RISE: Rule-Driven SQL Dialect Translation via Query Reduction
- Title(参考訳): RISE: クエリリダクションによるルール駆動型SQLダイアレクト変換
- Authors: Xudong Xie, Yuwei Zhang, Wensheng Dou, Yu Gao, Ziyu Cui, Jiansen Song, Rui Yang, Jun Wei,
- Abstract要約: 大規模言語モデル(LLM)はSQL方言の翻訳を支援するが、長い複雑なクエリに悩まされることが多い。
長大で複雑なクエリを正確に処理できる新しい LLM ベースのSQL 方言翻訳手法 RISE を提案する。
TPC-DSとSQLBenchの2つの実世界のベンチマークでRISEを評価し、従来のルールベースのツールとLCMベースのアプローチを比較した。
- 参考スコア(独自算出の注目度): 14.187357850698993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Translating SQL dialects across different relational database management systems (RDBMSs) is crucial for migrating RDBMS-based applications to the cloud. Traditional SQL dialect translation tools rely on manually-crafted rules, necessitating significant manual effort to support new RDBMSs and dialects. Although large language models (LLMs) can assist in translating SQL dialects, they often struggle with lengthy and complex SQL queries. In this paper, we propose RISE, a novel LLM-based SQL dialect translation approach that can accurately handle lengthy and complex SQL queries. Given a complex source query $Q_c$ that contains a SQL dialect $d$, we first employ a dialect-aware query reduction technique to derive a simplified query $Q_{s}$ by removing $d$-irrelevant SQL elements from $Q_c$. Subsequently, we utilize LLMs to translate $Q_{s}$ into $Q_{s^{'}}$, and automatically extract the translation rule $r_d$ for dialect $d$ based on the relationship between $Q_{s}$ and $Q_{s^{'}}$. By applying $r_d$ to $Q_c$, we can effectively translate the dialect $d$ within $Q_c$, thereby bypassing the complexity of the source query $Q_c$. We evaluate RISE on two real-world benchmarks, i.e., TPC-DS and SQLProcBench, comparing its performance against both the traditional rule-based tools and the LLM-based approaches with respect to translation accuracy. RISE achieves accuracies of 97.98% on TPC-DS and 100% on SQLProcBench, outperforming the baselines by an average improvement of 24.62% and 238.41%, respectively.
- Abstract(参考訳): 異なるリレーショナルデータベース管理システム(RDBMS)間でSQLの方言を変換することは、RDBMSベースのアプリケーションをクラウドに移行する上で非常に重要です。
従来のSQL方言翻訳ツールは手作業によるルールに依存しており、新しいRDBMSや方言をサポートするために重要な手作業を必要とする。
大きな言語モデル(LLM)はSQLの方言の翻訳を支援するが、長大で複雑なSQLクエリに苦しむことが多い。
本稿では,LLMに基づく新しいSQL方言翻訳手法RISEを提案する。
SQL の方言 $d$ を含む複雑なソースクエリ $Q_c$ を考えると、まずは、$Q_c$ から$d$非関連 SQL 要素を取り除き、単純なクエリ $Q_{s}$ を導出するために、方言対応のクエリ削減技術を使用します。
次に LLM を用いて$Q_{s}$ を $Q_{s^{'}}$ に翻訳し、$Q_{s}$ と $Q_{s^{'}}$ の関係に基づいて $d$ の方言 $r_d$ を自動抽出する。
$r_d$ を $Q_c$ に適用することで、$Q_c$ 内で $d$ の方言を効果的に翻訳できるので、ソースクエリの複雑さを回避できます。
TPC-DSとSQLProcBenchの2つの実世界のベンチマークでRISEを評価し、従来のルールベースのツールとLLMベースの翻訳精度の比較を行った。
RISEはTPC-DSで97.98%、SQLProcBenchで100%、平均24.62%、平均238.41%でベースラインを上回っている。
関連論文リスト
- PARROT: A Benchmark for Evaluating LLMs in Cross-System SQL Translation [21.0303026118673]
本稿では CrOss-System SQL Translation のための実践的で現実的なベンチマック PARROT を紹介する。
PARROTは38のオープンソースベンチマークと実世界のビジネスサービスから598の翻訳ペアで構成されている。
28,003 の PARROT-Diverse や 5,306 のサンプルを持つ PARROT-Simple など,複数のベンチマーク版も提供しています。
論文 参考訳(メタデータ) (2025-09-27T14:41:13Z) - End-to-End Text-to-SQL with Dataset Selection: Leveraging LLMs for Adaptive Query Generation [6.5390580456423555]
従来のアプローチでは、直接変換タスクとしてテキストからクエリをモデル化する。
大規模言語モデル(LLM)の最近の進歩は翻訳精度を大幅に改善した。
本稿では,ユーザの意図するデータベースを識別する3段階のエンドツーエンドテキスト・ツー・エンド・フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-08T15:16:36Z) - CrackSQL: A Hybrid SQL Dialect Translation System Powered by Large Language Models [20.718779783349984]
CrackはルールとLLMベースのメソッドを組み合わせて制限を克服する最初のハイブリッドSQL方言翻訳システムである。
Crackは3つの翻訳モードをサポートし、Webコンソールインターフェース、PyPIパッケージ、コマンドラインプロンプトを含む複数のデプロイオプションを提供する。
論文 参考訳(メタデータ) (2025-04-01T15:11:03Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - PTD-SQL: Partitioning and Targeted Drilling with LLMs in Text-to-SQL [54.304872649870575]
大規模言語モデル(LLM)は、テキスト・トゥ・センス・タスクの強力なツールとして登場した。
本研究では,クエリグループパーティショニングを用いることで,単一問題に特有の思考プロセスの学習に集中できることを示す。
論文 参考訳(メタデータ) (2024-09-21T09:33:14Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.120862170230566]
最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。
我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z) - Benchmarking and Improving Text-to-SQL Generation under Ambiguity [25.283118418288293]
我々はAmbiQTと呼ばれる新しいベンチマークを開発し、各テキストは語彙的および/または構造的あいまいさのために2つのもっともらしいSQLとして解釈できる。
提案するLogicalBeamは,計画ベースのテンプレート生成と制約付きインフィルを併用して,sql論理空間をナビゲートする新しい復号アルゴリズムである。
論文 参考訳(メタデータ) (2023-10-20T17:00:53Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。