論文の概要: SQL-Commenter: Aligning Large Language Models for SQL Comment Generation with Direct Preference Optimization
- arxiv url: http://arxiv.org/abs/2603.18606v1
- Date: Thu, 19 Mar 2026 08:23:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.029098
- Title: SQL-Commenter: Aligning Large Language Models for SQL Comment Generation with Direct Preference Optimization
- Title(参考訳): SQL-Commenter:SQLコメント生成のための大規模言語モデルと直接参照最適化
- Authors: Lei Yu, Peng Wang, Jingyuan Zhang, Xin Wang, Jia Xu, Li Yang, Changzhi Deng, Jiajia Ma, Fengjun Zhang,
- Abstract要約: LLaMA-3.1-8Bに基づくコメント生成手法を提案する。
まず、専門家が検証したコメントを含むcomplexsqlクエリの包括的なデータセットを構築する。
次に,LLMの構文と意味理解を強化するために,大規模コーパス上で連続的な事前学習を行う。
最後に,人間のフィードバックを用いた直接選好最適化(DPO)を提案する。
- 参考スコア(独自算出の注目度): 19.179416473507633
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SQL query comprehension is a significant challenge due to complex syntax, diverse join types, and deep nesting. Many queries lack adequate comments, severely hindering code readability, maintainability, and knowledge transfer. Automated SQL comment generation faces two main challenges: limited datasets that inadequately represent complex real-world queries, and Large Language Models' (LLMs) insufficient understanding of SQL-specific semantics. Our empirical analysis shows that even after continual pre-training and supervised fine-tuning, LLMs struggle with complex SQL semantics, yielding inaccurate comments. To address this, we propose SQL-Commenter, an advanced method based on LLaMA-3.1-8B. We first construct a comprehensive dataset of complex SQL queries with expert-verified comments. Next, we perform continual pre-training on a large SQL corpus to enhance the LLM's syntax and semantic understanding, followed by supervised fine-tuning. Finally, we introduce Direct Preference Optimization (DPO) using human feedback. SQL-Commenter utilizes a preference-based loss function to favor preferred outputs, enhancing fine-grained semantic learning and context-dependent quality assessment. Evaluated on the Spider and Bird benchmarks, SQL-Commenter significantly outperforms state-of-the-art baselines. On average, it surpasses the strongest baseline (Qwen3-14B) by 9.29, 4.99, and 13.23 percentage points on BLEU-4, METEOR, and ROUGE-L, respectively. Moreover, human evaluation demonstrates the superior quality of comments generated by SQL-Commenter in terms of correctness, completeness, and naturalness.
- Abstract(参考訳): SQLクエリの理解は、複雑な構文、多様な結合型、深いネストのため、大きな課題である。
多くのクエリには十分なコメントがなく、コードの可読性、保守性、知識伝達を著しく妨げている。
SQLコメントの自動生成は、複雑な現実世界のクエリを不適切に表現する限られたデータセットと、SQL固有のセマンティクスの理解が不十分なLarge Language Models(LLM)の2つの大きな課題に直面している。
我々の実証分析は、連続的な事前トレーニングと教師付き微調整の後にも、LLMは複雑なSQLセマンティクスに苦労し、不正確なコメントを生み出していることを示している。
そこで我々は,LLaMA-3.1-8Bに基づく高度な手法であるSQL-Commenterを提案する。
まず、専門家が検証したコメントを含む複雑なSQLクエリの包括的なデータセットを構築します。
次に、LLMの構文と意味理解を強化するため、大規模なSQLコーパス上で継続事前学習を行い、次いで教師付き微調整を行う。
最後に,人間のフィードバックを用いた直接選好最適化(DPO)を提案する。
SQL-Commenterは、好みに基づく損失関数を使用して、好みの出力を優先し、きめ細かいセマンティックラーニングと文脈に依存した品質評価を強化する。
SpiderとBirdのベンチマークから評価すると、SQL-Commenterは最先端のベースラインを大幅に上回っている。
平均して最強のベースライン(Qwen3-14B)を9.29、4.99、13.23ポイント、BLEU-4、METEOR、ROUGE-Lを上回っている。
さらに、人間による評価は、SQL-Commenterが生成したコメントの正確性、完全性、自然性の観点から、優れた品質を示している。
関連論文リスト
- Bridging Global Intent with Local Details: A Hierarchical Representation Approach for Semantic Validation in Text-to-SQL [30.78817492504152]
HEROは、グローバルな意図と局所的な詳細を統合する階層的な表現アプローチである。
我々はNested Message Passing Neural Network (NMPNN) を用いて、関係スキーマ誘導セマンティクスにおける固有情報をキャプチャする。
提案手法は既存の最先端手法よりも優れており,AUPRCの9.40%,AUROCの12.35%が意味的不整合を識別している。
きめ細かいセマンティックエラーを検出し、よりきめ細かいフィードバックで大きな言語モデルを提供し、最終的にはデータクエリプラットフォームの信頼性と解釈性を高めます。
論文 参考訳(メタデータ) (2025-12-28T02:25:33Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - Taming SQL Complexity: LLM-Based Equivalence Evaluation for Text-to-SQL [0.0]
本稿では,Large Language Models (LLM) を用いて意味論とより実践的な「弱」意味論的等価性の両方を評価する。
我々は,Sql同値と不等価の共通パターンを解析し,LLMに基づく評価の課題について議論する。
論文 参考訳(メタデータ) (2025-06-11T03:16:39Z) - Weaver: Interweaving SQL and LLM for Table Reasoning [62.55797244714265]
Weaverは、構造化データ検索のためのsqlとセマンティック処理のためのLLMを組み合わせたフレキシブルなステップバイステッププランを生成する。
Weaverは、4つのTableQAデータセットで、最先端のメソッドを一貫して上回る。
論文 参考訳(メタデータ) (2025-05-25T03:27:37Z) - E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.187832944550453]
E-Seekは、直接スキーマリンクと候補述語拡張を通じてこれらの課題に対処するように設計された、新しいパイプラインである。
E-Seekは、関連するデータベース項目(テーブル、列、値)と条件を直接質問とsql構築計画に組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。
総合的な評価は、E-Seekが競争性能、特に66.29%の実行精度で複雑なクエリに優れていることを示している。
論文 参考訳(メタデータ) (2024-09-25T09:02:48Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Towards Generalizable and Robust Text-to-SQL Parsing [77.18724939989647]
本稿では,タスク分解,知識獲得,知識構成からなる新しいTKKフレームワークを提案する。
このフレームワークは,Spider,SParC,Co.データセット上でのすべてのシナリオと最先端のパフォーマンスに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T09:21:27Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。