論文の概要: Meta-aware Learning in text-to-SQL Large Language Model
- arxiv url: http://arxiv.org/abs/2505.18929v1
- Date: Sun, 25 May 2025 01:45:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.759315
- Title: Meta-aware Learning in text-to-SQL Large Language Model
- Title(参考訳): テキストからSQLへの大規模言語モデルにおけるメタアウェアラーニング
- Authors: Wenda Zhang,
- Abstract要約: 大規模言語モデル(LLM)は、複雑なドメイン情報を理解するための主要な課題を克服するために、テキストからタスクへの大きな機会を提供してきました。
本稿では,ドメイン知識,データベーススキーマ,チェーンオブ思考推論プロセス,メタデータ関係を統合するメタ知識学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advancements of Large language models (LLMs) have provided great opportunities to text-to-SQL tasks to overcome the main challenges to understand complex domain information and complex database structures in business applications. In this paper, we propose a meta-aware learning framework to integrate domain knowledge, database schema, chain-of-thought reasoning processes, and metadata relationships to improve the SQL generation quality. The proposed framework includes four learning strategies: schema-based learning, Chain-of-Thought (CoT) learning, knowledge-enhanced learning, and key information tokenization. This approach provides a comprehensive understanding of database structure and metadata information towards LLM through fine-tuning to improve its performance on SQL generation within business domains. Through two experimental studies, we have demonstrated the superiority of the proposed methods in execution accuracy, multi-task SQL generation capability, and reduction of catastrophic forgetting.
- Abstract(参考訳): 大規模言語モデル(LLM)の進歩は、ビジネスアプリケーションにおける複雑なドメイン情報や複雑なデータベース構造を理解する主な課題を克服するために、テキストからSQLまでのタスクに大きな機会を与えました。
本稿では、ドメイン知識、データベーススキーマ、チェーンオブ思考推論プロセス、およびSQL生成品質を改善するメタデータ関係を統合するメタ知識学習フレームワークを提案する。
提案するフレームワークには,スキーマベースの学習,CoT(Chain-of-Thought)学習,知識強化学習,重要な情報トークン化の4つの学習戦略が含まれている。
このアプローチは、ビジネスドメイン内のSQL生成におけるパフォーマンスを改善するために、微調整を通じて、LCMに向けたデータベース構造とメタデータ情報を包括的に理解する。
2つの実験的研究を通じて,提案手法が実行精度,マルチタスクSQL生成能力,破滅的忘れの低減に優れていることを実証した。
関連論文リスト
- DB-Explore: Automated Database Exploration and Instruction Synthesis for Text-to-SQL [18.915121803834698]
大規模言語モデルとデータベースの知識を体系的に整合させる新しいフレームワークであるDB-Exploreを提案する。
我々のフレームワークは、多様なサンプリング戦略と自動命令生成を通じて、包括的なデータベース理解を可能にする。
論文 参考訳(メタデータ) (2025-03-06T20:46:43Z) - A Survey of Large Language Model-Based Generative AI for Text-to-SQL: Benchmarks, Applications, Use Cases, and Challenges [0.7889270818022226]
自然言語クエリを構造化クエリ言語(技術)に変換することで,データベースとのスムーズな対話を容易にする
この調査は、AI駆動のテキスト・ツー・ワンシステムの進化の概要を提供する。
医療、教育、金融といった分野におけるテキスト・ツー・ワンの適用について検討する。
論文 参考訳(メタデータ) (2024-12-06T17:36:28Z) - Relational Database Augmented Large Language Model [59.38841050766026]
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクに優れる。
彼らは、トレーニングや教師付き微調整プロセスを通じてのみ、新しい知識を取り入れることができる。
この正確で最新のプライベート情報は、通常リレーショナルデータベースに格納される。
論文 参考訳(メタデータ) (2024-07-21T06:19:10Z) - Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文 参考訳(メタデータ) (2023-08-29T14:59:54Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。