Fugu-MT 論文翻訳(概要): MSc-SQL: Multi-Sample Critiquing Small Language Models For Text-To-SQL Translation

論文の概要: MSc-SQL: Multi-Sample Critiquing Small Language Models For Text-To-SQL Translation

arxiv url: http://arxiv.org/abs/2410.12916v1
Date: Wed, 16 Oct 2024 18:03:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:36.562127
Title: MSc-SQL: Multi-Sample Critiquing Small Language Models For Text-To-SQL Translation
Title（参考訳）: MSc-SQL: テキストからSQLへの変換のための小さな言語モデルをマルチサンプルで記述する
Authors: Satya Krishna Gorti, Ilan Gofman, Zhaoyan Liu, Jiapeng Wu, Noël Vouitsis, Guangwei Yu, Jesse C. Cresswell, Rasa Hosseinzadeh,
Abstract要約: テキスト・ツー・ジェネレーションは、非専門家が自然言語でデータベースと対話することを可能にする。 GPT-4のような大規模クローズドソースモデルの最近の進歩は、アクセシビリティ、プライバシ、レイテンシの課題を提示している。我々は、小型で効率的でオープンソースのテキスト・ツー・ジェネレーション・モデルの開発に注力する。
参考スコア（独自算出の注目度）: 10.205010004198757
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Text-to-SQL generation enables non-experts to interact with databases via natural language. Recent advances rely on large closed-source models like GPT-4 that present challenges in accessibility, privacy, and latency. To address these issues, we focus on developing small, efficient, and open-source text-to-SQL models. We demonstrate the benefits of sampling multiple candidate SQL generations and propose our method, MSc-SQL, to critique them using associated metadata. Our sample critiquing model evaluates multiple outputs simultaneously, achieving state-of-the-art performance compared to other open-source models while remaining competitive with larger models at a much lower cost. Full code can be found at github.com/layer6ai-labs/msc-sql.
Abstract（参考訳）: テキストからSQL生成は、非専門家が自然言語でデータベースと対話することを可能にする。最近の進歩は、アクセシビリティ、プライバシ、レイテンシの課題を示すGPT-4のような大規模なクローズドソースモデルに依存している。これらの問題に対処するため、我々は、小型で効率的でオープンソースのSQL-to-SQLモデルの開発に重点を置いています。本稿では、複数の候補SQL世代をサンプリングし、関連するメタデータを用いてそれらを批判する手法MSc-SQLを提案する。サンプルクオリティクアリングモデルは複数の出力を同時に評価し、他のオープンソースモデルと比較して最先端の性能を実現しつつ、より大きなモデルとの競争をはるかに低コストで維持する。完全なコードはgithub.com/layer6ai-labs/msc-sqlで見ることができる。

関連論文リスト

RingSQL: Generating Synthetic Data with Schema-Independent Templates for Text-to-SQL Reasoning Models [1.0062127381149395]
Ringは、スキーマに依存しないクエリテンプレートとLLMベースの自然言語質問のパラフレーズを組み合わせたハイブリッドデータ生成フレームワークである。我々は、Ringによってトレーニングされたモデルが、他の合成データでトレーニングされたモデルと比較して、6つのテキスト間ベンチマークの平均精度+2.3%に達することを発見した。
論文参考訳（メタデータ） (2026-01-09T00:46:53Z)
Auto prompt sql: a resource-efficient architecture for text-to-sql translation in constrained environments [6.2022166353084485]
本稿では,リソース効率の良い小型オープンソースモデルと,テキスト翻訳のための大規模クローズドソースモデルの強力な機能とのギャップを埋めるために設計された,新しいアーキテクチャであるAuto Promptsql(AP-)を紹介する。
論文参考訳（メタデータ） (2025-06-04T06:04:46Z)
ExeSQL: Self-Taught Text-to-SQL Models with Execution-Driven Bootstrapping for SQL Dialects [24.450818792474216]
この作業では、実行駆動のエージェントブートストラップを備えたテキストからガイダンスのフレームワークであるExeを紹介した。 Exeはテキストとガイダンスの学習における方言のギャップを埋め、それぞれ15.2%、10.38%、および4.49%のGPT-4o以降の平均的な改善を実現している。
論文参考訳（メタデータ） (2025-05-22T19:13:34Z)
Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models [22.960560371494832]
小型言語モデル(SLM)はNL2タスクと競合し、パフォーマンスが悪く、既存のフレームワークと互換性がない。 SLMに適した新しい軽量フレームワークであるFeather- Paradigmを紹介します。提案されたパラダイムは、SLMの精度の上限を54.76%に引き上げ、その有効性を強調している。
論文参考訳（メタデータ） (2025-03-22T16:22:53Z)
OmniSQL: Synthesizing High-quality Text-to-SQL Data at Scale [31.852909145101677]
本研究では,大規模で高品質で多様なデータセットを人間の介入なしに自動合成する,新しいスケーラブルなテキスト・データ・フレームワークを提案する。 16,000以上の合成データベースにまたがる250万のサンプルを含む,最初の100万規模のテキスト・データセットであるSyn-2.5Mを紹介した。我々は,7B,14B,32Bの3つのサイズで利用可能な,オープンソースの強力なテキスト・ツー・モデルであるOmniを開発した。
論文参考訳（メタデータ） (2025-03-04T03:30:56Z)
BASE-SQL: A powerful open source Text-To-SQL baseline approach [2.325005809983534]
本稿では,BASE-tuningと呼ばれる,オープンソースモデルファインチューニングを用いたパイプライン方式を提案する。 BASE-はオープンソースのQwen2.5-Coder-32B-Instructを使用しており、BIRD開発セットで67.47%、スパイダーテストセットで88.9%の精度を実現している。
論文参考訳（メタデータ） (2025-02-15T09:23:37Z)
DataGpt-SQL-7B: An Open-Source Language Model for Text-to-SQL [7.76068876576964]
我々は,データアクセスと分析を非専門ユーザ向けに民主化する,コンパクトで微調整されたモデルと自己定義機構のスイートを提案する。我々のシステムであるDataGpt-sqlは、スパイダーデブで87.2%の精度を達成した。
論文参考訳（メタデータ） (2024-09-24T11:38:08Z)
SQL-GEN: Bridging the Dialect Gap for Text-to-SQL Via Synthetic Data And Model Merging [30.306023265985658]
あらゆる方言に対して高品質な合成学習データを生成するためのフレームワークを提案する。本稿では,方言間の共有知識を活用する新しいMixture-of-Experts(MoE)を提案する。
論文参考訳（メタデータ） (2024-08-22T20:50:48Z)
Synthesizing Text-to-SQL Data from Weak and Strong LLMs [68.69270834311259]
オープンソースとクローズドソースの大規模言語モデル(LLM)の能力ギャップは、テキスト・トゥ・タスクにおいて依然として課題である。より大規模で強力なモデルによって生成されたデータと、より小さく、不整合なモデルによって生成されたエラー情報データを組み合わせた合成データアプローチを導入する。
論文参考訳（メタデータ） (2024-08-06T15:40:32Z)
TrustSQL: Benchmarking Text-to-SQL Reliability with Penalty-Based Scoring [11.78795632771211]
本稿では,任意の入力質問を正しく処理するモデルとして,テキスト・ツー・信頼性を評価するための新しいベンチマークを提案する。 2つのモデリング手法を用いて,新たなペナルティに基づく評価基準を用いた既存手法の評価を行った。
論文参考訳（メタデータ） (2024-03-23T16:12:52Z)
SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。 Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。 emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文参考訳（メタデータ） (2023-11-06T05:24:06Z)
Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文参考訳（メタデータ） (2023-08-29T14:59:54Z)
Natural language to SQL in low-code platforms [0.0]
自然言語(NL)クエリを記述可能なパイプラインを提案する。 OutSystemsユーザによって最も頻繁に実行されるクエリをカバーするデータを収集、ラベル付け、検証します。パイプライン全体について説明します。フィードバックループによって,運用データの迅速な収集が可能になります。
論文参考訳（メタデータ） (2023-08-29T11:59:02Z)
SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文参考訳（メタデータ） (2023-05-26T21:39:05Z)
UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文参考訳（メタデータ） (2023-05-25T17:19:52Z)
XRICL: Cross-lingual Retrieval-Augmented In-Context Learning for Cross-lingual Text-to-SQL Semantic Parsing [70.40401197026925]
大規模言語モデルを用いたインコンテキスト学習は、最近セマンティック解析タスクの驚くべき結果を示している。この研究は、あるクエリに対して関連する英語の例を検索する学習を行うXRICLフレームワークを導入している。また、大規模言語モデルの翻訳プロセスを容易にするために、対象言語に対するグローバルな翻訳例も含んでいる。
論文参考訳（メタデータ） (2022-10-25T01:33:49Z)
Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文参考訳（メタデータ） (2021-12-12T20:02:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。