論文の概要: Schema on the Inside: A Two-Phase Fine-Tuning Method for High-Efficiency Text-to-SQL at Scale
- arxiv url: http://arxiv.org/abs/2603.24023v1
- Date: Wed, 25 Mar 2026 07:33:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.183942
- Title: Schema on the Inside: A Two-Phase Fine-Tuning Method for High-Efficiency Text-to-SQL at Scale
- Title(参考訳): 内部のスキーマ: 大規模における高効率テキスト-SQLのための2相ファインチューニング手法
- Authors: Chinmay Soni, Shivam Chourasia, Gaurav Kumar, Hitesh Kapoor,
- Abstract要約: 私たちは、インド最大のファンタジースポーツプラットフォームであるDream11の姉妹アプリであるCriQで、会話ボット用に設計された8Bパラメーターモデルを紹介します。
新たな2段階教師付き微調整手法により,データベース全体の内部化が可能となり,長文プロンプトの必要がなくなる。
これにより、入力トークンは17k-tokenベースラインから100未満に99%以上削減され、コストのかかる外部APIコールを効率的なローカル推論に置き換える。
- 参考スコア(独自算出の注目度): 2.8815599572682906
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Applying large, proprietary API-based language models to text-to-SQL tasks poses a significant industry challenge: reliance on massive, schema-heavy prompts results in prohibitive per-token API costs and high latency, hindering scalable production deployment. We present a specialized, self-hosted 8B-parameter model designed for a conversational bot in CriQ, a sister app to Dream11, India's largest fantasy sports platform with over 250 million users, that answers user queries about cricket statistics. Our novel two-phase supervised fine-tuning approach enables the model to internalize the entire database schema, eliminating the need for long-context prompts. This reduces input tokens by over 99%, from a 17k-token baseline to fewer than 100, and replaces costly external API calls with efficient local inference. The resulting system achieves 98.4% execution success and 92.5% semantic accuracy, substantially outperforming a prompt-engineered baseline using Google's Gemini Flash 2.0 (95.6% execution, 89.4% semantic accuracy). These results demonstrate a practical path toward high-precision, low-latency text-to-SQL applications using domain-specialized, self-hosted language models in large-scale production environments.
- Abstract(参考訳): 大きな、プロプライエタリなAPIベースの言語モデルをテキストからSQLタスクに適用することは、業界において大きな課題となる。
私たちは、インド最大のファンタジースポーツプラットフォームDream11の姉妹アプリであるCriQで、会話ボット用に設計された、専用の8Bパラメーターモデルを提示します。
新たな2段階教師付き微調整手法により,データベース全体の内部化が可能となり,長文プロンプトの必要がなくなる。
これにより、入力トークンは17k-tokenベースラインから100未満に99%以上削減され、コストのかかる外部APIコールを効率的なローカル推論に置き換える。
このシステムは98.4%の実行成功と92.5%のセマンティック精度を実現し、GoogleのGemini Flash 2.0(95.6%の実行、89.4%のセマンティック精度)を使用したプロンプトエンジニアリングベースラインを大幅に上回っている。
これらの結果は,大規模生産環境でのドメイン特化,自己ホスト型言語モデルを用いた,高精度で低レイテンシなテキスト-SQLアプリケーションへの実践的な道筋を示すものである。
関連論文リスト
- Monte Carlo Tree Search with Reasoning Path Refinement for Small Language Models in Conversational Text-to-NoSQL [20.156191782890797]
本稿では,自然言語質問,データベース,対話履歴を問う問合せを生成するConversational Text-to-Noタスクを提案する。
そこで我々は,クエリ固有の推論機能を備えた小さな言語モデルを実現するフレームワークであるStage-MCTSを提案する。
提案手法は最先端の大規模推論モデルより優れ,実行値の一致精度を最大7.93%向上させる。
論文 参考訳(メタデータ) (2026-02-13T03:35:38Z) - AutoLink: Autonomous Schema Exploration and Expansion for Scalable Schema Linking in Text-to-SQL at Scale [68.29002818359844]
既存の方法は違法なコストを発生させ、リコールとノイズのトレードオフに苦労し、大規模データベースに不利なスケーリングを行う。
我々は、反復的エージェント駆動プロセスとしてスキーマリンクを再構成する、自律的なエージェントフレームワークであるtextbfAutoLinkを提案する。
実験ではAutoLinkの優れたパフォーマンスを示し、最先端の厳密なスキーマリンクのリコール、すなわち textbf68.7% EX on Bird-Dev (CHESSより優れている)、 textbf34.9% EX on Spider-2.0-Lite (第2位)を実現している。
論文 参考訳(メタデータ) (2025-11-21T12:12:17Z) - LitE-SQL: A Lightweight and Efficient Text-to-SQL Framework with Vector-based Schema Linking and Execution-Guided Self-Correction [5.123751486259634]
2つのコンポーネントを持つ軽量で効率的なフレームワークLitE-を紹介します。
BIRDでは、LitE-は72.10%の実行精度を達成し、Spiderでは88.45%に達し、Retrieverと同等または優れたパフォーマンスを示している。
以上の結果から,高品質のテキスト・トゥ・コレクション・ジェネレーションは軽量モデルで実現可能であり,プライバシに敏感かつリソース制約のある設定に実用的なソリューションを提供することがわかった。
論文 参考訳(メタデータ) (2025-10-10T05:27:47Z) - SING-SQL: A Synthetic Data Generation Framework for In-Domain Text-to-SQL Translation [2.0799061948689306]
SING-aは、高品質で高カバレッジな合成テキストデータを生成するための、完全に自動化された2段階のフレームワークである。
SING-LMは、合成データに基づいて微調整されたコンパクト言語モデルのファミリーである。
論文 参考訳(メタデータ) (2025-09-30T02:14:49Z) - Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows [64.94146689665628]
Spider 2.0は、エンタープライズレベルのデータベースのユースケースから派生した、現実のテキストからsqlの問題に対する評価フレームワークである。
Spider 2.0のデータベースは、実際のデータアプリケーションからソースされ、1,000以上の列を含み、BigQueryやSnowflakeなどのローカルまたはクラウドデータベースシステムに格納されることが多い。
Spider 2.0の問題解決には、データベースメタデータ、方言文書、さらにはプロジェクトレベルの理解と検索が頻繁に必要であることを示す。
論文 参考訳(メタデータ) (2024-11-12T12:52:17Z) - TrustSQL: Benchmarking Text-to-SQL Reliability with Penalty-Based Scoring [11.78795632771211]
本稿では,任意の入力質問を正しく処理するモデルとして,テキスト・ツー・信頼性を評価するための新しいベンチマークを提案する。
2つのモデリング手法を用いて,新たなペナルティに基づく評価基準を用いた既存手法の評価を行った。
論文 参考訳(メタデータ) (2024-03-23T16:12:52Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Wav2SQL: Direct Generalizable Speech-To-SQL Parsing [55.10009651476589]
Speech-to-Spider (S2Spider) は、与えられたデータベースに対する音声質問をsqlクエリに変換することを目的としている。
ケースドシステム間の誤り合成を回避した,最初の直接音声-話者パーシングモデルWav2を提案する。
実験結果から,Wav2は誤差混成を回避し,ベースラインの精度を最大2.5%向上させることで最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-05-21T19:26:46Z) - Can LLM Already Serve as A Database Interface? A BIg Bench for
Large-Scale Database Grounded Text-to-SQLs [89.68522473384522]
テキストから効率のよいタスクをベースとした大規模データベースのための大規模なベンチマークであるBirdを紹介します。
データベースの値に重点を置いていると、汚いデータベースコンテンツに対する新たな課題が浮き彫りになる。
最も効果的なテキストから効率のよいモデルであるChatGPTでさえ、実行精度はわずか40.08%である。
論文 参考訳(メタデータ) (2023-05-04T19:02:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。