論文の概要: SQLSpace: A Representation Space for Text-to-SQL to Discover and Mitigate Robustness Gaps
- arxiv url: http://arxiv.org/abs/2510.27532v1
- Date: Fri, 31 Oct 2025 15:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:16.142066
- Title: SQLSpace: A Representation Space for Text-to-SQL to Discover and Mitigate Robustness Gaps
- Title(参考訳): SQLSpace:ロバスト性ギャップの発見と緩和を目的としたテキストからSQLへの表現スペース
- Authors: Neha Srikanth, Victor Bursztyn, Puneet Mathur, Ani Nenkova,
- Abstract要約: sqlSpaceは、人間の介入を最小限に抑えたテキスト対例のコンパクトな表現である。
ベンチマーク間の構成上の違いを明らかにし、精度だけで隠されたパフォーマンスパターンを公開し、クエリ成功のモデリングをサポートする。
- 参考スコア(独自算出の注目度): 23.866638742325502
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce SQLSpace, a human-interpretable, generalizable, compact representation for text-to-SQL examples derived with minimal human intervention. We demonstrate the utility of these representations in evaluation with three use cases: (i) closely comparing and contrasting the composition of popular text-to-SQL benchmarks to identify unique dimensions of examples they evaluate, (ii) understanding model performance at a granular level beyond overall accuracy scores, and (iii) improving model performance through targeted query rewriting based on learned correctness estimation. We show that SQLSpace enables analysis that would be difficult with raw examples alone: it reveals compositional differences between benchmarks, exposes performance patterns obscured by accuracy alone, and supports modeling of query success.
- Abstract(参考訳): 人間の介入を最小限に抑えたテキストからSQLの例に対する、人間の解釈可能な、一般化可能な、コンパクトな表現であるSQLSpaceを紹介します。
評価におけるこれらの表現の有用性を3つのユースケースで示す。
(i)人気のあるテキスト-SQLベンチマークのコンポジションを密に比較・対比し、評価したサンプルのユニークな次元を識別する。
二 総合的精度スコアを超えた粒度レベルでのモデル性能の理解、及び
三 学習精度推定に基づいて、ターゲットクエリ書き換えによるモデル性能を向上させること。
SQLSpaceは、ベンチマーク間の構成的な違いを明らかにし、精度だけで隠蔽されたパフォーマンスパターンを公開し、クエリ成功のモデリングをサポートします。
関連論文リスト
- The Interpretability Analysis of the Model Can Bring Improvements to the Text-to-SQL Task [3.890033714780255]
WHERE節のセマンティック解析のためのモデル解釈可能性解析と実行誘導戦略を統合する。
我々のモデルは、単一テーブルデータベースクエリタスクのエンブレマであるウィキデータセットを抜粋する。
基本的なデータベースクエリ処理の精度を高めるためにこの取り組みが、複雑なクエリ処理の研究に新たな視点を提供することを期待しています。
論文 参考訳(メタデータ) (2025-08-12T11:24:16Z) - Improving Retrieval-augmented Text-to-SQL with AST-based Ranking and Schema Pruning [10.731045939849125]
本稿では,テキストからセマンティックへの解析に注目する。
商用データベースのスキーマのサイズとビジネスインテリジェンスソリューションのデプロイ可能性に関する課題から,入力データベース情報を動的に取得する $textASTReS$ を提案する。
論文 参考訳(メタデータ) (2024-07-03T15:55:14Z) - Evaluating Cross-Domain Text-to-SQL Models and Benchmarks [7.388002745070808]
テキスト・ツー・ベンチマークを研究し、これらのベンチマークの中で最高のパフォーマンスのモデルを再評価する。
これらのベンチマークで完全な性能を達成することは、提供されたサンプルから導出できる複数の解釈のため不可能であることがわかった。
GPT4ベースのモデルは、人間の評価においてスパイダーベンチマークのゴールド標準基準クエリを上回る。
論文 参考訳(メタデータ) (2023-10-27T23:36:14Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Error Detection for Text-to-SQL Semantic Parsing [18.068244400731366]
現代のテキスト・トゥ・セマンティクスは、しばしば過信であり、実際の使用のためにデプロイされた際の信頼性に疑問を呈する。
本稿では,テキスト間セマンティック解析のためのa-独立誤差検出モデルを提案する。
論文 参考訳(メタデータ) (2023-05-23T04:44:22Z) - SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers [61.48159785138462]
本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。
5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-09-14T06:27:51Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。