論文の概要: Scaling Automated Database System Testing
- arxiv url: http://arxiv.org/abs/2503.21424v1
- Date: Thu, 27 Mar 2025 12:10:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:53:36.144536
- Title: Scaling Automated Database System Testing
- Title(参考訳): 自動データベースシステムテストのスケーリング
- Authors: Suyang Zhong, Manuel Rigger,
- Abstract要約: 我々は、Commonsqlの機能のサブセットをサポートするデータベースにテストオラクルを適用するビジョンとプラットフォームを提示する。
本研究では,Commonsqlの機能サブセットをサポートするデータベースに対して,テストオーラクルを適用するためのビジョンとプラットフォームであるSQLancer++を提示する。
- 参考スコア(独自算出の注目度): 3.3302293148249125
- License:
- Abstract: Recently, various automated testing approaches have been proposed that use specialized test oracles to find hundreds of logic bugs in mature, widely-used Database Management Systems (DBMSs). These test oracles require database and query generators, which must account for the often significant differences between the SQL dialects of these systems. Since it can take weeks to implement such generators, many DBMS developers are unlikely to invest the time to adopt such automated testing approaches. In short, existing approaches fail to scale to the plethora of DBMSs. In this work, we present both a vision and a platform, SQLancer++, to apply test oracles to any SQL-based DBMS that supports a subset of common SQL features. Our technical core contribution is a novel architecture for an adaptive SQL statement generator. This adaptive SQL generator generates SQL statements with various features, some of which might not be supported by the given DBMS, and then learns through interaction with the DBMS, which of these are understood by the DBMS. Thus, over time, the generator will generate mostly valid SQL statements. We evaluated SQLancer++ across 17 DBMSs and discovered a total of 195 unique, previously unknown bugs, of which 180 were fixed after we reported them. While SQLancer++ is the first major step towards scaling automated DBMS testing, various follow-up challenges remain.
- Abstract(参考訳): 近年,成熟したデータベース管理システム(DBMS)における数百の論理的バグを見つけるために,特殊なオーラクルを使用する,さまざまな自動テスト手法が提案されている。
これらのテストオラクルはデータベースとクエリジェネレータを必要としており、これらのシステムのSQL方言間でしばしば大きな違いを考慮しなければなりません。
このようなジェネレータを実装するのに数週間かかる可能性があるため、多くのDBMS開発者は、このような自動テストアプローチを採用するのに時間を費やすことはありそうにない。
簡単に言うと、既存のアプローチはDBMSの多さにスケールできない。
本研究では、共通SQL機能のサブセットをサポートするSQLベースのDBMSに対して、テストオーラクルを適用するためのビジョンとプラットフォームであるSQLancer++を提示する。
私たちの技術コアコントリビューションは、適応型SQLステートメントジェネレータのための新しいアーキテクチャです。
このアダプティブSQLジェネレータは、与えられたDBMSでサポートされないかもしれない様々な特徴を持つSQLステートメントを生成し、DBMSで理解されているDBMSとのインタラクションを通じて学習する。
したがって、時間とともにジェネレータは、ほぼ有効なSQLステートメントを生成する。
私たちはSQLancer++を17のDBMSで評価し、195のユニークな、以前は未知のバグを発見しました。
SQLancer++は、自動DBMSテストのスケーリングに向けた最初の大きなステップであるが、さまざまなフォローアップ課題が残っている。
関連論文リスト
- Exploring the Use of LLMs for SQL Equivalence Checking [15.42143912008553]
2sqlクエリの等価チェックは難解な問題である。
既存の方法は、有界同値チェックであっても、sqlの小さなサブセットのみを扱うことができる。
本稿では,大言語モデル (LLM) が withsql クエリを推論する能力を示すことができるかどうかを考察する。
論文 参考訳(メタデータ) (2024-12-07T06:50:12Z) - Finding Logic Bugs in Spatial Database Engines via Affine Equivalent Inputs [6.291508085458252]
空間データベース管理システム(SDBMS)は、空間データを保存、操作、検索することを目的としている。
SDBMSのロジックバグの存在は、誤った結果をもたらす可能性がある。
SDBMSのロジックバグの検出は、誤った結果を特定するための基礎的な真実が欠如しているため、難しい。
論文 参考訳(メタデータ) (2024-10-16T12:18:16Z) - Text2SQL is Not Enough: Unifying AI and Databases with TAG [47.45480855418987]
Table-Augmented Generation (TAG) は、データベース上の自然言語の質問に答えるパラダイムである。
我々は、TAG問題を研究するためのベンチマークを開発し、標準手法がクエリの20%以上を正しく答えることを発見した。
論文 参考訳(メタデータ) (2024-08-27T00:50:14Z) - DAC: Decomposed Automation Correction for Text-to-SQL [51.48239006107272]
De Automation Correction (DAC)を導入し、エンティティリンクとスケルトン解析を分解することでテキストから合成を補正する。
また,本手法では,ベースライン法と比較して,スパイダー,バード,カグルDBQAの平均値が平均3.7%向上することを示した。
論文 参考訳(メタデータ) (2024-08-16T14:43:15Z) - Testing Database Engines via Query Plan Guidance [6.789710498230718]
本稿では,自動テストの"興味深い"テストケースへの誘導を目的としたクエリプランガイダンス(QPG)の概念を提案する。
我々は,成熟した,広く使用されている,多様なデータベースシステム –DBite,TiDB,Cockroach – に適用した。
論文 参考訳(メタデータ) (2023-12-29T08:09:47Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - On the Structural Generalization in Text-to-SQL [36.56043090037171]
データベーススキーマ(DS)の構造的多様性について検討する。
本稿では,新しいテキスト間構造データを生成するフレームワークを提案する。
合成試料を用いたテキスト・ツー・モデルの評価における顕著な性能低下
論文 参考訳(メタデータ) (2023-01-12T02:52:51Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z) - Photon: A Robust Cross-Domain Text-to-SQL System [189.1405317853752]
私たちは、マッピングを即座に決定できない自然言語入力にフラグを付けることができる、堅牢でモジュール化されたクロスドメインなNLIDBPhotonを紹介します。
提案手法は,翻訳不能なユーザ入力に対して,テキストからネイティブシステムへのロバストさを効果的に向上させる。
論文 参考訳(メタデータ) (2020-07-30T07:44:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。