論文の概要: Parser Knows Best: Testing DBMS with Coverage-Guided Grammar-Rule Traversal
- arxiv url: http://arxiv.org/abs/2503.03893v1
- Date: Wed, 05 Mar 2025 20:50:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 15:57:15.671593
- Title: Parser Knows Best: Testing DBMS with Coverage-Guided Grammar-Rule Traversal
- Title(参考訳): Parserは、DBMSをカバーしたGrammar-Ruleトラバーサルでテストする
- Authors: Yu Liang, Hong Hu,
- Abstract要約: 本稿では,組込み構文の定義ファイル forsql 生成から文法規則を自動的に抽出するファジングフレームワーク Fuzz を提案する。
Fuzzはさまざまなクエリ文を生成して、テストの文法機能を飽和させる。
評価では、Fuzzは、バグ発見、文法規則のカバレッジ、コードカバレッジという観点で、最先端の既存のテストツールをすべて上回っています。
- 参考スコア(独自算出の注目度): 6.300885279363564
- License:
- Abstract: Database Management System (DBMS) is the key component for data-intensive applications. Recently, researchers propose many tools to comprehensively test DBMS systems for finding various bugs. However, these tools only cover a small subset of diverse syntax elements defined in DBMS-specific SQL dialects, leaving a large number of features unexplored. In this paper, we propose ParserFuzz, a novel fuzzing framework that automatically extracts grammar rules from DBMSs' built-in syntax definition files for SQL query generation. Without any input corpus, ParserFuzz can generate diverse query statements to saturate the grammar features of the tested DBMSs, which grammar features could be missed by previous tools. Additionally, ParserFuzz utilizes code coverage as feedback to guide the query mutation, which combines different DBMS features extracted from the syntax rules to find more function and safety bugs. In our evaluation, ParserFuzz outperforms all state-of-the-art existing DBMS testing tools in terms of bug finding, grammar rule coverage and code coverage. ParserFuzz detects 81 previously unknown bugs in total across 5 popular DBMSs, where all bugs are confirmed and 34 have been fixed.
- Abstract(参考訳): データベース管理システム(DBMS)は、データ集約型アプリケーションの主要なコンポーネントである。
近年,様々なバグを見つけるためのDBMSシステムを包括的にテストするツールが多数提案されている。
しかし、これらのツールはDBMS固有のSQL方言で定義された多様な構文要素の小さなサブセットのみをカバーしており、多くの機能は未探索のままである。
本稿では,SQLクエリ生成のためのDBMSの構文定義ファイルから文法規則を自動的に抽出する新しいファジングフレームワークであるParserFuzzを提案する。
入力コーパスがなければ、ParserFuzzは様々なクエリ文を生成して、テスト済みDBMSの文法機能を飽和させる。
さらに、ParserFuzzは、構文ルールから抽出されたさまざまなDBMS機能を組み合わせて、より多くの機能と安全性のバグを見つけるために、クエリ突然変異をガイドするコードカバレッジをフィードバックとして利用する。
評価では、ParserFuzzは、バグ発見、文法規則のカバレッジ、コードカバレッジの観点から、最先端のDBMSテストツールを全て上回ります。
ParserFuzzは5つの人気のあるDBMSで81の既知のバグを検出し、すべてのバグが確認され、34が修正された。
関連論文リスト
- Constant Optimization Driven Database System Testing [6.246028398098516]
ロジックバグ(Logic bugs)とは、データベース管理システム(DBMS)が、与えられたクエリに対する誤った結果を静かに生成する可能性があるバグである。
我々は,データベースの論理バグを検出する新しいアプローチとして,定数最適化駆動型データベーステスト(CODDTest)を提案する。
論文 参考訳(メタデータ) (2025-01-20T03:32:55Z) - Finding Logic Bugs in Spatial Database Engines via Affine Equivalent Inputs [6.291508085458252]
空間データベース管理システム(SDBMS)は、空間データを保存、操作、検索することを目的としている。
SDBMSのロジックバグの存在は、誤った結果をもたらす可能性がある。
SDBMSのロジックバグの検出は、誤った結果を特定するための基礎的な真実が欠如しているため、難しい。
論文 参考訳(メタデータ) (2024-10-16T12:18:16Z) - SQLaser: Detecting DBMS Logic Bugs with Clause-Guided Fuzzing [17.421408394486072]
データベース管理システム(DBMS)は、現代のデータ駆動システムにおいて重要なコンポーネントである。
これらの複雑さは、しばしばロジックのバグを引き起こし、誤ったクエリ結果、データ露出、不正アクセスなどにつながります。
既存の検出には、ルールベースのバグ検出とカバレッジ誘導ファジィという2つの戦略がある。
論文 参考訳(メタデータ) (2024-07-05T06:56:33Z) - AMBROSIA: A Benchmark for Parsing Ambiguous Questions into Database Queries [56.82807063333088]
我々は,新たなベンチマークであるAMBROSIAを導入し,テキスト・ツー・オープン・プログラムの開発を促進することを期待する。
私たちのデータセットには、3種類のあいまいさ(スコープのあいまいさ、アタッチメントのあいまいさ、あいまいさ)を示す質問が含まれている。
いずれの場合も、データベースのコンテキストが提供されてもあいまいさは持続する。
これは、スクラッチからデータベースを制御して生成する、新しいアプローチによって実現される。
論文 参考訳(メタデータ) (2024-06-27T10:43:04Z) - Testing Database Engines via Query Plan Guidance [6.789710498230718]
本稿では,自動テストの"興味深い"テストケースへの誘導を目的としたクエリプランガイダンス(QPG)の概念を提案する。
我々は,成熟した,広く使用されている,多様なデータベースシステム –DBite,TiDB,Cockroach – に適用した。
論文 参考訳(メタデータ) (2023-12-29T08:09:47Z) - Detecting DBMS Bugs with Context-Sensitive Instantiation and Multi-Plan Execution [11.18715154222032]
本稿では、テストケースで意味論的に正しいsqlクエリを生成する方法と、論理的バグをキャプチャする効果的なオーラクルを提案する方法を含む、この2つの課題を解決することを目的とする。
我々はKangarooと呼ばれるプロトタイプシステムを実装し、広く使われている3つのセマンティックコードを適用した。
我々のシステムと最先端システムを比較すると、生成した意味論的に有効なクエリの数、テスト中の探索されたコードパス、検出されたバグなどにおいて、システムの性能が優れていることが分かる。
論文 参考訳(メタデータ) (2023-12-08T10:15:56Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge
Base and Database [86.03294330305097]
知識ベース(KB)とデータベース(DB)の両方で質問応答(QA)を統一した意味的要素を提案する。
フレームワークに不可欠な要素としてプリミティブ(KBのリレーションとエンティティ、テーブル名、列名、DBのセル値)を導入します。
生成元を利用して、異なる操作でトップランクプリミティブを変更・構成することで、最終的な論理形式を予測する。
論文 参考訳(メタデータ) (2022-11-09T19:33:27Z) - Towards Generalizable and Robust Text-to-SQL Parsing [77.18724939989647]
本稿では,タスク分解,知識獲得,知識構成からなる新しいTKKフレームワークを提案する。
このフレームワークは,Spider,SParC,Co.データセット上でのすべてのシナリオと最先端のパフォーマンスに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T09:21:27Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。