論文の概要: Detecting DBMS Bugs with Context-Sensitive Instantiation and Multi-Plan Execution
- arxiv url: http://arxiv.org/abs/2312.04941v1
- Date: Fri, 8 Dec 2023 10:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 12:46:22.727721
- Title: Detecting DBMS Bugs with Context-Sensitive Instantiation and Multi-Plan Execution
- Title(参考訳): コンテキスト感度インスティファイションとマルチプラン実行によるDBMSバグの検出
- Authors: Jiaqi Li, Ke Wang, Yaoguang Chen, Yajin Zhou, Lei Wu, Jiashui Wang,
- Abstract要約: 本稿では、テストケースで意味論的に正しいsqlクエリを生成する方法と、論理的バグをキャプチャする効果的なオーラクルを提案する方法を含む、この2つの課題を解決することを目的とする。
我々はKangarooと呼ばれるプロトタイプシステムを実装し、広く使われている3つのセマンティックコードを適用した。
我々のシステムと最先端システムを比較すると、生成した意味論的に有効なクエリの数、テスト中の探索されたコードパス、検出されたバグなどにおいて、システムの性能が優れていることが分かる。
- 参考スコア(独自算出の注目度): 11.18715154222032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: DBMS bugs can cause serious consequences, posing severe security and privacy concerns. This paper works towards the detection of memory bugs and logic bugs in DBMSs, and aims to solve the two innate challenges, including how to generate semantically correct SQL queries in a test case, and how to propose effective oracles to capture logic bugs. To this end, our system proposes two key techniques. The first key technique is called context-sensitive instantiation, which considers all static semantic requirements (including but not limited to the identifier type used by existing systems) to generate semantically valid SQL queries. The second key technique is called multi-plan execution, which can effectively capture logic bugs. Given a test case, multi-plan execution makes the DBMS execute all query plans instead of the default optimal one, and compares the results. A logic bug is detected if a difference is found among the execution results of the executed query plans. We have implemented a prototype system called Kangaroo and applied it to three widely used and well-tested DBMSs, including SQLite, PostgreSQL, and MySQL. Our system successfully detected 50 new bugs. The comparison between our system with the state-of-the-art systems shows that our system outperforms them in terms of the number of generated semantically valid SQL queries, the explored code paths during testing, and the detected bugs.
- Abstract(参考訳): DBMSのバグは深刻な結果を引き起こし、セキュリティとプライバシの深刻な懸念を生じさせる。
本稿では,DBMSにおけるメモリのバグやロジックのバグの検出に取り組み,テストケースにおけるSQLクエリのセマンティックな正しい生成方法や,論理のバグを捕捉するための効果的なオーラクルの提案方法など,この2つの課題を解決することを目的とする。
この目的のために,本システムでは2つの重要な手法を提案する。
これは、意味的に有効なSQLクエリを生成するための静的なセマンティックな要求(既存のシステムで使用される識別子タイプに限らない)をすべて考慮したものである。
2つ目の重要なテクニックはマルチプラン実行(multi-plan execution)と呼ばれ、ロジックのバグを効果的にキャプチャすることができる。
テストケースが与えられた場合、マルチプラン実行により、DBMSはデフォルトの最適なものではなく、すべてのクエリプランを実行し、結果を比較する。
実行されたクエリプランの実行結果に違いがある場合、ロジックバグを検出する。
我々は、Kangarooと呼ばれるプロトタイプシステムを実装し、SQLite、PostgreSQL、MySQLを含む、広く使われている、よくテストされている3つのDBMSに適用した。
我々のシステムは50の新たなバグを発見できた。
我々のシステムと最先端システムを比較すると、生成した意味論的に有効なSQLクエリの数、テスト中の探索されたコードパス、検出されたバグなどにおいて、システムの性能が優れていることが分かる。
関連論文リスト
- Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows [64.94146689665628]
Spider 2.0は、エンタープライズレベルのデータベースのユースケースから派生した、現実のテキストからsqlの問題に対する評価フレームワークである。
Spider 2.0のデータベースは、実際のデータアプリケーションからソースされ、1,000以上の列を含み、BigQueryやSnowflakeなどのローカルまたはクラウドデータベースシステムに格納されることが多い。
Spider 2.0の問題解決には、データベースメタデータ、方言文書、さらにはプロジェクトレベルの理解と検索が頻繁に必要であることを示す。
論文 参考訳(メタデータ) (2024-11-12T12:52:17Z) - Finding Logic Bugs in Spatial Database Engines via Affine Equivalent Inputs [6.291508085458252]
空間データベース管理システム(SDBMS)は、空間データを保存、操作、検索することを目的としている。
SDBMSのロジックバグの存在は、誤った結果をもたらす可能性がある。
SDBMSのロジックバグの検出は、誤った結果を特定するための基礎的な真実が欠如しているため、難しい。
論文 参考訳(メタデータ) (2024-10-16T12:18:16Z) - Tool-Assisted Agent on SQL Inspection and Refinement in Real-World Scenarios [28.55596803781757]
実際のシナリオでは、データベースのミスマッチが一般的です。
我々は,現実世界のシナリオで発生する条件ミスマッチ問題を反映した新しいデータセットであるSpider-Mismatchを紹介する。
提案手法は,数ショット設定で,スパイダーとスパイダー・リアリスティックのデータセットの平均値に対して高い性能を達成する。
論文 参考訳(メタデータ) (2024-08-30T03:38:37Z) - SQLaser: Detecting DBMS Logic Bugs with Clause-Guided Fuzzing [17.421408394486072]
データベース管理システム(DBMS)は、現代のデータ駆動システムにおいて重要なコンポーネントである。
これらの複雑さは、しばしばロジックのバグを引き起こし、誤ったクエリ結果、データ露出、不正アクセスなどにつながります。
既存の検出には、ルールベースのバグ検出とカバレッジ誘導ファジィという2つの戦略がある。
論文 参考訳(メタデータ) (2024-07-05T06:56:33Z) - Testing Database Engines via Query Plan Guidance [6.789710498230718]
本稿では,自動テストの"興味深い"テストケースへの誘導を目的としたクエリプランガイダンス(QPG)の概念を提案する。
我々は,成熟した,広く使用されている,多様なデータベースシステム –DBite,TiDB,Cockroach – に適用した。
論文 参考訳(メタデータ) (2023-12-29T08:09:47Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Wav2SQL: Direct Generalizable Speech-To-SQL Parsing [55.10009651476589]
Speech-to-Spider (S2Spider) は、与えられたデータベースに対する音声質問をsqlクエリに変換することを目的としている。
ケースドシステム間の誤り合成を回避した,最初の直接音声-話者パーシングモデルWav2を提案する。
実験結果から,Wav2は誤差混成を回避し,ベースラインの精度を最大2.5%向上させることで最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-05-21T19:26:46Z) - Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge
Base and Database [86.03294330305097]
知識ベース(KB)とデータベース(DB)の両方で質問応答(QA)を統一した意味的要素を提案する。
フレームワークに不可欠な要素としてプリミティブ(KBのリレーションとエンティティ、テーブル名、列名、DBのセル値)を導入します。
生成元を利用して、異なる操作でトップランクプリミティブを変更・構成することで、最終的な論理形式を予測する。
論文 参考訳(メタデータ) (2022-11-09T19:33:27Z) - S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder
for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。
また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。
スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-03-14T09:49:15Z) - "What makes my queries slow?": Subgroup Discovery for SQL Workload
Analysis [1.3124513975412255]
サブグループディスカバリーに根ざした独自のアプローチを導入する。
この汎用データマイニングフレームワークのインスタンス化と開発方法を示す。
インタラクティブな知識発見のための可視化ツールも提供しています。
論文 参考訳(メタデータ) (2021-08-09T09:44:13Z) - Photon: A Robust Cross-Domain Text-to-SQL System [189.1405317853752]
私たちは、マッピングを即座に決定できない自然言語入力にフラグを付けることができる、堅牢でモジュール化されたクロスドメインなNLIDBPhotonを紹介します。
提案手法は,翻訳不能なユーザ入力に対して,テキストからネイティブシステムへのロバストさを効果的に向上させる。
論文 参考訳(メタデータ) (2020-07-30T07:44:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。