論文の概要: SQLaser: Detecting DBMS Logic Bugs with Clause-Guided Fuzzing
- arxiv url: http://arxiv.org/abs/2407.04294v1
- Date: Fri, 5 Jul 2024 06:56:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-08 14:21:30.702489
- Title: SQLaser: Detecting DBMS Logic Bugs with Clause-Guided Fuzzing
- Title(参考訳): SQLaser: クロースガイドファジィによるDBMS論理バグの検出
- Authors: Jin Wei, Ping Chen, Kangjie Lu, Jun Dai, Xiaoyan Sun,
- Abstract要約: データベース管理システム(DBMS)は、現代のデータ駆動システムにおいて重要なコンポーネントである。
これらの複雑さは、しばしばロジックのバグを引き起こし、誤ったクエリ結果、データ露出、不正アクセスなどにつながります。
既存の検出には、ルールベースのバグ検出とカバレッジ誘導ファジィという2つの戦略がある。
- 参考スコア(独自算出の注目度): 17.421408394486072
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Database Management Systems (DBMSs) are vital components in modern data-driven systems. Their complexity often leads to logic bugs, which are implementation errors within the DBMSs that can lead to incorrect query results, data exposure, unauthorized access, etc., without necessarily causing visible system failures. Existing detection employs two strategies: rule-based bug detection and coverage-guided fuzzing. In general, rule specification itself is challenging; as a result, rule-based detection is limited to specific and simple rules. Coverage-guided fuzzing blindly explores code paths or blocks, many of which are unlikely to contain logic bugs; therefore, this strategy is cost-ineffective. In this paper, we design SQLaser, a SQL-clause-guided fuzzer for detecting logic bugs in DBMSs. Through a comprehensive examination of most existing logic bugs across four distinct DBMSs, excluding those causing system crashes, we have identified 35 logic bug patterns. These patterns manifest as certain SQL clause combinations that commonly result in logic bugs, and behind these clause combinations are a sequence of functions. We therefore model logic bug patterns as error-prone function chains (ie, sequences of functions). We further develop a directed fuzzer with a new path-to-path distance-calculation mechanism for effectively testing these chains and discovering additional logic bugs. This mechanism enables SQLaser to swiftly navigate to target sites and uncover potential bugs emerging from these paths. Our evaluation, conducted on SQLite, MySQL, PostgreSQL, and TiDB, demonstrates that SQLaser significantly accelerates bug discovery compared to other fuzzing approaches, reducing detection time by approximately 60%.
- Abstract(参考訳): データベース管理システム(DBMS)は、現代のデータ駆動システムにおいて重要なコンポーネントである。
これらの複雑さは、DBMS内の実装エラーであるロジックのバグにつながることが多く、必ずしもシステム障害を発生させることなく、誤ったクエリ結果、データ露出、不正アクセスなどに繋がる。
既存の検出には、ルールベースのバグ検出とカバレッジ誘導ファジィという2つの戦略がある。
一般的に、ルール仕様そのものは困難であり、結果として、ルールベースの検出は特定のルールと単純なルールに限られる。
カバレッジ誘導ファジィは、コードパスやブロックを盲目的に探索するが、その多くはロジックのバグを含まないため、この戦略はコスト非効率である。
本稿では,DBMSの論理的バグを検出するSQL-clause-guided fuzzerであるSQLaserを設計する。
システムクラッシュの原因を除いた4つのDBMSにまたがる既存のロジックバグの包括的調査を通じて、35のロジックバグパターンを特定した。
これらのパターンは、一般的にロジックのバグを引き起こす特定のSQL節の組み合わせとして現れ、これらの条項の組み合わせは関数のシーケンスである。
したがって、我々はエラーを起こしやすい関数チェーン(つまり関数のシーケンス)としてロジックバグパターンをモデル化する。
さらに,これらのチェーンを効果的にテストし,追加の論理的バグを発見するための経路間距離計算機構を新たに開発した。
このメカニズムにより、SQLaserは素早くターゲットサイトへナビゲートし、これらのパスから発生する潜在的なバグを発見できる。
SQLite、MySQL、PostgreSQL、TiDBで実施した我々の評価は、SQLaserが他のファジィアプローチに比べてバグ発見を著しく加速し、検出時間を約60%削減していることを示している。
関連論文リスト
- RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - Finding Logic Bugs in Spatial Database Engines via Affine Equivalent Inputs [6.291508085458252]
空間データベース管理システム(SDBMS)は、空間データを保存、操作、検索することを目的としている。
SDBMSのロジックバグの存在は、誤った結果をもたらす可能性がある。
SDBMSのロジックバグの検出は、誤った結果を特定するための基礎的な真実が欠如しているため、難しい。
論文 参考訳(メタデータ) (2024-10-16T12:18:16Z) - An Empirical Study on the Characteristics of Database Access Bugs in Java Applications [5.844508449542756]
データベースを基盤とするアプリケーションはデータベースアクセスコードに依存し、基盤となるデータベース管理システム(DBMS)と相互作用する。
本稿では,7つの大規模Javaソースアプリケーションから収集した423のデータベースアクセスバグを実証的に調査する。
論文 参考訳(メタデータ) (2024-05-23T19:26:29Z) - Improving Complex Reasoning over Knowledge Graph with Logic-Aware Curriculum Tuning [89.89857766491475]
大規模言語モデル(LLM)に基づくKG上の複雑な推論スキーマを提案する。
任意の一階論理クエリを二分木分解により拡張し、LLMの推論能力を刺激する。
広く使われているデータセットに対する実験では、LACTは高度な手法よりも大幅に改善されている(平均+5.5% MRRスコア)。
論文 参考訳(メタデータ) (2024-05-02T18:12:08Z) - GPT-HateCheck: Can LLMs Write Better Functional Tests for Hate Speech Detection? [50.53312866647302]
HateCheckは、合成データに対してきめ細かいモデル機能をテストするスイートである。
GPT-HateCheckは,スクラッチからより多彩で現実的な機能テストを生成するフレームワークである。
クラウドソースのアノテーションは、生成されたテストケースが高品質であることを示しています。
論文 参考訳(メタデータ) (2024-02-23T10:02:01Z) - Testing Database Engines via Query Plan Guidance [6.789710498230718]
本稿では,自動テストの"興味深い"テストケースへの誘導を目的としたクエリプランガイダンス(QPG)の概念を提案する。
我々は,成熟した,広く使用されている,多様なデータベースシステム –DBite,TiDB,Cockroach – に適用した。
論文 参考訳(メタデータ) (2023-12-29T08:09:47Z) - Detecting DBMS Bugs with Context-Sensitive Instantiation and Multi-Plan Execution [11.18715154222032]
本稿では、テストケースで意味論的に正しいsqlクエリを生成する方法と、論理的バグをキャプチャする効果的なオーラクルを提案する方法を含む、この2つの課題を解決することを目的とする。
我々はKangarooと呼ばれるプロトタイプシステムを実装し、広く使われている3つのセマンティックコードを適用した。
我々のシステムと最先端システムを比較すると、生成した意味論的に有効なクエリの数、テスト中の探索されたコードパス、検出されたバグなどにおいて、システムの性能が優れていることが分かる。
論文 参考訳(メタデータ) (2023-12-08T10:15:56Z) - Single-Stage Visual Relationship Learning using Conditional Queries [60.90880759475021]
TraCQは、マルチタスク学習問題とエンティティペアの分布を回避する、シーングラフ生成の新しい定式化である。
我々は,DETRをベースとしたエンコーダ-デコーダ条件付きクエリを用いて,エンティティラベル空間を大幅に削減する。
実験結果から、TraCQは既存のシングルステージシーングラフ生成法よりも優れており、Visual Genomeデータセットの最先端の2段階メソッドを多く上回っていることがわかった。
論文 参考訳(メタデータ) (2023-06-09T06:02:01Z) - Auto-labelling of Bug Report using Natural Language Processing [0.0]
ルールとクエリベースのソリューションは、明確なランキングのない、潜在的な類似バグレポートの長いリストを推奨します。
本論文では,NLP手法の組み合わせによる解を提案する。
カスタムデータトランスフォーマー、ディープニューラルネットワーク、および非汎用機械学習メソッドを使用して、既存の同一バグレポートを検索する。
論文 参考訳(メタデータ) (2022-12-13T02:32:42Z) - Photon: A Robust Cross-Domain Text-to-SQL System [189.1405317853752]
私たちは、マッピングを即座に決定できない自然言語入力にフラグを付けることができる、堅牢でモジュール化されたクロスドメインなNLIDBPhotonを紹介します。
提案手法は,翻訳不能なユーザ入力に対して,テキストからネイティブシステムへのロバストさを効果的に向上させる。
論文 参考訳(メタデータ) (2020-07-30T07:44:48Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。