論文の概要: An Empirical Study on the Characteristics of Database Access Bugs in Java Applications
- arxiv url: http://arxiv.org/abs/2405.15008v1
- Date: Thu, 23 May 2024 19:26:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-27 19:17:31.722624
- Title: An Empirical Study on the Characteristics of Database Access Bugs in Java Applications
- Title(参考訳): Javaアプリケーションにおけるデータベースアクセスバグの特性に関する実証的研究
- Authors: Wei Liu, Shouvick Mondal, Tse-Hsun Chen,
- Abstract要約: データベースを基盤とするアプリケーションはデータベースアクセスコードに依存し、基盤となるデータベース管理システム(DBMS)と相互作用する。
本稿では,7つの大規模Javaソースアプリケーションから収集した423のデータベースアクセスバグを実証的に調査する。
- 参考スコア(独自算出の注目度): 5.844508449542756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Database-backed applications rely on the database access code to interact with the underlying database management systems (DBMSs). Although many prior studies aim at database access issues like SQL anti-patterns or SQL code smells, there is a lack of study of database access bugs during the maintenance of database-backed applications. In this paper, we empirically investigate 423 database access bugs collected from seven large-scale Java open source applications that use relational database management systems (e.g., MySQL or PostgreSQL). We study the characteristics (e.g., occurrence and root causes) of the bugs by manually examining the bug reports and commit histories. We find that the number of reported database and non-database access bugs share a similar trend but their modified files in bug fixing commits are different. Additionally, we generalize categories of the root causes of database access bugs, containing five main categories (SQL queries, Schema, API, Configuration, SQL query result) and 25 unique root causes. We find that the bugs pertaining to SQL queries, Schema, and API cover 84.2% of database access bugs across all studied applications. In particular, SQL queries bug (54%) and API bug (38.7%) are the most frequent issues when using JDBC and Hibernate, respectively. Finally, we provide a discussion on the implications of our findings for developers and researchers.
- Abstract(参考訳): データベースを基盤とするアプリケーションはデータベースアクセスコードに依存し、基盤となるデータベース管理システム(DBMS)と相互作用する。
多くの先行研究は、SQLアンチパターンやSQLコードの臭いといったデータベースアクセスの問題を目的としているが、データベースが支援するアプリケーションのメンテナンス中に、データベースアクセスのバグについての研究が不足している。
本稿では,リレーショナルデータベース管理システム(MySQLやPostgreSQLなど)を使用する7つの大規模Javaオープンソースアプリケーションから収集された423のデータベースアクセスバグを実証的に調査する。
バグレポートを手作業で調べ,履歴をコミットすることで,バグの特徴(例,発生原因,根本原因)を調査する。
報告されたデータベースとデータベース以外のアクセスバグの数は同様の傾向にあるが、バグ修正コミットで修正されたファイルが異なる。
さらに、データベースアクセスバグの根本原因のカテゴリを一般化し、5つの主要なカテゴリ(SQLクエリ、スキーマ、API、設定、SQLクエリ結果)と25のユニークな根本原因を含む。
SQLクエリ、スキーマ、APIに関連するバグが、すべての研究対象アプリケーションに対して84.2%のデータベースアクセスバグをカバーしていることがわかった。
特にSQLクエリのバグ(54%)とAPIのバグ(38.7%)は、JDBCとHibernateを使用するときに最も頻繁に発生する問題である。
最後に、開発者や研究者にとっての発見の意味について論じる。
関連論文リスト
- Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows [64.94146689665628]
Spider 2.0は、エンタープライズレベルのデータベースのユースケースから派生した、現実のテキストからsqlの問題に対する評価フレームワークである。
Spider 2.0のデータベースは、実際のデータアプリケーションからソースされ、1,000以上の列を含み、BigQueryやSnowflakeなどのローカルまたはクラウドデータベースシステムに格納されることが多い。
Spider 2.0の問題解決には、データベースメタデータ、方言文書、さらにはプロジェクトレベルの理解と検索が頻繁に必要であることを示す。
論文 参考訳(メタデータ) (2024-11-12T12:52:17Z) - SQLaser: Detecting DBMS Logic Bugs with Clause-Guided Fuzzing [17.421408394486072]
データベース管理システム(DBMS)は、現代のデータ駆動システムにおいて重要なコンポーネントである。
これらの複雑さは、しばしばロジックのバグを引き起こし、誤ったクエリ結果、データ露出、不正アクセスなどにつながります。
既存の検出には、ルールベースのバグ検出とカバレッジ誘導ファジィという2つの戦略がある。
論文 参考訳(メタデータ) (2024-07-05T06:56:33Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - Testing Database Engines via Query Plan Guidance [6.789710498230718]
本稿では,自動テストの"興味深い"テストケースへの誘導を目的としたクエリプランガイダンス(QPG)の概念を提案する。
我々は,成熟した,広く使用されている,多様なデータベースシステム –DBite,TiDB,Cockroach – に適用した。
論文 参考訳(メタデータ) (2023-12-29T08:09:47Z) - Detecting DBMS Bugs with Context-Sensitive Instantiation and Multi-Plan Execution [11.18715154222032]
本稿では、テストケースで意味論的に正しいsqlクエリを生成する方法と、論理的バグをキャプチャする効果的なオーラクルを提案する方法を含む、この2つの課題を解決することを目的とする。
我々はKangarooと呼ばれるプロトタイプシステムを実装し、広く使われている3つのセマンティックコードを適用した。
我々のシステムと最先端システムを比較すると、生成した意味論的に有効なクエリの数、テスト中の探索されたコードパス、検出されたバグなどにおいて、システムの性能が優れていることが分かる。
論文 参考訳(メタデータ) (2023-12-08T10:15:56Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Can LLM Already Serve as A Database Interface? A BIg Bench for
Large-Scale Database Grounded Text-to-SQLs [89.68522473384522]
テキストから効率のよいタスクをベースとした大規模データベースのための大規模なベンチマークであるBirdを紹介します。
データベースの値に重点を置いていると、汚いデータベースコンテンツに対する新たな課題が浮き彫りになる。
最も効果的なテキストから効率のよいモデルであるChatGPTでさえ、実行精度はわずか40.08%である。
論文 参考訳(メタデータ) (2023-05-04T19:02:29Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - Demystifying Dependency Bugs in Deep Learning Stack [7.488059560714949]
本稿では、Deep Learningスタック全体にわたる依存性バグ(DB)の症状、根本原因、修正パターンを特徴付ける。
以上の結果から,依存性管理の実践的意義が明らかとなった。
論文 参考訳(メタデータ) (2022-07-21T07:56:03Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。