論文の概要: BugForge: Constructing and Utilizing DBMS Bug Repository to Enhance DBMS Testing
- arxiv url: http://arxiv.org/abs/2604.03024v1
- Date: Fri, 03 Apr 2026 13:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.479029
- Title: BugForge: Constructing and Utilizing DBMS Bug Repository to Enhance DBMS Testing
- Title(参考訳): BugForge: DBMSテストの強化を目的としたDBMSバグリポジトリの構築と利用
- Authors: Dawei Li, Qifan Liu, Yuxiao Guo, Jie Liang, Zhiyong Wu, Chi Zhang, Jingzhou Fu, Haogang Mao, Zhenyu Guan, Yu Jiang,
- Abstract要約: 標準化されたバグリポジトリを構築するフレームワークであるBugForgeを提案する。
BugForgeはテストを強化するために高品質のテストケースを生成する。
リポジトリに基づいて、BugForgeは以前不明だった35のバグを発見し、22人の開発者が確認した。
- 参考スコア(独自算出の注目度): 26.533612973604804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: DBMSs are complex systems prone to bugs that may lead to system failures or compromise data integrity. Establishing unified DBMS bug repositories is crucial for systematically organizing bug-related data, enabling code improvement, and supporting automated testing. In particular, bug reports often contain valuable test inputs and bug-triggering clues that help explore rare execution paths and expose critical buggy behavior, thereby guiding automated DBMS testing. However, the heterogeneity of bug reports, along with their incomplete or inaccurate content, makes it challenging to build unified repositories and convert them into high-quality test cases. In this paper, we propose BugForge, a framework that constructs standardized DBMS bug repositories and leverages them to generate high-quality test cases to enhance DBMS testing. Specifically, BugForge progressively collects bug reports, then employs syntax-aware processing and input-adaptive raw PoC extraction to construct a DBMS bug repository. The repository stores structured bug-related data, including bug metadata and raw PoCs that entail potential bug-triggering semantics. These data are further refined into high-quality test cases through semantic-guided adaptation, thereby enabling enhanced DBMS testing methods, including DBMS fuzzing, regression testing, and cross-DBMS bug discovery. We implemented BugForge for PostgreSQL, MySQL, MariaDB, and MonetDB, totally integrated 37,632 bug reports spanning up to 28 years. Based on the repository, BugForge uncovered 35 previously unknown bugs with 22 confirmed by developers, demonstrating the value of constructing and utilizing bug repositories for DBMS testing.
- Abstract(参考訳): DBMSは複雑なシステムであり、バグによってシステム障害やデータの完全性を損なう可能性がある。
統合DBMSバグレポジトリの確立は、バグ関連のデータを体系的に整理し、コードの改善を可能にし、自動テストをサポートするために不可欠である。
特に、バグレポートには貴重なテストインプットと、まれな実行パスを探索し、重要なバグの振る舞いを明らかにするためのバグトリガーのヒントが含まれており、それによって自動DBMSテストのガイドとなる。
しかし、バグレポートの不均一性は、不完全あるいは不正確なコンテンツとともに、統合リポジトリを構築し、それらを高品質なテストケースに変換することを困難にしている。
本稿では,標準DBMSバグレポジトリを構築し,それらを利用して高品質なテストケースを生成し,DBMSテストを強化するフレームワークであるBugForgeを提案する。
具体的には、BugForgeはバグレポートを段階的に収集し、次に構文認識処理と入力適応型の生PoC抽出を使用してDBMSバグレポジトリを構築する。
リポジトリには、潜在的なバグトリガのセマンティクスを必要とするバグメタデータや生のPoCを含む、構造化されたバグ関連データを格納している。
これらのデータは、セマンティック誘導適応により、さらに高品質なテストケースに洗練され、DBMSファジリング、回帰テスト、クロスDBMSバグ発見など、強化されたDBMSテストメソッドが実現される。
PostgreSQL、MySQL、MariaDB、MonetDB用のBugForgeを実装しました。
リポジトリに基づいて、BugForgeは開発者が確認した22個のバグを35個発見し、DBMSテスト用のバグリポジトリの構築と利用の価値を実証した。
関連論文リスト
- BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.003563837981886]
高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。
難易度および多種多様なバグを合成する新しい方法を提案する。
論文 参考訳(メタデータ) (2025-10-22T17:58:56Z) - Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。
単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。
現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。
AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文 参考訳(メタデータ) (2025-09-29T18:20:27Z) - RepoDebug: Repository-Level Multi-Task and Multi-Language Debugging Evaluation of Large Language Models [49.83481415540291]
LLM(Large Language Models)は、コードのデバッグに非常に熟練している。
本稿ではマルチタスクおよび多言語リポジトリレベルのコードデバッグデータセットであるRepo Debugを紹介する。
最高のパフォーマンスモデルである Claude 3.5 Sonnect は,リポジトリレベルのデバッグでは依然としてうまく動作しない。
論文 参考訳(メタデータ) (2025-09-04T10:13:21Z) - BugsRepo: A Comprehensive Curated Dataset of Bug Reports, Comments and Contributors Information from Bugzilla [0.0]
font Familypplselectfont BugsRepoはMozillaプロジェクトから派生した多面的データセットである。
バグレポートのメタデータとコメントのデータセットと,修正あるいはクローズされたバグレポート119,585の詳細な記録が含まれている。
第2に、フォントファミリpplselectfont BugsRepoは、Mozillaコミュニティメンバー19,351名からなるコントリビュータ情報データセットを備えている。
第3に、データセットは10,351の構造化バグレポートサブセットを提供する。
論文 参考訳(メタデータ) (2025-04-26T05:24:21Z) - Parser Knows Best: Testing DBMS with Coverage-Guided Grammar-Rule Traversal [6.300885279363564]
本稿では,組込み構文の定義ファイル forsql 生成から文法規則を自動的に抽出するファジングフレームワーク Fuzz を提案する。
Fuzzはさまざまなクエリ文を生成して、テストの文法機能を飽和させる。
評価では、Fuzzは、バグ発見、文法規則のカバレッジ、コードカバレッジという観点で、最先端の既存のテストツールをすべて上回っています。
論文 参考訳(メタデータ) (2025-03-05T20:50:41Z) - Constant Optimization Driven Database System Testing [6.246028398098516]
ロジックバグ(Logic bugs)とは、データベース管理システム(DBMS)が、与えられたクエリに対する誤った結果を静かに生成する可能性があるバグである。
我々は,データベースの論理バグを検出する新しいアプローチとして,定数最適化駆動型データベーステスト(CODDTest)を提案する。
論文 参考訳(メタデータ) (2025-01-20T03:32:55Z) - Finding Logic Bugs in Spatial Database Engines via Affine Equivalent Inputs [6.291508085458252]
空間データベース管理システム(SDBMS)は、空間データを保存、操作、検索することを目的としている。
SDBMSのロジックバグの存在は、誤った結果をもたらす可能性がある。
SDBMSのロジックバグの検出は、誤った結果を特定するための基礎的な真実が欠如しているため、難しい。
論文 参考訳(メタデータ) (2024-10-16T12:18:16Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。