Fugu-MT 論文翻訳(概要): Enhanced Differential Testing in Emerging Database Systems

論文の概要: Enhanced Differential Testing in Emerging Database Systems

arxiv url: http://arxiv.org/abs/2501.01236v1
Date: Thu, 02 Jan 2025 12:52:58 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-05 16:54:32.24401
Title: Enhanced Differential Testing in Emerging Database Systems
Title（参考訳）: 新しいデータベースシステムにおける微分テストの強化
Authors: Yuancheng Jiang, Jianing Wang, Chuqi Zhang, Roland Yap, Zhenkai Liang, Manuel Rigger,
Abstract要約: 本稿では,新たなデータベースシステムのバグを明らかにするために,改良された差分テストを提案する。多くの新しいデータベースシステムは、概念的にはリレーショナルデータベースシステムの拡張である。 57の未知のバグがあり、うち17はロジックのバグで、40は内部エラーでした。
参考スコア（独自算出の注目度）: 11.164715689334912
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In recent years, a plethora of database management systems have surfaced to meet the demands of various scenarios. Emerging database systems, such as time-series and streaming database systems, are tailored to specific use cases requiring enhanced functionality and performance. However, as they are typically less mature, there can be bugs that either cause incorrect results or errors impacting reliability. To tackle this, we propose enhanced differential testing to uncover various bugs in emerging SQL-like database systems. The challenge is how to deal with differences of these emerging databases. Our insight is that many emerging database systems are conceptually extensions of relational database systems, making it possible to reveal logic bugs leveraging existing relational, known-reliable database systems. However, due to inevitable syntax or semantics gaps, it remains challenging to scale differential testing to various emerging database systems. We enhance differential testing for emerging database systems with three steps: (i) identifying shared clauses; (ii) extending shared clauses via mapping new features back to existing clauses of relational database systems; and (iii) generating differential inputs using extended shared clauses. We implemented our approach in a tool called SQLxDiff and applied it to four popular emerging database systems. In total, we found 57 unknown bugs, of which 17 were logic bugs and 40 were internal errors. Overall, vendors fixed 50 bugs and confirmed 5. Our results demonstrate the practicality and effectiveness of SQLxDiff in detecting bugs in emerging database systems, which has the potential to improve the reliability of their applications.
Abstract（参考訳）: 近年,様々なシナリオの要求に応えるために,データベース管理システムの多さが表面化している。時系列やストリーミングデータベースのような新しいデータベースシステムは、機能強化とパフォーマンスを必要とする特定のユースケースに合わせて調整される。しかしながら、一般的には成熟度が低いため、誤った結果や信頼性に影響を及ぼすエラーを引き起こすバグがある可能性がある。そこで我々は,SQLライクなデータベースシステムにおける様々なバグを明らかにするために,改良された差分テストを提案する。課題は、これらの新興データベースの違いにどのように対処するかだ。我々の洞察では、多くの新興データベースシステムは概念的にはリレーショナルデータベースシステムの拡張であり、既存のリレーショナルで既知のデータベースシステムを利用した論理的バグを明らかにすることができる。しかし、必然的な構文やセマンティクスのギャップのため、様々な新興データベースシステムに差分テストをスケールすることは依然として困難である。 3つのステップで新しいデータベースシステムの差分テストを強化します。一共有条項を識別すること。 (二新機能を関係データベースシステムの既存の条項にマッピングして共有条項を拡張すること。) 三拡張共有節を用いて差分入力を生成すること。このアプローチをSQLxDiffというツールで実装し、4つの新興データベースシステムに適用しました。合計して57の未知のバグが見つかり、うち17はロジックのバグで、40は内部エラーでした。全体として、ベンダーは50のバグを修正し、5.5%のバグを確認した。本研究は,新しいデータベースシステムにおけるバグ検出におけるSQLxDiffの実用性と有効性を示すものである。

関連論文リスト

BeyondSWE: Can Current Code Agent Survive Beyond Single-Repo Bug Fixing? [61.247730037229815]
BeyondSWEは2つの軸 – 解像度スコープと知識スコープ – に沿って既存の評価を拡張する包括的なベンチマークです。外部知識の役割を解明するために,ディープ検索とコーディング能力を統合するフレームワークであるSearchSWEを開発した。この作業は、現実的で挑戦的な評価ベンチマークと、より有能なコードエージェントに向けた研究を進めるための柔軟なフレームワークの両方を提供する。
論文参考訳（メタデータ） (2026-03-03T17:52:01Z)
Architecture-Aware Multi-Design Generation for Repository-Level Feature Addition [53.50448142467294]
RAIMは、リポジトリレベルの機能追加のための、多設計およびアーキテクチャ対応のフレームワークである。複数の多様な実装設計を生成することで、線形パッチから切り離される。 NoCode-bench Verifiedデータセットの実験では、RAIMが新しい最先端のパフォーマンスを確立することが示されている。
論文参考訳（メタデータ） (2026-03-02T12:50:40Z)
FuzzySQL: Uncovering Hidden Vulnerabilities in DBMS Special Features with LLM-Driven Fuzzing [37.235342117305684]
Fuzzyはルールベースのパッチをセマンティックな修正と統合し、構文とコンテキストに敏感な障害を修正する。 37の脆弱性を発見しました。そのうち7つは、未テストの特別な機能に結びついています。本結果は,意味的特徴カバレッジにおける従来のファジィザの限界を浮き彫りにした。
論文参考訳（メタデータ） (2026-02-23T04:20:19Z)
Toward Understanding Bugs in Vector Database Management Systems [11.916195480211648]
ベクトルデータベース管理システム(VDBMS)は,多様なデータソースからの高次元埋め込みのセマンティックな類似性検索を容易にする上で,重要な役割を担っている。従来のデータベース信頼性モデルは、データ表現、クエリ機構、システムアーキテクチャに根本的な違いがあるため、VDBMSに直接適用することはできない。我々は15のオープンソースVDBMSから1,671件のバグ修正プルリクエストを手動で分析し、症状、根本原因、開発者修正戦略に基づいたバグの包括的な分類法を開発した。
論文参考訳（メタデータ） (2025-06-03T08:34:01Z)
RAISE: Reasoning Agent for Interactive SQL Exploration [47.77323087050061]
本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文参考訳（メタデータ） (2025-06-02T03:07:08Z)
WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos [48.88393315169039]
協調学習(CL)技術により、複数のパーティが生データを共有せずにモデルを共同でトレーニングできる。現在のCLベンチマークとアルゴリズムは、主に、分離、アライメント、結合可能なデータベースの仮定の下で学習ステップを目標としています。我々は1700万の重み付きエッジでリンクされた10万の現実世界のリレーショナルデータベースから構築された大規模なデータセットを構築した。
論文参考訳（メタデータ） (2025-05-22T13:07:06Z)
Constant Optimization Driven Database System Testing [6.246028398098516]
ロジックバグ(Logic bugs)とは、データベース管理システム(DBMS)が、与えられたクエリに対する誤った結果を静かに生成する可能性があるバグである。我々は,データベースの論理バグを検出する新しいアプローチとして,定数最適化駆動型データベーステスト(CODDTest)を提案する。
論文参考訳（メタデータ） (2025-01-20T03:32:55Z)
BabelBench: An Omni Benchmark for Code-Driven Analysis of Multimodal and Multistructured Data [61.936320820180875]
大規模言語モデル(LLM)は、様々な領域でますます重要になっている。 BabelBenchは、コード実行によるマルチモーダルなマルチ構造化データ管理におけるLLMの熟練度を評価する革新的なベンチマークフレームワークである。 BabelBenchの実験結果から,ChatGPT 4のような最先端モデルでさえ,大幅な改善の余地があることが示唆された。
論文参考訳（メタデータ） (2024-10-01T15:11:24Z)
Hybrid Querying Over Relational Databases and Large Language Models [8.926173054003547]
実世界の4つのデータベースに対する120以上の問合せを含む最初のクロスドメインベンチマークであるSWANを提示する。 1つはスキーマ拡張に基づくもので、もう1つはユーザ定義関数に基づくものである。評価の結果,GPT-4Turboを数発のプロンプトで使用すれば,実行精度が40.0%,データ事実性が48.2%まで向上できることがわかった。
論文参考訳（メタデータ） (2024-08-01T19:29:18Z)
Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。 DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文参考訳（メタデータ） (2024-06-23T05:02:21Z)
An Empirical Study on the Characteristics of Database Access Bugs in Java Applications [5.844508449542756]
データベースを基盤とするアプリケーションはデータベースアクセスコードに依存し、基盤となるデータベース管理システム(DBMS)と相互作用する。本稿では,7つの大規模Javaソースアプリケーションから収集した423のデータベースアクセスバグを実証的に調査する。
論文参考訳（メタデータ） (2024-05-23T19:26:29Z)
Federated Neural Graph Databases [53.03085605769093]
プライバシを保ちながらマルチソースグラフベースのデータの推論を可能にする新しいフレームワークであるFederated Neural Graph Database (FedNGDB)を提案する。既存の方法とは異なり、FedNGDBは複雑なグラフ構造と関係を扱うことができ、様々な下流タスクに適合する。
論文参考訳（メタデータ） (2024-02-22T14:57:44Z)
Testing Database Engines via Query Plan Guidance [6.789710498230718]
本稿では,自動テストの"興味深い"テストケースへの誘導を目的としたクエリプランガイダンス(QPG)の概念を提案する。我々は,成熟した,広く使用されている,多様なデータベースシステム –DBite,TiDB,Cockroach – に適用した。
論文参考訳（メタデータ） (2023-12-29T08:09:47Z)
Detecting DBMS Bugs with Context-Sensitive Instantiation and Multi-Plan Execution [11.18715154222032]
本稿では、テストケースで意味論的に正しいsqlクエリを生成する方法と、論理的バグをキャプチャする効果的なオーラクルを提案する方法を含む、この2つの課題を解決することを目的とする。我々はKangarooと呼ばれるプロトタイプシステムを実装し、広く使われている3つのセマンティックコードを適用した。我々のシステムと最先端システムを比較すると、生成した意味論的に有効なクエリの数、テスト中の探索されたコードパス、検出されたバグなどにおいて、システムの性能が優れていることが分かる。
論文参考訳（メタデータ） (2023-12-08T10:15:56Z)
Interactive Text-to-SQL Generation via Editable Step-by-Step Explanations [31.3376894001311]
本稿では,ユーザがクエリのステップバイステップ説明を直接編集してエラーを修正する,新たなインタラクションメカニズムを提案する。複数のデータセットに対する我々の実験は、24人の参加者を持つユーザとともに、我々のアプローチが複数のSOTAアプローチより優れていることを実証している。
論文参考訳（メタデータ） (2023-05-12T10:45:29Z)
Can LLM Already Serve as A Database Interface? A BIg Bench for Large-Scale Database Grounded Text-to-SQLs [89.68522473384522]
テキストから効率のよいタスクをベースとした大規模データベースのための大規模なベンチマークであるBirdを紹介します。データベースの値に重点を置いていると、汚いデータベースコンテンツに対する新たな課題が浮き彫りになる。最も効果的なテキストから効率のよいモデルであるChatGPTでさえ、実行精度はわずか40.08%である。
論文参考訳（メタデータ） (2023-05-04T19:02:29Z)
Learned-Database Systems Security [46.898983878921484]
機械学習(ML)による脆弱性を識別するフレームワークを開発する。 MLを用いることでデータベース内の過去のクエリが漏洩し、指数的なメモリ爆発を引き起こして数秒でクラッシュする中毒攻撃が可能になることを示す。敵MLはデータベースシステムにおける学習コンポーネントに対する普遍的な脅威であることがわかった。
論文参考訳（メタデータ） (2022-12-20T15:09:30Z)
SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers [61.48159785138462]
本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。 5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
論文参考訳（メタデータ） (2022-09-14T06:27:51Z)
Robust and Transferable Anomaly Detection in Log Data using Pre-Trained Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文参考訳（メタデータ） (2021-02-23T09:17:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。