論文の概要: Testing Database Systems with Large Language Model Synthesized Fragments
- arxiv url: http://arxiv.org/abs/2505.02012v1
- Date: Sun, 04 May 2025 06:48:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.37907
- Title: Testing Database Systems with Large Language Model Synthesized Fragments
- Title(参考訳): 大規模言語モデル合成フラグメントを用いたデータベースシステムのテスト
- Authors: Suyang Zhong, Manuel Rigger,
- Abstract要約: 既存のsqlテストケースジェネレータをLLM(Large Language Models)を利用して拡張するアプローチであるShQveLを提案する。
我々はShQveLを5回の反復で評価し、55のユニークな、以前は未知のバグを発見しました。
- 参考スコア(独自算出の注目度): 3.3302293148249125
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Various automated testing approaches have been proposed for Database Management Systems (DBMSs). Many such approaches generate pairs of equivalent queries to identify bugs that cause DBMSs to compute incorrect results, and have found hundreds of bugs in mature, widely used DBMSs. Most of these approaches are based on manually written SQL generators; however, their bug-finding capabilities remain constrained by the limited set of SQL features supported by the generators. In this work, we propose ShQveL, an approach that augments existing SQL test-case generators by leveraging Large Language Models (LLMs) to synthesize SQL fragments. Our key idea is to systematically incorporate SQL features gained through automated interactions with LLMs into the SQL generators, increasing the features covered while efficiently generating test cases. Specifically, ShQveL uses SQL sketches -- SQL statements with incomplete code segments that LLMs fill -- to integrate LLM-generated content into the generator. We evaluated ShQveL on 5 DBMSs and discovered 55 unique and previously unknown bugs, 50 of which were promptly fixed after our reports.
- Abstract(参考訳): データベース管理システム(DBMS)には、さまざまな自動テストアプローチが提案されている。
このようなアプローチの多くは、DBMSに誤った結果を計算させるバグを特定するために同等のクエリのペアを生成し、何百ものバグが成熟して広く使われているDBMSに見つかった。
これらのアプローチのほとんどは手書きのSQLジェネレータに基づいているが、そのバグフィニング機能はジェネレータがサポートするSQL機能の制限されたセットによって制限されている。
本稿では,SQLフラグメントの合成にLarge Language Models(LLM)を活用することで,既存のSQLテストケースジェネレータを拡張するアプローチであるShQveLを提案する。
私たちのキーとなるアイデアは、LLMと自動化されたインタラクションを通じて得られたSQL機能を体系的にSQLジェネレータに組み込むことで、テストケースを効率的に生成しながらカバーする機能を増大させることです。
具体的には、ShQveLはSQLのスケッチ -- LLMが満たしている不完全なコードセグメントを備えたSQLステートメント -- を使用して、LLM生成したコンテンツをジェネレータに統合する。
我々は,ShQveLを5個のDBMS上で評価し,55個のユニークな,以前は未知のバグを発見した。
関連論文リスト
- Scaling Automated Database System Testing [3.3302293148249125]
我々は、Commonsqlの機能のサブセットをサポートするデータベースにテストオラクルを適用するビジョンとプラットフォームを提示する。
本研究では,Commonsqlの機能サブセットをサポートするデータベースに対して,テストオーラクルを適用するためのビジョンとプラットフォームであるSQLancer++を提示する。
論文 参考訳(メタデータ) (2025-03-27T12:10:36Z) - Evaluating and Enhancing LLMs for Multi-turn Text-to-SQL with Multiple Question Types [11.391598870596392]
大規模言語モデル (LLM) は、かなり高度な音声合成システムを備えている。
LLMは、しばしばSQL生成に焦点を合わせ、現実世界の会話クエリの複雑さを無視している。
LLMの問合せ分類とSQL生成能力を評価するためのテストスイートMMを提案する。
論文 参考訳(メタデータ) (2024-12-21T10:13:45Z) - Exploring the Use of LLMs for SQL Equivalence Checking [15.42143912008553]
2sqlクエリの等価チェックは難解な問題である。
既存の方法は、有界同値チェックであっても、sqlの小さなサブセットのみを扱うことができる。
本稿では,大言語モデル (LLM) が withsql クエリを推論する能力を示すことができるかどうかを考察する。
論文 参考訳(メタデータ) (2024-12-07T06:50:12Z) - PTD-SQL: Partitioning and Targeted Drilling with LLMs in Text-to-SQL [54.304872649870575]
大規模言語モデル(LLM)は、テキスト・トゥ・センス・タスクの強力なツールとして登場した。
本研究では,クエリグループパーティショニングを用いることで,単一問題に特有の思考プロセスの学習に集中できることを示す。
論文 参考訳(メタデータ) (2024-09-21T09:33:14Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.120862170230566]
最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。
我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z) - Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文 参考訳(メタデータ) (2023-08-29T14:59:54Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。