Fugu-MT 論文翻訳(概要): Testing Database Systems with Large Language Model Synthesized Fragments

論文の概要: Testing Database Systems with Large Language Model Synthesized Fragments

arxiv url: http://arxiv.org/abs/2505.02012v1
Date: Sun, 04 May 2025 06:48:01 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-06 18:49:35.37907
Title: Testing Database Systems with Large Language Model Synthesized Fragments
Title（参考訳）: 大規模言語モデル合成フラグメントを用いたデータベースシステムのテスト
Authors: Suyang Zhong, Manuel Rigger,
Abstract要約: 既存のsqlテストケースジェネレータをLLM(Large Language Models)を利用して拡張するアプローチであるShQveLを提案する。我々はShQveLを5回の反復で評価し、55のユニークな、以前は未知のバグを発見しました。
参考スコア（独自算出の注目度）: 3.3302293148249125
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Various automated testing approaches have been proposed for Database Management Systems (DBMSs). Many such approaches generate pairs of equivalent queries to identify bugs that cause DBMSs to compute incorrect results, and have found hundreds of bugs in mature, widely used DBMSs. Most of these approaches are based on manually written SQL generators; however, their bug-finding capabilities remain constrained by the limited set of SQL features supported by the generators. In this work, we propose ShQveL, an approach that augments existing SQL test-case generators by leveraging Large Language Models (LLMs) to synthesize SQL fragments. Our key idea is to systematically incorporate SQL features gained through automated interactions with LLMs into the SQL generators, increasing the features covered while efficiently generating test cases. Specifically, ShQveL uses SQL sketches -- SQL statements with incomplete code segments that LLMs fill -- to integrate LLM-generated content into the generator. We evaluated ShQveL on 5 DBMSs and discovered 55 unique and previously unknown bugs, 50 of which were promptly fixed after our reports.
Abstract（参考訳）: データベース管理システム(DBMS)には、さまざまな自動テストアプローチが提案されている。このようなアプローチの多くは、DBMSに誤った結果を計算させるバグを特定するために同等のクエリのペアを生成し、何百ものバグが成熟して広く使われているDBMSに見つかった。これらのアプローチのほとんどは手書きのSQLジェネレータに基づいているが、そのバグフィニング機能はジェネレータがサポートするSQL機能の制限されたセットによって制限されている。本稿では,SQLフラグメントの合成にLarge Language Models(LLM)を活用することで,既存のSQLテストケースジェネレータを拡張するアプローチであるShQveLを提案する。私たちのキーとなるアイデアは、LLMと自動化されたインタラクションを通じて得られたSQL機能を体系的にSQLジェネレータに組み込むことで、テストケースを効率的に生成しながらカバーする機能を増大させることです。具体的には、ShQveLはSQLのスケッチ -- LLMが満たしている不完全なコードセグメントを備えたSQLステートメント -- を使用して、LLM生成したコンテンツをジェネレータに統合する。我々は,ShQveLを5個のDBMS上で評価し,55個のユニークな,以前は未知のバグを発見した。

関連論文リスト

ErrorLLM: Modeling SQL Errors for Text-to-SQL Refinement [57.98138819417949]
テキスト・ツー・クエリを明示的にモデル化するフレームワークであるErrorLLMを提案する。 ErrorLLMは、バックボーンの初期生成よりも大幅に改善されていることを示す。 ErrorLLMは、精錬効率を維持しつつ、高い検出F1スコアで両面に対処する。
論文参考訳（メタデータ） (2026-03-04T05:27:20Z)
Automated Discovery of Test Oracles for Database Management Systems Using LLMs [13.143749352093474]
本稿では,大規模な言語モデル(LLM)を用いて,テストオラクルの発見とインスタンス化を自動化する方法について検討する。 LLMは、多数の偽陽性バグレポートを生成する幻覚を起こす傾向がある。 ArgusはConstrained Abstract Queryの中核的な概念に基づいて構築された新しいフレームワークです。
論文参考訳（メタデータ） (2025-10-08T05:29:11Z)
HI-SQL: Optimizing Text-to-SQL Systems through Dynamic Hint Integration [1.3927943269211591]
テキスト・ツー・ジェネレーションは自然言語とデータベースのギャップを埋め、ユーザーは専門知識を必要とせずにデータをクエリできる。履歴クエリログを利用した新しいヒント生成機構を組み込んだパイプラインHI-theを提案する。先行クエリを解析することにより、マルチテーブルおよびネストされた操作の複雑さを扱うことに焦点を当てたコンテキストヒントを生成する。提案手法は,LCM生成クエリのクエリ精度を大幅に向上し,呼び出しやレイテンシの面で効率性を確保した。
論文参考訳（メタデータ） (2025-06-11T12:07:55Z)
Scaling Automated Database System Testing [3.3302293148249125]
我々は、Commonsqlの機能のサブセットをサポートするデータベースにテストオラクルを適用するビジョンとプラットフォームを提示する。本研究では,Commonsqlの機能サブセットをサポートするデータベースに対して,テストオーラクルを適用するためのビジョンとプラットフォームであるSQLancer++を提示する。
論文参考訳（メタデータ） (2025-03-27T12:10:36Z)
Evaluating and Enhancing LLMs for Multi-turn Text-to-SQL with Multiple Question Types [11.391598870596392]
大規模言語モデル (LLM) は、かなり高度な音声合成システムを備えている。 LLMは、しばしばSQL生成に焦点を合わせ、現実世界の会話クエリの複雑さを無視している。 LLMの問合せ分類とSQL生成能力を評価するためのテストスイートMMを提案する。
論文参考訳（メタデータ） (2024-12-21T10:13:45Z)
Exploring the Use of LLMs for SQL Equivalence Checking [15.42143912008553]
2sqlクエリの等価チェックは難解な問題である。既存の方法は、有界同値チェックであっても、sqlの小さなサブセットのみを扱うことができる。本稿では,大言語モデル (LLM) が withsql クエリを推論する能力を示すことができるかどうかを考察する。
論文参考訳（メタデータ） (2024-12-07T06:50:12Z)
Towards Evaluating Large Language Models for Graph Query Generation [49.49881799107061]
大言語モデル(LLM)は、生成人工知能(GenAI)の景観に革命をもたらしている本稿では,オープンアクセス LLM を用いてグラフデータベースと対話する強力な言語としてクエリを生成することの課題について比較検討する。クエリ生成精度を実証的に分析したところ、Claude Sonnet 3.5は特定のドメインでそれよりも優れていることがわかった。
論文参考訳（メタデータ） (2024-11-13T09:11:56Z)
PTD-SQL: Partitioning and Targeted Drilling with LLMs in Text-to-SQL [54.304872649870575]
大規模言語モデル(LLM)は、テキスト・トゥ・センス・タスクの強力なツールとして登場した。本研究では,クエリグループパーティショニングを用いることで,単一問題に特有の思考プロセスの学習に集中できることを示す。
論文参考訳（メタデータ） (2024-09-21T09:33:14Z)
SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive LLM Synergy [24.919119901664843]
本稿では,オープンソースのLarge Language Models(LLM)を,クエリの精度とユーザビリティを高めるための一連のツールに統合する,堅牢なシステムを提案する。 Ant GroupによるSpider Leaderboardとデプロイメントのリードパフォーマンスによって実証された。
論文参考訳（メタデータ） (2024-07-19T06:01:57Z)
RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL [48.516004807486745]
文脈内学習を伴う大規模言語モデル(LLM)は、テキスト・ツー・タスクの性能を大幅に改善した。 In-context prompt Engineering のための新しい検索ベースフレームワーク RB- を提案する。実験により,我々のモデルは,公開データセットのBIRDとSpiderの競合ベースラインよりも優れた性能が得られることが示された。
論文参考訳（メタデータ） (2024-07-11T08:19:58Z)
MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.120862170230566]
最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文参考訳（メタデータ） (2023-12-18T14:40:20Z)
Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文参考訳（メタデータ） (2023-08-29T14:59:54Z)
SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文参考訳（メタデータ） (2023-05-26T21:39:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。