論文の概要: GenEdit: Compounding Operators and Continuous Improvement to Tackle Text-to-SQL in the Enterprise
- arxiv url: http://arxiv.org/abs/2503.21602v1
- Date: Thu, 27 Mar 2025 15:22:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:53:05.204338
- Title: GenEdit: Compounding Operators and Continuous Improvement to Tackle Text-to-SQL in the Enterprise
- Title(参考訳): GenEdit: 企業における複合演算子とタックルテキスト-SQLの継続的改善
- Authors: Karime Maamari, Connor Landy, Amine Mhedhbi,
- Abstract要約: GenEditは企業固有の知識セットを構築し維持し、フィードバックを使って知識セットを更新し、将来の世代を改善する。
例えば、GenEditは複合演算子を活用して知識検索を改善し、生成を導く連鎖的なステップとして計画を作成する。
- 参考スコア(独自算出の注目度): 0.9149661171430259
- License:
- Abstract: Recent advancements in Text-to-SQL, driven by large language models, are democratizing data access. Despite these advancements, enterprise deployments remain challenging due to the need to capture business-specific knowledge, handle complex queries, and meet expectations of continuous improvements. To address these issues, we designed and implemented GenEdit: our Text-to-SQL generation system that improves with user feedback. GenEdit builds and maintains a company-specific knowledge set, employs a pipeline of operators decomposing SQL generation, and uses feedback to update its knowledge set to improve future SQL generations. We describe GenEdit's architecture made of two core modules: (i) decomposed SQL generation; and (ii) knowledge set edits based on user feedback. For generation, GenEdit leverages compounding operators to improve knowledge retrieval and to create a plan as chain-of-thought steps that guides generation. GenEdit first retrieves relevant examples in an initial retrieval stage where original SQL queries are decomposed into sub-statements, clauses or sub-queries. It then also retrieves instructions and schema elements. Using the retrieved contextual information, GenEdit then generates step-by-step plan in natural language on how to produce the query. Finally, GenEdit uses the plan to generate SQL, minimizing the need for model reasoning, which enhances complex SQL generation. If necessary, GenEdit regenerates the query based on syntactic and semantic errors. The knowledge set edits are recommended through an interactive copilot, allowing users to iterate on their feedback and to regenerate SQL queries as needed. Each generation uses staged edits which update the generation prompt. Once the feedback is submitted, it gets merged after passing regression testing and obtaining an approval, improving future generations.
- Abstract(参考訳): 大規模言語モデルによって駆動されるText-to-SQLの最近の進歩は、データアクセスを民主化している。
これらの進歩にもかかわらず、ビジネス固有の知識を捉え、複雑なクエリを処理し、継続的な改善の期待を満たす必要があるため、エンタープライズデプロイメントは依然として困難である。
これらの問題に対処するため、ユーザフィードバックによって改善されるテキストからSQL生成システムであるGenEditを設計、実装しました。
GenEditは、企業固有の知識セットを構築し、維持し、SQL生成を分解するオペレータのパイプラインを使用し、フィードバックを使用して、その知識セットを更新して、将来のSQL世代を改善する。
2つのコアモジュールからなるGenEditのアーキテクチャについて説明する。
(i)SQL生成を分解し、
(二)ユーザフィードバックに基づく知識セットの編集。
例えば、GenEditは複合演算子を活用して知識検索を改善し、生成を導く連鎖的なステップとして計画を作成する。
GenEditは、オリジナルのSQLクエリがサブステートメント、節、サブクエリに分解される最初の検索段階で、関連する例を最初に検索する。
また、命令やスキーマ要素も取得する。
検索したコンテキスト情報を使用して、GenEditはクエリの生成方法に関する自然言語でステップバイステップのプランを生成する。
最後に、GenEditは、モデル推論の必要性を最小限に抑え、SQLを生成する計画を使用している。
必要であれば、GenEditは構文的および意味的エラーに基づいてクエリを再生する。
知識セットの編集はインタラクティブなコリロットを通じて推奨され、ユーザはフィードバックを反復し、必要に応じてSQLクエリを再生することができる。
各世代は、生成プロンプトを更新するステージ化された編集を使用する。
一度フィードバックが提出されると、回帰テストに合格して承認を得た後にマージされ、将来の世代が改善される。
関連論文リスト
- Improving Scientific Document Retrieval with Concept Coverage-based Query Set Generation [49.29180578078616]
概念カバレッジに基づくクエリセット生成(CCQGen)フレームワークは、ドキュメントの概念を包括的に網羅したクエリセットを生成するように設計されている。
従来のクエリでは十分にカバーされていない概念を識別し,その後のクエリ生成の条件として活用する。
このアプローチは、それぞれの新しいクエリをガイドして、以前のクエリを補完し、ドキュメントの徹底的な理解を支援する。
論文 参考訳(メタデータ) (2025-02-16T15:59:50Z) - EzSQL: An SQL intermediate representation for improving SQL-to-text Generation [1.6385815610837167]
我々は、自然言語のテキストシーケンスと整合するEzと呼ばれる新しいモデルを開発した。
Ezは演算子とキーワードを変更することで、クエリを自然言語テキストに近づける。
ウィキやスパイダーのデータセットのクエリからテキスト記述を生成する手法として,本モデルが有効であることを示す。
論文 参考訳(メタデータ) (2024-11-28T05:24:46Z) - End-to-end Text-to-SQL Generation within an Analytics Insight Engine [1.123376893295777]
テキスト・トゥ・ザ・トップの最近の進歩は、データベース管理システムをデータアクセスの民主化をさらに進めている。
Distyl AIのAnalytics Insight Engineの開発で経験した、印象的なText-to-the-topを実現する。
本稿では,大規模言語モデルを用いたテキスト・トゥ・ザ・トップパイプラインの設計と実装について述べる。
論文 参考訳(メタデータ) (2024-06-17T21:33:01Z) - SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL Translation [16.07396492960869]
本稿では,テキストからテキストへの変換処理に特化して設計されたトランスフォーマーアーキテクチャを提案する。
我々のモデルは、実行可能層とデコーダ層に構造的帰納バイアスを組み込んで、クエリを自動で抽象構文木(AST)として予測する。
論文 参考訳(メタデータ) (2023-10-27T00:13:59Z) - Exploring the Compositional Generalization in Context Dependent
Text-to-SQL Parsing [14.644212594593919]
この研究は、文脈に依存したテクスト・トゥ・ザ・セサリオにおける作曲の一般化に関する最初の調査である。
実験によると、現在のモデルはすべて、提案されたベンチマークで苦労している。
テキスト・トゥ・ザ・セナリオの合成一般化を改善するために,textttp-align という手法を提案する。
論文 参考訳(メタデータ) (2023-05-29T12:36:56Z) - Augmenting Multi-Turn Text-to-SQL Datasets with Self-Play [46.07002748587857]
我々は、コンテキスト情報を活用して新しいインタラクションを合成するセルフプレイによるトレーニングデータセットの強化について検討する。
本研究では,SParCとCoという2つの広く使われているテキスト・ドメイン・データセットの強いベースラインの精度を向上させることを発見した。
論文 参考訳(メタデータ) (2022-10-21T16:40:07Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - Text Editing by Command [82.50904226312451]
ニューラルテキスト生成における一般的なパラダイムは、単一のステップでテキストを生成するワンショット生成である。
この制限をユーザが既存のテキストを編集するコマンドを発行することでシステムと対話するインタラクティブテキスト生成設定で解決する。
このデータセットに基づいてトレーニングされたトランスフォーマーベースモデルであるInteractive Editorは,ベースラインを上回り,自動評価と人的評価の両方において肯定的な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-24T08:00:30Z) - Learning to Update Natural Language Comments Based on Code Changes [48.829941738578086]
我々は、対応するコード本体の変更に基づいて、既存の自然言語コメントを自動的に更新する新しいタスクを定式化する。
本稿では,2つの異なる言語表現にまたがる変化の相関関係を学習し,ソースコード修正を反映した既存のコメントに適用される一連の編集を生成する手法を提案する。
論文 参考訳(メタデータ) (2020-04-25T15:37:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。