論文の概要: A Case-Based Reasoning Framework for Adaptive Prompting in Cross-Domain
Text-to-SQL
- arxiv url: http://arxiv.org/abs/2304.13301v1
- Date: Wed, 26 Apr 2023 06:02:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 15:30:18.678115
- Title: A Case-Based Reasoning Framework for Adaptive Prompting in Cross-Domain
Text-to-SQL
- Title(参考訳): クロスドメインテキストからsqlへの適応的プロンプトのためのケースベース推論フレームワーク
- Authors: Chunxi Guo, Zhiliang Tian, Jintao Tang, Pancheng Wang, Zhihua Wen,
Kang Yang and Ting Wang
- Abstract要約: CBR-Apはケースベース推論(CBR)ベースのフレームワークであり、ケース関連知識とケース関連知識を正確に制御するためのGPT-3.5と組み合わせている。
我々は,GPT-3.5の入力を調整するための適応的なプロンプトを設計し,問題意図に応じてケースを適応的に検索する。
セマンティック・ドメイン関連評価器(SDRE)とポインカー検出器(双曲空間における暗黙的意味論のマイニング)、TextAlign(明示的一致の発見)、Positector(部分音声検出)を組み合わせた非意味化フェーズにおいて、セマンティック・ドメイン関連評価器(SDRE)を設計した。
- 参考スコア(独自算出の注目度): 11.943769165490322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in Large Language Models (LLMs), such as Codex, ChatGPT
and GPT-4 have significantly impacted the AI community, including Text-to-SQL
tasks. Some evaluations and analyses on LLMs show their potential to generate
SQL queries but they point out poorly designed prompts (e.g. simplistic
construction or random sampling) limit LLMs' performance and may cause
unnecessary or irrelevant outputs. To address these issues, we propose
CBR-ApSQL, a Case-Based Reasoning (CBR)-based framework combined with GPT-3.5
for precise control over case-relevant and case-irrelevant knowledge in
Text-to-SQL tasks. We design adaptive prompts for flexibly adjusting inputs for
GPT-3.5, which involves (1) adaptively retrieving cases according to the
question intention by de-semantizing the input question, and (2) an adaptive
fallback mechanism to ensure the informativeness of the prompt, as well as the
relevance between cases and the prompt. In the de-semanticization phase, we
designed Semantic Domain Relevance Evaluator(SDRE), combined with Poincar\'e
detector(mining implicit semantics in hyperbolic space), TextAlign(discovering
explicit matches), and Positector (part-of-speech detector). SDRE semantically
and syntactically generates in-context exemplar annotations for the new case.
On the three cross-domain datasets, our framework outperforms the
state-of-the-art(SOTA) model in execution accuracy by 3.7\%, 2.5\%, and 8.2\%,
respectively.
- Abstract(参考訳): Codex、ChatGPT、GPT-4といった大規模言語モデル(LLM)の最近の進歩は、テキストからSQLタスクを含むAIコミュニティに大きな影響を与えている。
LLMに関するいくつかの評価と分析は、SQLクエリを生成する可能性を示しているが、設計の不十分なプロンプト(例えば、単純な構成やランダムサンプリング)がLLMのパフォーマンスを制限し、不要または無関係な出力を引き起こす可能性があることを指摘している。
このような問題に対処するために,ケースベース推論(CBR)とGPT-3.5を組み合わせたCBR-ApSQLを提案する。
提案手法は,(1)入力質問を非意味化することで,質問意図に応じて事例を適応的に検索し,(2)プロンプトのインフォメーション性を保証する適応的フォールバック機構と,事例とプロンプトの関係性を含むgpt-3.5の入力を柔軟に調整するための適応的プロンプトを設計する。
de-semanticization フェーズでは,poincar\'e detector(双曲空間における暗黙的意味論をマイニングする),textalign(明示的マッチングを発見),posector(一部スピーチ検出器)と組み合わせ,意味領域妥当性評価器(sdre)を設計した。
SDREは意味的かつ構文的に、新しいケースのためのコンテキスト内例アノテーションを生成する。
3つのクロスドメインデータセットにおいて、このフレームワークは、実行精度が3.7\%、2.5\%、8.2\%のstate-of-the-art(sota)モデルを上回る。
関連論文リスト
- SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive LLM Synergy [24.919119901664843]
本稿では,オープンソースのLarge Language Models(LLM)を,クエリの精度とユーザビリティを高めるための一連のツールに統合する,堅牢なシステムを提案する。
Ant GroupによるSpider Leaderboardとデプロイメントのリードパフォーマンスによって実証された。
論文 参考訳(メタデータ) (2024-07-19T06:01:57Z) - Schema-Aware Multi-Task Learning for Complex Text-to-SQL [4.913409359995421]
複雑なsqlクエリのためのスキーマ対応マルチタスク学習フレームワーク(MT)を提案する。
具体的には、有効な質問スキーマリンクを識別するために、識別器モジュールを設計する。
デコーダ側では、テーブルと列の接続を記述するために、6種類の関係を定義します。
論文 参考訳(メタデータ) (2024-03-09T01:13:37Z) - Structure Guided Large Language Model for SQL Generation [15.419227635308674]
本稿では,構造情報を活用する構造間フレームワークを提案する。
SGU-は構造化された方法でユーザクエリとデータベースをリンクする。
その後、文法木で複雑な構造を分解し、LCMを誘導してステップバイステップを生成する。
論文 参考訳(メタデータ) (2024-02-19T09:07:59Z) - SQLformer: Deep Auto-Regressive Query Graph Generation for Text-to-SQL Translation [16.07396492960869]
本稿では,テキストからテキストへの変換処理に特化して設計されたトランスフォーマーアーキテクチャを提案する。
我々のモデルは、実行可能層とデコーダ層に構造的帰納バイアスを組み込んで、クエリを自動で抽象構文木(AST)として予測する。
論文 参考訳(メタデータ) (2023-10-27T00:13:59Z) - Retrieval-augmented GPT-3.5-based Text-to-SQL Framework with
Sample-aware Prompting and Dynamic Revision Chain [21.593701177605652]
サンプルと動的リビジョンチェーンを含むテキスト・ツー・アウェア・プロンプト・フレームワークを提案する。
提案手法は,質問項目のサンプルと詳細な情報を含む。
人間の介入なしに実行可能で正確なスクルを生成するために、我々は、きめ細かいフィードバックを反復的に適応する動的リビジョンチェーンを設計する。
論文 参考訳(メタデータ) (2023-07-11T07:16:22Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Towards Generalizable and Robust Text-to-SQL Parsing [77.18724939989647]
本稿では,タスク分解,知識獲得,知識構成からなる新しいTKKフレームワークを提案する。
このフレームワークは,Spider,SParC,Co.データセット上でのすべてのシナリオと最先端のパフォーマンスに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T09:21:27Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。