Fugu-MT 論文翻訳(概要): C3: Zero-shot Text-to-SQL with ChatGPT

論文の概要: C3: Zero-shot Text-to-SQL with ChatGPT

arxiv url: http://arxiv.org/abs/2307.07306v1
Date: Fri, 14 Jul 2023 12:30:41 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-17 14:00:37.413020
Title: C3: Zero-shot Text-to-SQL with ChatGPT
Title（参考訳）: C3: ChatGPTを使ったゼロショットテキストからSQL
Authors: Xuemei Dong, Chao Zhang, Yuhang Ge, Yuren Mao, Yunjun Gao, lu Chen, Jinshu Lin, Dongfang Lou
Abstract要約: 本稿では、C3と呼ばれるChatGPTベースのゼロショットテキスト・トゥ・ザ・ヒント方式を提案し、スパイダーのホールドアウトテストセット上での実行精度を82.3%向上させる。 C3は、Clear Prompting (CP)、Hints (CH)、Consistent Output (CO)の3つの重要なコンポーネントで構成されている。
参考スコア（独自算出の注目度）: 23.047319965644792
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper proposes a ChatGPT-based zero-shot Text-to-SQL method, dubbed C3, which achieves 82.3\% in terms of execution accuracy on the holdout test set of Spider and becomes the state-of-the-art zero-shot Text-to-SQL method on the Spider Challenge. C3 consists of three key components: Clear Prompting (CP), Calibration with Hints (CH), and Consistent Output (CO), which are corresponding to the model input, model bias and model output respectively. It provides a systematic treatment for zero-shot Text-to-SQL. Extensive experiments have been conducted to verify the effectiveness and efficiency of our proposed method.
Abstract（参考訳）: 本稿では、C3と呼ばれるChatGPTベースのゼロショットテキスト・トゥ・SQL方式を提案し、スパイダーのホールドアウトテストセット上での実行精度82.3\%を達成し、スパイダーチャレンジにおける最先端のゼロショットテキスト・トゥ・SQL方式となる。 C3は、Clear Prompting (CP)、Calibration with Hints (CH)、Consistent Output (CO)の3つの主要なコンポーネントで構成され、それぞれモデル入力、モデルバイアス、モデル出力に対応する。ゼロショットテキストからsqlへの体系的な処理を提供する。提案手法の有効性と有効性を検証するため, 大規模な実験を行った。

関連論文リスト

HES-SQL: Hybrid Reasoning for Efficient Text-to-SQL with Structural Skeleton Guidance [6.653834890554154]
HES-は、思考モード融合型教師あり微調整の統合により、テキストからレイテンシ生成を進化させる新しいハイブリッドトレーニングフレームワークである。このフレームワークは、クエリの精度と実行効率を改善しながら、推論モードと非推論モードの切り替えを可能にする。
論文参考訳（メタデータ） (2025-10-10T01:15:57Z)
CogniSQL-R1-Zero: Lightweight Reinforced Reasoning for Efficient SQL Generation [1.169202600932732]
本稿では,強化学習(RL)フレームワークとモデルであるCogni-R1-Zeroを紹介する。我々は、実行の正しさとフォーマットタグのコンプライアンスに基づく軽量な報酬信号を使用する。提案手法は,Text2ベンチマーク上での最先端実行精度を実現する。効率的かつ解釈可能なテキスト・ツー・コード・モデリングのさらなる研究を支援するために、2つのキュレートされたデータセットをリリースする。
論文参考訳（メタデータ） (2025-07-08T14:17:07Z)
CSC-SQL: Corrective Self-Consistency in Text-to-SQL via Reinforcement Learning [0.0]
自己整合性と自己整合性を統合する新しい手法であるCSC-を提案する。グループ相対ポリシー(GRPO)アルゴリズムを用いて、SQL生成モデルとリビジョンモデルの両方を微調整する。 BIRDのプライベートテストセットでは、我々の7Bモデルは71.72%の精度で実行され、32Bモデルは73.67%である。
論文参考訳（メタデータ） (2025-05-19T15:52:19Z)
STaR-SQL: Self-Taught Reasoner for Text-to-SQL [20.719165038519744]
チェーンオブ思考」の理論的根拠は、複雑な推論タスクにおける大規模言語モデルの性能向上に有効であることが証明されている。テキスト駆動のような構造化されたタスクにそのようなテクニックを適用することは、ほとんど探索されていない。本稿では、クエリ生成を推論プロセスとして再編成する新しいアプローチである、テキスト駆動型セルフトレーサ(STaR-)を提案する。挑戦的なスパイダーベンチマークの実験結果によると、STaR-はテキストからパフォーマンスを大幅に改善し、86.6%の精度を実現している。これらの知見は、推論強化トレーニングの可能性を強調している。
論文参考訳（メタデータ） (2025-02-19T08:58:44Z)
OpenSearch-SQL: Enhancing Text-to-SQL with Dynamic Few-shot and Consistency Alignment [6.2089733671434875]
我々は,テキストからエージェントまでのタスクを,整合性アライメント機構に基づくアライメントモジュールとともに,前処理,抽出,生成,リファインメントの4つの主要なモジュールに分割するOpenSearch-を提案する。これらの手法はテキスト・ツー・エージェント・タスクにおけるLLMの性能を大幅に向上させた。実験の結果、OpenSearch-はBIRD開発セットで69.3%、テストセットで72.28%、報酬ベースの効率スコア(R-VES)で69.3で実行精度(EX)を達成した。
論文参考訳（メタデータ） (2025-02-19T07:51:50Z)
RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文参考訳（メタデータ） (2024-10-31T16:22:26Z)
Learning from Imperfect Data: Towards Efficient Knowledge Distillation of Autoregressive Language Models for Text-to-SQL [83.99974309930072]
知識蒸留(KD)は、より大規模な教師モデルをより小さな学生モデルに蒸留することを目的とした一般的な手法である。我々は,不完全なデータ,すなわちKIDを用いてKDを改善することを提案する。 KIDは、すべてのモデルタイプとサイズで一貫した、重要なパフォーマンス向上を達成するだけでなく、トレーニング効率を効果的に向上する。
論文参考訳（メタデータ） (2024-10-15T07:51:00Z)
DataGpt-SQL-7B: An Open-Source Language Model for Text-to-SQL [7.76068876576964]
我々は,データアクセスと分析を非専門ユーザ向けに民主化する,コンパクトで微調整されたモデルと自己定義機構のスイートを提案する。我々のシステムであるDataGpt-sqlは、スパイダーデブで87.2%の精度を達成した。
論文参考訳（メタデータ） (2024-09-24T11:38:08Z)
SelECT-SQL: Self-correcting ensemble Chain-of-Thought for Text-to-SQL [3.422309388045878]
SelECT-は、チェーン・オブ・シンク、自己補正、アンサンブルの手法をアルゴリズムで組み合わせた、新しいインコンテキスト学習ソリューションである。具体的には、GPTをベースLLMとして使用する場合、SelECT-Turboはスパイダーリーダーボードの開発セット上で84.2%の実行精度を達成する。
論文参考訳（メタデータ） (2024-09-16T05:40:18Z)
DAC: Decomposed Automation Correction for Text-to-SQL [51.48239006107272]
De Automation Correction (DAC)を導入し、エンティティリンクとスケルトン解析を分解することでテキストから合成を補正する。また,本手法では,ベースライン法と比較して,スパイダー,バード,カグルDBQAの平均値が平均3.7%向上することを示した。
論文参考訳（メタデータ） (2024-08-16T14:43:15Z)
RH-SQL: Refined Schema and Hardness Prompt for Text-to-SQL [1.734218686180302]
本稿では,精製実行モデルとハードネス・プロンプトに基づくテキスト・トゥ・エクセルの手法を提案する。パフォーマンスを維持しながら、ストレージとトレーニングのコストを削減する。スパイダーデータセットに関する我々の実験は、特に大規模なLMを用いて、82.6%の異常な精度(EX)を達成した。
論文参考訳（メタデータ） (2024-06-13T14:04:34Z)
UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文参考訳（メタデータ） (2023-05-25T17:19:52Z)
A comprehensive evaluation of ChatGPT's zero-shot Text-to-SQL capability [57.71052396828714]
本稿では,ChatGPTのテキスト・トゥ・アビリティの最初の包括的分析について述べる。異なる言語、設定、シナリオを持つ12のベンチマークデータセットで実験を行った。現在のSOTA(State-of-the-art)モデルのパフォーマンスとはまだ差があるが、ChatGPTのパフォーマンスは印象的だ。
論文参考訳（メタデータ） (2023-03-12T04:22:01Z)
S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文参考訳（メタデータ） (2022-03-14T09:49:15Z)
RYANSQL: Recursively Applying Sketch-based Slot Fillings for Complex Text-to-SQL in Cross-Domain Databases [6.349764856675643]
我々は、ドメイン間データベースのテキスト・トゥ・スケッチタスクを解決するために、RYANと呼ばれるニューラルネットワークアプローチを提案する。 RYANは挑戦的なスパイダーベンチマークで58.2%の精度を達成した。
論文参考訳（メタデータ） (2020-04-07T04:51:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。