論文の概要: Prompt Engineering Techniques for Context-dependent Text-to-SQL in Arabic
- arxiv url: http://arxiv.org/abs/2511.20677v1
- Date: Sun, 16 Nov 2025 00:05:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.326955
- Title: Prompt Engineering Techniques for Context-dependent Text-to-SQL in Arabic
- Title(参考訳): アラビア語における文脈依存型テキスト-SQLのためのプロンプトエンジニアリング技術
- Authors: Saleh Almohaimeed, May Alsofyani, Saad Almohaimeed, Mansour Al Ghanim, Liqiang Wang,
- Abstract要約: Ar-SParCはアラビア語のクロスドメインであり、コンテキストに依存したテキストからテキストへのデータセットである。
データセットは3,450の相互関連質問のシーケンスで構成され、各シーケンスは平均約3つの質問を含む。
我々は、GPT-3.5-turboとGPT-4.5-turboの2つの大言語モデルを用いて、Ar-SParCデータセット上で40の実験を行った。
- 参考スコア(独自算出の注目度): 2.8855202197281007
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, the task of cross-domain, context-dependent text-to-SQL has received significant attention. Enables users with no prior knowledge of SQL to have a conversation with databases using natural language. However, most of the available datasets and research have been conducted in English, along with some work in Chinese. To this date, no effort has been made to address this task in the Arabic language. In this paper, we introduce Ar-SParC, the first Arabic cross-domain, context-dependent text-to-SQL dataset. The dataset consists of 3,450 sequences of interrelated questions, each sequence containing an average of approximately three questions, which results in a total of 10225 questions along with their corresponding SQL queries. We conducted 40 experiments on the Ar-SParC dataset using two large language models, GPT-3.5-turbo and GPT-4.5-turbo, applying 10 different prompt engineering techniques, including four question representation methods and six in-context learning techniques. Furthermore, we developed a novel approach named GAT corrector, which enhanced the performance across all 40 experiments, yielding an average improvement of 1.9% in execution accuracy (EX) and 1.9% in interaction accuracy (IX) under zero-shot settings, and an average increase of 1.72% EX and 0.92% IX under in-context learning settings. Finally, we conducted an ablation study with two more experiments to explain why the GAT corrector outperformed the previous GAT verifier technique, particularly for the Arabic language.
- Abstract(参考訳): 近年,コンテキスト依存のテキストからSQLへのクロスドメイン化が注目されている。
SQLの知識のないユーザに対して,自然言語を使用したデータベースとの対話を可能にする。
しかし、利用可能なデータセットと研究のほとんどは英語で行われており、中国語での研究もある。
現在に至るまで、この課題にアラビア語で対処する努力は行われていない。
本稿では,Ar-SParCについて紹介する。Ar-SParCはアラビア語のクロスドメインでコンテキスト依存のSQLデータセットである。
データセットは3,450の相互関連質問のシーケンスで構成され、各シーケンスには平均3つの質問が含まれており、合計10225の質問と対応するSQLクエリが含まれている。
我々は2つの大言語モデルであるGPT-3.5-turboとGPT-4.5-turboを用いてAr-SParCデータセット上で40の実験を行った。
さらに, GAT修正器という新しい手法を開発し, 40実験すべてで性能を向上し, ゼロショット環境での実行精度(EX)が1.9%, インタラクション精度(IX)が1.9%, 文脈内学習環境下では1.72%EXと0.92%IXが平均的に向上した。
最後に,GAT補正器が従来のGAT検証技術,特にアラビア語で優れていた理由を説明するために,さらに2つの実験を行った。
関連論文リスト
- Text-to-SQL Oriented to the Process Mining Domain: A PT-EN Dataset for Query Translation [0.10499611180329804]
本稿では,プロセスマイニング領域におけるテキスト・ツー・フォー・タスクのベンチマークデータセットであるtext-2--4-PMを紹介する。
データセットは、人為的なパラフレーズ、205sql文、および10の修飾子を含む1,655の自然言語発話からなる。
その結果,テキスト2--4-PMはテキスト・ツー・フォーの実装の評価をサポートし,セマンティック・パーシングや他の自然言語処理タスクに広く適用可能であることがわかった。
論文 参考訳(メタデータ) (2025-08-18T01:25:41Z) - SelECT-SQL: Self-correcting ensemble Chain-of-Thought for Text-to-SQL [3.422309388045878]
SelECT-は、チェーン・オブ・シンク、自己補正、アンサンブルの手法をアルゴリズムで組み合わせた、新しいインコンテキスト学習ソリューションである。
具体的には、GPTをベースLLMとして使用する場合、SelECT-Turboはスパイダーリーダーボードの開発セット上で84.2%の実行精度を達成する。
論文 参考訳(メタデータ) (2024-09-16T05:40:18Z) - Ar-Spider: Text-to-SQL in Arabic [11.463438573648297]
本稿ではアラビア語による最初のテキスト・ドメイン間データセットであるAr-Spider 1を紹介する。
言語特有の性質のため、言語学と構造学という2つの大きな課題に遭遇している。
本稿では,S2が1.52%,LGEが1.06%,アラビア語と英語のギャップが7.73%に拡大する類似性関係(CSR)アプローチを提案する。
論文 参考訳(メタデータ) (2024-02-22T23:11:17Z) - Archer: A Human-Labeled Text-to-SQL Dataset with Arithmetic, Commonsense
and Hypothetical Reasoning [67.7258569181669]
このデータセットは、既存の公開データセットと比較して、はるかに高い複雑さを示している。
アーチャーは現在の最先端モデルの能力に挑戦し、スパイダーのリーダーボードの上位モデルはアーチャーのテストセットで6.73%の精度しか達成していない。
論文 参考訳(メタデータ) (2024-02-19T21:24:36Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - MultiSpider: Towards Benchmarking Multilingual Text-to-SQL Semantic
Parsing [48.216386761482525]
英語、ドイツ語、フランス語、スペイン語、日本語、中国語、ベトナム語)をカバーする最大多言語テキストスキーマデータセットであるMultiSpiderを提案する。
3つの典型的な設定(ゼロショット、モノリンガル、マルチリンガル)の下での実験結果から、非英語言語では6.1%の精度の低下が見られる。
また、単純なフレームワーク拡張フレームワークであるSAVe(Augmentation-with-Verification)を提案する。これは、全体的なパフォーマンスを約1.8%向上させ、言語間の29.5%のパフォーマンスギャップを埋める。
論文 参考訳(メタデータ) (2022-12-27T13:58:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。