論文の概要: Abacus-SQL: A Text-to-SQL System Empowering Cross-Domain and Open-Domain Database Retrieval
- arxiv url: http://arxiv.org/abs/2504.09824v1
- Date: Mon, 14 Apr 2025 02:49:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:52:57.494954
- Title: Abacus-SQL: A Text-to-SQL System Empowering Cross-Domain and Open-Domain Database Retrieval
- Title(参考訳): Abacus-SQL: クロスドメインおよびオープンドメインデータベース検索機能を備えたテキストからSQLシステム
- Authors: Keyan Xu, Dingzirui Wang, Xuanliang Zhang, Qingfu Zhu, Wanxiang Che,
- Abstract要約: 既存のテキスト・トゥ・ザ・システムシステムでは、オープンドメインデータベースの検索機能が欠如していることが多い。
abacus-はマルチターンテキスト・トゥ・ザ・タスクで優れたパフォーマンスを発揮し、アプローチの有効性を効果的に検証する。
- 参考スコア(独自算出の注目度): 44.89146464166763
- License:
- Abstract: The existing text-to-SQL systems have made significant progress in SQL query generation, but they still face numerous challenges. Existing systems often lack retrieval capabilities for open-domain databases, requiring users to manually filter relevant databases. Additionally, their cross-domain transferability is limited, making it challenging to accommodate diverse query requirements. To address these issues, we propose Abacus-SQL. Abacus-SQL utilizes database retrieval technology to accurately locate the required databases in an open-domain database environment. It also enhances the system cross-domain transfer ability through data augmentation methods. Moreover, Abacus-SQL employs Pre-SQL and Self-debug methods, thereby enhancing the accuracy of SQL queries. Experimental results demonstrate that Abacus-SQL performs excellently in multi-turn text-to-SQL tasks, effectively validating the approach's effectiveness. Abacus-SQL is publicly accessible at https://huozi.8wss.com/abacus-sql/.
- Abstract(参考訳): 既存のテキスト-SQLシステムはSQLクエリ生成に大きな進歩を遂げているが、それでも多くの課題に直面している。
既存のシステムは、しばしばオープンドメインデータベースの検索機能に欠けており、ユーザーは関連するデータベースを手動でフィルタリングする必要がある。
さらに、ドメイン間の転送性は制限されており、多様なクエリ要求を満たすことは困難である。
これらの問題に対処するため、我々はAbacus-SQLを提案する。
Abacus-SQLは、データベース検索技術を利用して、オープンドメインのデータベース環境で必要なデータベースを正確に見つける。
また、データ拡張手法により、システム間の転送能力も向上する。
さらに、Abacus-SQLはPre-SQLとSelf-Debugメソッドを採用しており、SQLクエリの精度が向上している。
実験の結果、Abacus-SQLはマルチターンテキスト-SQLタスクにおいて優れたパフォーマンスを示し、アプローチの有効性を効果的に検証した。
Abacus-SQLはhttps://huozi.8wss.com/abacus-sql/で公開されている。
関連論文リスト
- SQLucid: Grounding Natural Language Database Queries with Interactive Explanations [28.10727203675818]
SQLucidは、エキスパートでないユーザと複雑なデータベースクエリプロセスのギャップを埋める、新しいユーザインターフェースである。
私たちのコードはhttps://github.com/magic-YuanTian/ucid.comで公開されています。
論文 参考訳(メタデータ) (2024-09-10T03:14:09Z) - EHR-SeqSQL : A Sequential Text-to-SQL Dataset For Interactively Exploring Electronic Health Records [11.78795632771211]
EHRデータベースのための新しいシーケンシャルテキスト・ツー・スクールのデータセットであるEHR-Seqを紹介する。
EHR-Seqは、シーケンシャルな質問と文脈的な質問を含む最初の医療用テキストからsqlのデータセットベンチマークである。
本実験は, 単ターン法よりも多ターン法の方が構成性に優れていることを示す。
論文 参考訳(メタデータ) (2024-05-23T07:14:21Z) - SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Can LLM Already Serve as A Database Interface? A BIg Bench for
Large-Scale Database Grounded Text-to-SQLs [89.68522473384522]
テキストから効率のよいタスクをベースとした大規模データベースのための大規模なベンチマークであるBirdを紹介します。
データベースの値に重点を置いていると、汚いデータベースコンテンツに対する新たな課題が浮き彫りになる。
最も効果的なテキストから効率のよいモデルであるChatGPTでさえ、実行精度はわずか40.08%である。
論文 参考訳(メタデータ) (2023-05-04T19:02:29Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Prefix-to-SQL: Text-to-SQL Generation from Incomplete User Questions [33.48258057604425]
本稿では,ユーザから質問文を入力として取り出して,意図したsqlを予測する,新しいタスクであるPremction-to-Queryを提案する。
我々はPAGSASと呼ばれる新しいベンチマークを構築し、124Kのユーザ質問プレフィックスと5つのサブタスクのアドバイス、GeoQuery、Scholar、ATIS、Spiderを含む。
省略トークンの数にプレフィックス・ツー・クエリの難しさが関係しているのを観察するため,サンプルの摂食に関するカリキュラム学習と,省略トークンの数の増加について考察する。
論文 参考訳(メタデータ) (2021-09-15T14:28:18Z) - RYANSQL: Recursively Applying Sketch-based Slot Fillings for Complex
Text-to-SQL in Cross-Domain Databases [6.349764856675643]
我々は、ドメイン間データベースのテキスト・トゥ・スケッチタスクを解決するために、RYANと呼ばれるニューラルネットワークアプローチを提案する。
RYANは挑戦的なスパイダーベンチマークで58.2%の精度を達成した。
論文 参考訳(メタデータ) (2020-04-07T04:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。