論文の概要: Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing
- arxiv url: http://arxiv.org/abs/2012.12627v2
- Date: Thu, 31 Dec 2020 01:02:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 01:18:55.767853
- Title: Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing
- Title(参考訳): クロスドメインテキスト-SQL間セマンティック解析のためのブリッジングテキストとタブラリデータ
- Authors: Xi Victoria Lin and Richard Socher and Caiming Xiong
- Abstract要約: BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
- 参考スコア(独自算出の注目度): 110.97778888305506
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present BRIDGE, a powerful sequential architecture for modeling
dependencies between natural language questions and relational databases in
cross-DB semantic parsing. BRIDGE represents the question and DB schema in a
tagged sequence where a subset of the fields are augmented with cell values
mentioned in the question. The hybrid sequence is encoded by BERT with minimal
subsequent layers and the text-DB contextualization is realized via the
fine-tuned deep attention in BERT. Combined with a pointer-generator decoder
with schema-consistency driven search space pruning, BRIDGE attained
state-of-the-art performance on popular cross-DB text-to-SQL benchmarks, Spider
(71.1\% dev, 67.5\% test with ensemble model) and WikiSQL (92.6\% dev, 91.9\%
test). Our analysis shows that BRIDGE effectively captures the desired
cross-modal dependencies and has the potential to generalize to more text-DB
related tasks. Our implementation is available at
\url{https://github.com/salesforce/TabularSemanticParsing}.
- Abstract(参考訳): BRIDGEは,自然言語質問と関係データベース間の依存関係をモデリングする,強力なシーケンシャルアーキテクチャである。
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスで、質問とDBスキーマを表す。
ハイブリッドシーケンスはBERTによって最小層でエンコードされ、BERTの微調整深度でテキスト-DBコンテキスト化を実現する。
スキーマ一貫性駆動の検索スペースプルーニングを備えたポインタジェネレータデコーダと組み合わせて、BRIDGEは一般的なクロスDBテキスト-SQLベンチマーク、スパイダー(71.1\%、アンサンブルモデルで67.5\%)、WikiSQL(92.6\%、91.9\%)で最先端のパフォーマンスを達成した。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,テキストDB関連タスクに一般化する可能性を示唆している。
我々の実装は \url{https://github.com/salesforce/TabularSemanticParsing} で利用可能です。
関連論文リスト
- Bridging the Gap: Transforming Natural Language Questions into SQL Queries via Abstract Query Pattern and Contextual Schema Markup [6.249316460506702]
構造的マッピングギャップと語彙的マッピングギャップの2つの重要なギャップを識別する。
PAS関連は87.9%の実行精度を達成し、BIRDデータセットの64.67%の実行精度を導いた。
スパイダーベンチマークの結果は87.9%の精度でスパイダーベンチマークの最先端を新たに設定し、BIRDデータセットで64.67%の精度で結果を導いた。
論文 参考訳(メタデータ) (2025-02-20T16:11:27Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder
for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。
また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。
スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-03-14T09:49:15Z) - ShadowGNN: Graph Projection Neural Network for Text-to-SQL Parser [36.12921337235763]
抽象レベルとセマンティックレベルでスキーマを処理する新しいアーキテクチャであるShadowGNNを提案します。
チャレンジングなText-to-Spiderベンチマークでは、経験的な結果がShadowGNNが最先端のモデルを上回ることを示しています。
論文 参考訳(メタデータ) (2021-04-10T05:48:28Z) - Data Augmentation with Hierarchical SQL-to-Question Generation for
Cross-domain Text-to-SQL Parsing [40.65143087243074]
本稿では,単純なデータ拡張フレームワークを提案する。
まず、データベースを与えられたら、抽象構文木文法citeyintranxに基づいて大量のsqlクエリを自動的に生成します。
第2に,高品質自然言語問題を得るための階層的sql-to-question生成モデルを提案する。
論文 参考訳(メタデータ) (2021-03-03T07:37:38Z) - DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using
Bi-Directional Recurrent Neural Networks [0.2578242050187029]
NLQのPOSタグを利用した新しいディープラーニングに基づく教師付きアプローチを提案する。
8つの異なるデータセットに対するアプローチを評価し、最新の精度結果、平均92.4%$を報告します。
論文 参考訳(メタデータ) (2021-01-11T22:54:39Z) - Structure-Grounded Pretraining for Text-to-SQL [75.19554243393814]
本稿では,テキストからLARGEへの構造化事前学習フレームワーク(G)について述べる。
カラムグラウンド、バリューグラウンド、カラム値マッピングといった新しい予測タスクのセットを特定し、それらをテキストテーブルエンコーダの事前訓練に活用する。
論文 参考訳(メタデータ) (2020-10-24T04:35:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。