論文の概要: On the Potential of Lexico-logical Alignments for Semantic Parsing to
SQL Queries
- arxiv url: http://arxiv.org/abs/2010.11246v1
- Date: Wed, 21 Oct 2020 19:01:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 22:49:05.222924
- Title: On the Potential of Lexico-logical Alignments for Semantic Parsing to
SQL Queries
- Title(参考訳): SQLクエリのセマンティックパーシングにおける語彙的アライメントの可能性について
- Authors: Tianze Shi, Chen Zhao, Jordan Boyd-Graber, Hal Daum\'e III and Lillian
Lee
- Abstract要約: 我々は11,276のWikiTableQuestionsを英語で質問するデータセットであるSquallを紹介した。
本アノテーションは,エンコーダデコーダモデルの新たなトレーニング可能性を実現する。
5倍のクロスバリデーションでは、これらの戦略は強いベースラインよりも4.4%の精度で改善される。
- 参考スコア(独自算出の注目度): 23.288637579456278
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale semantic parsing datasets annotated with logical forms have
enabled major advances in supervised approaches. But can richer supervision
help even more? To explore the utility of fine-grained, lexical-level
supervision, we introduce Squall, a dataset that enriches 11,276
WikiTableQuestions English-language questions with manually created SQL
equivalents plus alignments between SQL and question fragments. Our annotation
enables new training possibilities for encoder-decoder models, including
approaches from machine translation previously precluded by the absence of
alignments. We propose and test two methods: (1) supervised attention; (2)
adopting an auxiliary objective of disambiguating references in the input
queries to table columns. In 5-fold cross validation, these strategies improve
over strong baselines by 4.4% execution accuracy. Oracle experiments suggest
that annotated alignments can support further accuracy gains of up to 23.9%.
- Abstract(参考訳): 論理形式を付加した大規模意味解析データセットは、教師付きアプローチの大きな進歩を可能にしている。
しかし、よりリッチな監視がさらに役立つだろうか?
Squallは11,276のWikiTableQuestionsを強化したデータセットで,手作業で作成したSQL相当値に加えて,SQLと質問フラグメントのアライメントも備えている。
我々のアノテーションはエンコーダ・デコーダモデルに対して,アライメントのない機械翻訳からのアプローチを含む新たなトレーニング可能性を実現する。
提案手法は,(1)注意を監督する,(2)入力クエリにおける参照の曖昧さを解消する補助目的をテーブル列に適用する,の2つである。
5倍のクロス検証では、これらの戦略は強いベースラインよりも4.4%の精度で改善される。
oracleの実験によると、注釈付きアライメントは最大23.9%の精度向上をサポートする。
関連論文リスト
- Improving Retrieval-augmented Text-to-SQL with AST-based Ranking and Schema Pruning [10.731045939849125]
本稿では,テキストからセマンティックへの解析に注目する。
商用データベースのスキーマのサイズとビジネスインテリジェンスソリューションのデプロイ可能性に関する課題から,入力データベース情報を動的に取得する $textASTReS$ を提案する。
論文 参考訳(メタデータ) (2024-07-03T15:55:14Z) - H-STAR: LLM-driven Hybrid SQL-Text Adaptive Reasoning on Tables [56.73919743039263]
本稿では,2段階のプロセスにシンボル的アプローチと意味的アプローチ(テキスト的アプローチ)を統合し,制約に対処する新しいアルゴリズムを提案する。
実験の結果,H-STARは3つの質問応答(QA)と事実検証データセットにおいて,最先端の手法を大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2024-06-29T21:24:19Z) - Text2Analysis: A Benchmark of Table Question Answering with Advanced
Data Analysis and Unclear Queries [67.0083902913112]
高度な解析タスクを取り入れたText2Analysisベンチマークを開発した。
また,5つのイノベーティブかつ効果的なアノテーション手法を開発した。
3つの異なる指標を用いて5つの最先端モデルを評価する。
論文 参考訳(メタデータ) (2023-12-21T08:50:41Z) - A Multilingual Translator to SQL with Database Schema Pruning to Improve
Self-Attention [0.0]
最大512個の入力トークンを持つ変換器で長文シーケンスを処理できる技術を提案する。
さらに,データを拡張したスパイダーデータセットを4つの言語で同時に調整したmT5大モデルを用いて多言語アプローチを行った。
論文 参考訳(メタデータ) (2023-06-25T14:28:12Z) - Correcting Semantic Parses with Natural Language through Dynamic Schema
Encoding [0.06445605125467573]
自動回帰デコーダの精度は自然言語による1ターンの補正で最大26%向上できることを示す。
Tbaseモデルは、ゼロショットのクロスパーザ設定でT5大モデルのエラーを修正することができる。
論文 参考訳(メタデータ) (2023-05-31T16:01:57Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - N-Best Hypotheses Reranking for Text-To-SQL Systems [6.966624873109535]
Text-to-Taskは自然言語の発話を構造化クエリにマッピングする。
最先端のSOTA(State-of-the-art)システムは、大規模で訓練済みの言語モデルに頼っている。
発見は、再ランク付けによる潜在的な大幅な改善を示している。
論文 参考訳(メタデータ) (2022-10-19T15:35:06Z) - SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers [61.48159785138462]
本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。
5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-09-14T06:27:51Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder
for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。
また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。
スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-03-14T09:49:15Z) - End-to-End Cross-Domain Text-to-SQL Semantic Parsing with Auxiliary Task [38.32058442848129]
我々は、スキーマリンクと値フィリングという、ドメイン間テキスト間セマンティック解析タスクにおける2つの重要なコンポーネントに焦点を当てる。
本稿では,列選択補助タスクを提案し,学習目標の明示的利用により,エンコーダに関連性マッチング機能を持たせる。
論文 参考訳(メタデータ) (2021-06-17T15:15:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。