論文の概要: SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers
- arxiv url: http://arxiv.org/abs/2209.06442v1
- Date: Wed, 14 Sep 2022 06:27:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-15 13:15:08.469482
- Title: SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers
- Title(参考訳): sun: text-to-sqlパーサに内在する不確実性を探る
- Authors: Bowen Qin, Lihan Wang, Binyuan Hui, Bowen Li, Xiangpeng Wei, Binhua
Li, Fei Huang, Luo Si, Min Yang, Yongbin Li
- Abstract要約: 本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。
5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
- 参考スコア(独自算出の注目度): 61.48159785138462
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper aims to improve the performance of text-to-SQL parsing by
exploring the intrinsic uncertainties in the neural network based approaches
(called SUN). From the data uncertainty perspective, it is indisputable that a
single SQL can be learned from multiple semantically-equivalent
questions.Different from previous methods that are limited to one-to-one
mapping, we propose a data uncertainty constraint to explore the underlying
complementary semantic information among multiple semantically-equivalent
questions (many-to-one) and learn the robust feature representations with
reduced spurious associations. In this way, we can reduce the sensitivity of
the learned representations and improve the robustness of the parser. From the
model uncertainty perspective, there is often structural information
(dependence) among the weights of neural networks. To improve the
generalizability and stability of neural text-to-SQL parsers, we propose a
model uncertainty constraint to refine the query representations by enforcing
the output representations of different perturbed encoding networks to be
consistent with each other. Extensive experiments on five benchmark datasets
demonstrate that our method significantly outperforms strong competitors and
achieves new state-of-the-art results. For reproducibility, we release our code
and data at https://github.com/AlibabaResearch/DAMO-ConvAI/tree/main/sunsql.
- Abstract(参考訳): 本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストからSQLへの解析性能を向上させることを目的とする。
データ不確実性の観点からは、1つのSQLが複数の意味論的等価な質問から学習できることは疑わしいが、従来の1対1のマッピングに限られていた手法とは違い、複数の意味論的等価な質問(多対1)の基盤となる相補的意味情報を探究するデータ不確実性制約を提案し、刺激的関連を減らした頑健な特徴表現を学習する。
このようにして、学習した表現の感度を低減し、パーサのロバスト性を向上させることができる。
モデル不確実性の観点から、ニューラルネットワークの重みには構造情報(依存性)がしばしば存在する。
ニューラルテキストからSQLへのパーサの一般化性と安定性を向上させるため,異なる摂動符号化ネットワークの出力表現を互いに整合させることにより,クエリ表現を洗練するためのモデル不確実性制約を提案する。
5つのベンチマークデータセットの大規模な実験により、我々の手法は強力な競争相手を著しく上回り、新しい最先端の結果が得られることを示した。
再現性のために、コードとデータはhttps://github.com/AlibabaResearch/DAMO-ConvAI/tree/main/sunsql.comで公開しています。
関連論文リスト
- T5-SR: A Unified Seq-to-Seq Decoding Strategy for Semantic Parsing [8.363108209152111]
seq2seqセマンティクスは、スキーマ情報予測の質の低下など、より多くの課題に直面します。
本稿では、新たな中間表現 S とスコア再推定器を用いた復位法を含む、SR と呼ばれるSeq2seq 指向のデコード戦略を提案する。
論文 参考訳(メタデータ) (2023-06-14T08:57:13Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - Error Detection for Text-to-SQL Semantic Parsing [18.068244400731366]
現代のテキスト・トゥ・セマンティクスは、しばしば過信であり、実際の使用のためにデプロイされた際の信頼性に疑問を呈する。
本稿では,テキスト間セマンティック解析のためのa-独立誤差検出モデルを提案する。
論文 参考訳(メタデータ) (2023-05-23T04:44:22Z) - A Scalable Space-efficient In-database Interpretability Framework for
Embedding-based Semantic SQL Queries [3.0938904602244346]
我々は、関係エンティティ間の関係を捉えるために、共起に基づく新しい解釈可能性アプローチを導入する。
我々のアプローチは、クエリ非依存(グロバル)とクエリ特化(ローカル)の両方の解釈機能を提供する。
論文 参考訳(メタデータ) (2023-02-23T17:18:40Z) - Importance of Synthesizing High-quality Data for Text-to-SQL Parsing [71.02856634369174]
最先端のテキストから重み付けアルゴリズムは、強化された合成データでトレーニングされた場合、一般的なベンチマークでは改善されなかった。
本稿では,スキーマから重要な関係を取り入れ,強い型付けを課し,スキーマ重み付きカラムサンプリングを行う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-17T02:53:21Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Towards Robustness of Text-to-SQL Models against Synonym Substitution [15.047104267689052]
我々は、テキストから世界への質問翻訳のためのSpiderベンチマークに基づくデータセットであるSpider-Synを紹介する。
我々は,NL質問とテーブルスキーマとの明示的な対応を排除し,精度を劇的に低下させることを観察した。
モデルロバスト性を改善するためのアプローチのカテゴリを2つ提示する。
論文 参考訳(メタデータ) (2021-06-02T10:36:23Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z) - Dynamic Hybrid Relation Network for Cross-Domain Context-Dependent
Semantic Parsing [52.24507547010127]
ドメイン間コンテキスト依存のセマンティック解析は研究の新たな焦点である。
本稿では,コンテキストの発話,トークン,データベーススキーマ,会話の進行に伴う複雑なインタラクションを効果的にモデル化する動的グラフフレームワークを提案する。
提案したフレームワークは既存のモデルを大きなマージンで上回り、2つの大規模ベンチマークで新しい最先端性能を達成する。
論文 参考訳(メタデータ) (2021-01-05T18:11:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。