論文の概要: Decoupled Dialogue Modeling and Semantic Parsing for Multi-Turn
Text-to-SQL
- arxiv url: http://arxiv.org/abs/2106.02282v1
- Date: Fri, 4 Jun 2021 06:31:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 15:08:53.258438
- Title: Decoupled Dialogue Modeling and Semantic Parsing for Multi-Turn
Text-to-SQL
- Title(参考訳): マルチターンテキスト・トゥ・SQLのためのデカップリング対話モデリングと意味解析
- Authors: Zhi Chen, Lu Chen Hanqi Li, Ruisheng Cao, Da Ma, Mengyue Wu and Kai Yu
- Abstract要約: 本稿では,対話コンテキストの完了をまず発話書き直しモデルで明示的に解決する,疎結合なテキスト・ツー・エンド・フレームワークを提案する。
データ疎性問題に対処する発話書き直しモデルにも,デュアルラーニング手法が提案されている。
わずか数回の書き直しケースで、分離されたメソッドは、SParCとCo両方のデータセットでリリースされた最先端のエンドツーエンドモデルを上回っます。
- 参考スコア(独自算出の注目度): 20.92732277474218
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, Text-to-SQL for multi-turn dialogue has attracted great interest.
Here, the user input of the current turn is parsed into the corresponding SQL
query of the appropriate database, given all previous dialogue history. Current
approaches mostly employ end-to-end models and consequently face two
challenges. First, dialogue history modeling and Text-to-SQL parsing are
implicitly combined, hence it is hard to carry out interpretable analysis and
obtain targeted improvement. Second, SQL annotation of multi-turn dialogue is
very expensive, leading to training data sparsity. In this paper, we propose a
novel decoupled multi-turn Text-to-SQL framework, where an utterance rewrite
model first explicitly solves completion of dialogue context, and then a
single-turn Text-to-SQL parser follows. A dual learning approach is also
proposed for the utterance rewrite model to address the data sparsity problem.
Compared with end-to-end approaches, the proposed decoupled method can achieve
excellent performance without any annotated in-domain data. With just a few
annotated rewrite cases, the decoupled method outperforms the released
state-of-the-art end-to-end models on both SParC and CoSQL datasets.
- Abstract(参考訳): 近年,マルチターン対話のためのText-to-SQLが注目されている。
ここでは、これまでの対話履歴をすべて考慮し、現在のターンのユーザ入力を適切なデータベースの対応するSQLクエリに解析する。
現在のアプローチでは、主にエンドツーエンドモデルを採用しており、2つの課題に直面しています。
まず、対話履歴モデリングとText-to-SQL構文解析を暗黙的に組み合わせることで、解釈可能な解析を行い、目標とする改善を得るのは難しい。
第二に、マルチターンダイアログのSQLアノテーションは非常に高価で、データの分散をトレーニングします。
本稿では,対話コンテキストの補完を発話書き直しモデルで明示的に解き,その後に1ターンのテキスト---SQLパーサが従う,分離された新しいテキスト---SQLフレームワークを提案する。
データ疎性問題に対処する発話書き直しモデルにも,デュアルラーニング手法が提案されている。
提案手法は,エンド・ツー・エンドの手法と比較して,注釈付きドメインデータなしで優れた性能が得られる。
わずかなアノテーション付きリライトケースで、decoupledメソッドは、sparcとcosqlデータセットの両方でリリースされた最先端のエンドツーエンドモデルを上回る。
関連論文リスト
- Exploring the Compositional Generalization in Context Dependent
Text-to-SQL Parsing [14.644212594593919]
この研究は、文脈に依存したテクスト・トゥ・ザ・セサリオにおける作曲の一般化に関する最初の調査である。
実験によると、現在のモデルはすべて、提案されたベンチマークで苦労している。
テキスト・トゥ・ザ・セナリオの合成一般化を改善するために,textttp-align という手法を提案する。
論文 参考訳(メタデータ) (2023-05-29T12:36:56Z) - Wav2SQL: Direct Generalizable Speech-To-SQL Parsing [55.10009651476589]
Speech-to-Spider (S2Spider) は、与えられたデータベースに対する音声質問をsqlクエリに変換することを目的としている。
ケースドシステム間の誤り合成を回避した,最初の直接音声-話者パーシングモデルWav2を提案する。
実験結果から,Wav2は誤差混成を回避し,ベースラインの精度を最大2.5%向上させることで最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-05-21T19:26:46Z) - Augmenting Multi-Turn Text-to-SQL Datasets with Self-Play [46.07002748587857]
我々は、コンテキスト情報を活用して新しいインタラクションを合成するセルフプレイによるトレーニングデータセットの強化について検討する。
本研究では,SParCとCoという2つの広く使われているテキスト・ドメイン・データセットの強いベースラインの精度を向上させることを発見した。
論文 参考訳(メタデータ) (2022-10-21T16:40:07Z) - STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing [64.80483736666123]
文脈依存型テキスト・ツー・パースのための新しい事前学習フレームワークSTARを提案する。
さらに,STARを事前学習するための大規模コンテキスト依存型テキスト対話コーパスを構築した。
大規模な実験により、STARは2つの下流ベンチマークで新しい最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2022-10-21T11:30:07Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - HIE-SQL: History Information Enhanced Network for Context-Dependent
Text-to-SQL Semantic Parsing [1.343950231082215]
ヒストリー発話と最後のsqlクエリの両方からコンテキスト依存情報を利用するヒストリー情報拡張テキスト・トゥ・ザ・アート・モデル(HIE-)を提案する。
本研究では,2つの文脈依存型テキスト・トゥ・ザ・アーティカル・ベンチマークにおいて,HIE-の性能を著しく向上させる手法を提案する。
論文 参考訳(メタデータ) (2022-03-14T11:58:37Z) - S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder
for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。
また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。
スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-03-14T09:49:15Z) - Pay More Attention to History: A Context Modeling Strategy for
Conversational Text-to-SQL [8.038535788630542]
会話型テキスト・ツー・ドメインの最も難解な問題の1つは、マルチターンクエリのセマンティクスをモデル化することである。
本稿では,各ターンの追加による意味変化の明示的モデル化とコンテキスト全体の要約により,より優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2021-12-16T09:41:04Z) - IGSQL: Database Schema Interaction Graph Based Neural Model for
Context-Dependent Text-to-SQL Generation [61.09660709356527]
本稿では,データベーススキーマインタラクショングラフエンコーダを提案し,データベーススキーマ項目の履歴情報を利用する。
ベンチマークSParCおよびCoデータセットを用いて,本モデルの評価を行った。
論文 参考訳(メタデータ) (2020-11-11T12:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。