論文の概要: DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using
Bi-Directional Recurrent Neural Networks
- arxiv url: http://arxiv.org/abs/2101.04226v1
- Date: Mon, 11 Jan 2021 22:54:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 14:37:37.071788
- Title: DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using
Bi-Directional Recurrent Neural Networks
- Title(参考訳): DBTagger:双方向リカレントニューラルネットワークを用いたNLIDBにおけるキーワードマッピングのためのマルチタスク学習
- Authors: Arif Usta, Akifhan Karakayali and \"Ozg\"ur Ulusoy
- Abstract要約: NLQのPOSタグを利用した新しいディープラーニングに基づく教師付きアプローチを提案する。
8つの異なるデータセットに対するアプローチを評価し、最新の精度結果、平均92.4%$を報告します。
- 参考スコア(独自算出の注目度): 0.2578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Translating Natural Language Queries (NLQs) to Structured Query Language
(SQL) in interfaces deployed in relational databases is a challenging task,
which has been widely studied in database community recently. Conventional rule
based systems utilize series of solutions as a pipeline to deal with each step
of this task, namely stop word filtering, tokenization, stemming/lemmatization,
parsing, tagging, and translation. Recent works have mostly focused on the
translation step overlooking the earlier steps by using ad-hoc solutions. In
the pipeline, one of the most critical and challenging problems is keyword
mapping; constructing a mapping between tokens in the query and relational
database elements (tables, attributes, values, etc.). We define the keyword
mapping problem as a sequence tagging problem, and propose a novel deep
learning based supervised approach that utilizes POS tags of NLQs. Our proposed
approach, called \textit{DBTagger} (DataBase Tagger), is an end-to-end and
schema independent solution, which makes it practical for various relational
databases. We evaluate our approach on eight different datasets, and report new
state-of-the-art accuracy results, $92.4\%$ on the average. Our results also
indicate that DBTagger is faster than its counterparts up to $10000$ times and
scalable for bigger databases.
- Abstract(参考訳): リレーショナルデータベースにデプロイされたインタフェースで自然言語クエリ(nlqs)を構造化クエリ言語(sql)に翻訳することは、最近データベースコミュニティで広く研究されている課題である。
従来のルールベースのシステムは、一連のソリューションをパイプラインとして、停止語フィルタリング、トークン化、スターリング/レンマティゼーション、パース、タグ付け、翻訳といったタスクの各ステップに対処する。
最近の研究は主に、アドホックなソリューションを使って、以前のステップを見下ろす翻訳ステップに焦点を当てている。
クエリ内のトークンと関係データベース要素(テーブル、属性、値など)のマッピングを構築する。
キーワードマッピング問題をシーケンスタギング問題として定義し,NLQのPOSタグを利用した新しいディープラーニングに基づく教師付きアプローチを提案する。
提案するアプローチは,DataBase Taggerと呼ばれるもので,エンドツーエンドでスキーマに依存しないソリューションなので,様々なリレーショナルデータベースに実用的です。
8つの異なるデータセットに対するアプローチを評価し、新しい最先端の精度結果、平均で92.4\%$を報告します。
我々の結果は、DBTaggerが最大10000ドル以上の高速で、より大きなデータベースにスケーラブルであることを示している。
関連論文リスト
- Adapt and Decompose: Efficient Generalization of Text-to-SQL via Domain
Adapted Least-To-Most Prompting [17.76680432249867]
テキスト・ツー・セマンティック・パーシングのクロスドメインとクロスコンポジションの一般化は難しい課題である。
既存のソリューションは、自然言語(NL)テストクエリ毎に実行時のプロンプトを合成するために、トレーニングセットから少数ショット例の推論時検索に依存している。
対照的に、トレーニングデータから最小数ショットのセットをオフラインでサンプリングするアルゴリズムを考案する。
論文 参考訳(メタデータ) (2023-08-01T05:31:36Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge
Base and Database [86.03294330305097]
知識ベース(KB)とデータベース(DB)の両方で質問応答(QA)を統一した意味的要素を提案する。
フレームワークに不可欠な要素としてプリミティブ(KBのリレーションとエンティティ、テーブル名、列名、DBのセル値)を導入します。
生成元を利用して、異なる操作でトップランクプリミティブを変更・構成することで、最終的な論理形式を予測する。
論文 参考訳(メタデータ) (2022-11-09T19:33:27Z) - STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing [64.80483736666123]
文脈依存型テキスト・ツー・パースのための新しい事前学習フレームワークSTARを提案する。
さらに,STARを事前学習するための大規模コンテキスト依存型テキスト対話コーパスを構築した。
大規模な実験により、STARは2つの下流ベンチマークで新しい最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2022-10-21T11:30:07Z) - xDBTagger: Explainable Natural Language Interface to Databases Using
Keyword Mappings and Schema Graph [0.17188280334580192]
自然言語クエリをインターフェース内の構造化クエリ言語(NLQ)にリレーショナルデータベースに変換することは、難しい作業である。
我々は xDBTagger を提案する。xDBTagger は説明可能なハイブリッド翻訳パイプラインで,ユーザがテキストと視覚の両方で行う決定について説明する。
xDBTaggerは精度の点で有効であり、クエリを最先端のパイプラインベースシステムと比較して最大10000倍の効率で変換する。
論文 参考訳(メタデータ) (2022-10-07T18:17:09Z) - Semantic Parsing Natural Language into Relational Algebra [4.56877715768796]
データベースへの自然なインターフェース(NLIDB)は、過去数十年で多く研究されてきた。
ニューラルディープラーニングの最近の進歩は、一般的なNLIDBシステムを構築する上で有望な方向性をもたらすように思われる。
論文 参考訳(メタデータ) (2021-06-25T19:36:02Z) - Multilingual Autoregressive Entity Linking [49.35994386221958]
mGENREはMultilingual Entity Linking問題のためのシーケンス対シーケンスシステムである。
与えられた言語で言及すると、mGENREはターゲットエンティティの名前を左から右へ、トークンごとに予測します。
提案手法の有効性を3つのMELベンチマーク実験を含む広範囲な評価により示す。
論文 参考訳(メタデータ) (2021-03-23T13:25:55Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z) - Keyword-Attentive Deep Semantic Matching [1.8416014644193064]
本稿では,深いセマンティックマッチングを改善するためのキーワード付きアプローチを提案する。
まず、大きなコーパスからのドメインタグを利用して、ドメインを拡張したキーワード辞書を生成する。
モデル学習中,入力ペア間のキーワードカバレッジに基づく新しいネガティブサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-03-11T10:18:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。