論文の概要: DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using
Bi-Directional Recurrent Neural Networks
- arxiv url: http://arxiv.org/abs/2101.04226v1
- Date: Mon, 11 Jan 2021 22:54:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 14:37:37.071788
- Title: DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using
Bi-Directional Recurrent Neural Networks
- Title(参考訳): DBTagger:双方向リカレントニューラルネットワークを用いたNLIDBにおけるキーワードマッピングのためのマルチタスク学習
- Authors: Arif Usta, Akifhan Karakayali and \"Ozg\"ur Ulusoy
- Abstract要約: NLQのPOSタグを利用した新しいディープラーニングに基づく教師付きアプローチを提案する。
8つの異なるデータセットに対するアプローチを評価し、最新の精度結果、平均92.4%$を報告します。
- 参考スコア(独自算出の注目度): 0.2578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Translating Natural Language Queries (NLQs) to Structured Query Language
(SQL) in interfaces deployed in relational databases is a challenging task,
which has been widely studied in database community recently. Conventional rule
based systems utilize series of solutions as a pipeline to deal with each step
of this task, namely stop word filtering, tokenization, stemming/lemmatization,
parsing, tagging, and translation. Recent works have mostly focused on the
translation step overlooking the earlier steps by using ad-hoc solutions. In
the pipeline, one of the most critical and challenging problems is keyword
mapping; constructing a mapping between tokens in the query and relational
database elements (tables, attributes, values, etc.). We define the keyword
mapping problem as a sequence tagging problem, and propose a novel deep
learning based supervised approach that utilizes POS tags of NLQs. Our proposed
approach, called \textit{DBTagger} (DataBase Tagger), is an end-to-end and
schema independent solution, which makes it practical for various relational
databases. We evaluate our approach on eight different datasets, and report new
state-of-the-art accuracy results, $92.4\%$ on the average. Our results also
indicate that DBTagger is faster than its counterparts up to $10000$ times and
scalable for bigger databases.
- Abstract(参考訳): リレーショナルデータベースにデプロイされたインタフェースで自然言語クエリ(nlqs)を構造化クエリ言語(sql)に翻訳することは、最近データベースコミュニティで広く研究されている課題である。
従来のルールベースのシステムは、一連のソリューションをパイプラインとして、停止語フィルタリング、トークン化、スターリング/レンマティゼーション、パース、タグ付け、翻訳といったタスクの各ステップに対処する。
最近の研究は主に、アドホックなソリューションを使って、以前のステップを見下ろす翻訳ステップに焦点を当てている。
クエリ内のトークンと関係データベース要素(テーブル、属性、値など)のマッピングを構築する。
キーワードマッピング問題をシーケンスタギング問題として定義し,NLQのPOSタグを利用した新しいディープラーニングに基づく教師付きアプローチを提案する。
提案するアプローチは,DataBase Taggerと呼ばれるもので,エンドツーエンドでスキーマに依存しないソリューションなので,様々なリレーショナルデータベースに実用的です。
8つの異なるデータセットに対するアプローチを評価し、新しい最先端の精度結果、平均で92.4\%$を報告します。
我々の結果は、DBTaggerが最大10000ドル以上の高速で、より大きなデータベースにスケーラブルであることを示している。
関連論文リスト
- E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.187832944550453]
E-レポジトリは、直接スキーマリンクと候補述語拡張による課題に対処するために設計された新しいパイプラインである。
E-は、関連するデータベースアイテム(テーブル、列、値)と条件を質問に直接組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。
本研究では,従来の研究で広く研究されてきた手法であるスキーマフィルタリングの影響について検討し,先進的な大規模言語モデルと並行して適用した場合のリターンの低下を実証する。
論文 参考訳(メタデータ) (2024-09-25T09:02:48Z) - Improving Retrieval-augmented Text-to-SQL with AST-based Ranking and Schema Pruning [10.731045939849125]
本稿では,テキストからセマンティックへの解析に注目する。
商用データベースのスキーマのサイズとビジネスインテリジェンスソリューションのデプロイ可能性に関する課題から,入力データベース情報を動的に取得する $textASTReS$ を提案する。
論文 参考訳(メタデータ) (2024-07-03T15:55:14Z) - LIST: Learning to Index Spatio-Textual Data for Embedding based Spatial Keyword Queries [53.843367588870585]
リスト K-kNN 空間キーワードクエリ (TkQ) は、空間的およびテキスト的関連性の両方を考慮したランキング関数に基づくオブジェクトのリストを返す。
効率的かつ効率的な指標、すなわち高品質なラベルの欠如とバランスの取れない結果を構築する上で、大きな課題が2つある。
この2つの課題に対処する新しい擬似ラベル生成手法を開発した。
論文 参考訳(メタデータ) (2024-03-12T05:32:33Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge
Base and Database [86.03294330305097]
知識ベース(KB)とデータベース(DB)の両方で質問応答(QA)を統一した意味的要素を提案する。
フレームワークに不可欠な要素としてプリミティブ(KBのリレーションとエンティティ、テーブル名、列名、DBのセル値)を導入します。
生成元を利用して、異なる操作でトップランクプリミティブを変更・構成することで、最終的な論理形式を予測する。
論文 参考訳(メタデータ) (2022-11-09T19:33:27Z) - xDBTagger: Explainable Natural Language Interface to Databases Using
Keyword Mappings and Schema Graph [0.17188280334580192]
自然言語クエリをインターフェース内の構造化クエリ言語(NLQ)にリレーショナルデータベースに変換することは、難しい作業である。
我々は xDBTagger を提案する。xDBTagger は説明可能なハイブリッド翻訳パイプラインで,ユーザがテキストと視覚の両方で行う決定について説明する。
xDBTaggerは精度の点で有効であり、クエリを最先端のパイプラインベースシステムと比較して最大10000倍の効率で変換する。
論文 参考訳(メタデータ) (2022-10-07T18:17:09Z) - Semantic Parsing Natural Language into Relational Algebra [4.56877715768796]
データベースへの自然なインターフェース(NLIDB)は、過去数十年で多く研究されてきた。
ニューラルディープラーニングの最近の進歩は、一般的なNLIDBシステムを構築する上で有望な方向性をもたらすように思われる。
論文 参考訳(メタデータ) (2021-06-25T19:36:02Z) - Multilingual Autoregressive Entity Linking [49.35994386221958]
mGENREはMultilingual Entity Linking問題のためのシーケンス対シーケンスシステムである。
与えられた言語で言及すると、mGENREはターゲットエンティティの名前を左から右へ、トークンごとに予測します。
提案手法の有効性を3つのMELベンチマーク実験を含む広範囲な評価により示す。
論文 参考訳(メタデータ) (2021-03-23T13:25:55Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。