Fugu-MT 論文翻訳(概要): DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using Bi-Directional Recurrent Neural Networks

論文の概要: DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using Bi-Directional Recurrent Neural Networks

arxiv url: http://arxiv.org/abs/2101.04226v1
Date: Mon, 11 Jan 2021 22:54:39 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-04 14:37:37.071788
Title: DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using Bi-Directional Recurrent Neural Networks
Title（参考訳）: DBTagger:双方向リカレントニューラルネットワークを用いたNLIDBにおけるキーワードマッピングのためのマルチタスク学習
Authors: Arif Usta, Akifhan Karakayali and \"Ozg\"ur Ulusoy
Abstract要約: NLQのPOSタグを利用した新しいディープラーニングに基づく教師付きアプローチを提案する。 8つの異なるデータセットに対するアプローチを評価し、最新の精度結果、平均92.4%$を報告します。
参考スコア（独自算出の注目度）: 0.2578242050187029
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Translating Natural Language Queries (NLQs) to Structured Query Language (SQL) in interfaces deployed in relational databases is a challenging task, which has been widely studied in database community recently. Conventional rule based systems utilize series of solutions as a pipeline to deal with each step of this task, namely stop word filtering, tokenization, stemming/lemmatization, parsing, tagging, and translation. Recent works have mostly focused on the translation step overlooking the earlier steps by using ad-hoc solutions. In the pipeline, one of the most critical and challenging problems is keyword mapping; constructing a mapping between tokens in the query and relational database elements (tables, attributes, values, etc.). We define the keyword mapping problem as a sequence tagging problem, and propose a novel deep learning based supervised approach that utilizes POS tags of NLQs. Our proposed approach, called \textit{DBTagger} (DataBase Tagger), is an end-to-end and schema independent solution, which makes it practical for various relational databases. We evaluate our approach on eight different datasets, and report new state-of-the-art accuracy results, $92.4\%$ on the average. Our results also indicate that DBTagger is faster than its counterparts up to $10000$ times and scalable for bigger databases.
Abstract（参考訳）: リレーショナルデータベースにデプロイされたインタフェースで自然言語クエリ(nlqs)を構造化クエリ言語(sql)に翻訳することは、最近データベースコミュニティで広く研究されている課題である。従来のルールベースのシステムは、一連のソリューションをパイプラインとして、停止語フィルタリング、トークン化、スターリング/レンマティゼーション、パース、タグ付け、翻訳といったタスクの各ステップに対処する。最近の研究は主に、アドホックなソリューションを使って、以前のステップを見下ろす翻訳ステップに焦点を当てている。クエリ内のトークンと関係データベース要素(テーブル、属性、値など)のマッピングを構築する。キーワードマッピング問題をシーケンスタギング問題として定義し,NLQのPOSタグを利用した新しいディープラーニングに基づく教師付きアプローチを提案する。提案するアプローチは,DataBase Taggerと呼ばれるもので,エンドツーエンドでスキーマに依存しないソリューションなので,様々なリレーショナルデータベースに実用的です。 8つの異なるデータセットに対するアプローチを評価し、新しい最先端の精度結果、平均で92.4\%$を報告します。我々の結果は、DBTaggerが最大10000ドル以上の高速で、より大きなデータベースにスケーラブルであることを示している。

関連論文リスト

Monte Carlo Tree Search with Reasoning Path Refinement for Small Language Models in Conversational Text-to-NoSQL [20.156191782890797]
本稿では,自然言語質問,データベース,対話履歴を問う問合せを生成するConversational Text-to-Noタスクを提案する。そこで我々は,クエリ固有の推論機能を備えた小さな言語モデルを実現するフレームワークであるStage-MCTSを提案する。提案手法は最先端の大規模推論モデルより優れ,実行値の一致精度を最大7.93%向上させる。
論文参考訳（メタデータ） (2026-02-13T03:35:38Z)
Multi-turn Natural Language to Graph Query Language Translation [15.249580032219336]
現実的なアプリケーションでは、グラフデータベースとのユーザインタラクションは通常、マルチターン、動的、コンテキスト依存である。シングルターン変換に焦点を当てた研究は、マルチターン対話や複雑なコンテキスト依存に効果的に対応できない。大規模言語モデル(LLM)に基づくマルチターンNL2GQLデータセットの自動構築法を提案する。
論文参考訳（メタデータ） (2025-08-03T17:56:52Z)
UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification [50.59009084277447]
論理生成からスキーマ要素の検索を分離するフレームワークUNJOINを紹介する。最初の段階では、各列をテーブル名でプレフィックスすることで、データベース内のすべてのテーブルの列名を単一のテーブル表現にマージします。第2段階では、クエリは、この単純化されたスキーマに基づいて生成され、JOIN、UNION、リレーショナルロジックを再構築することで、元のスキーマにマップされる。
論文参考訳（メタデータ） (2025-05-23T17:28:43Z)
Bridging the Gap: Transforming Natural Language Questions into SQL Queries via Abstract Query Pattern and Contextual Schema Markup [6.249316460506702]
構造的マッピングギャップと語彙的マッピングギャップの2つの重要なギャップを識別する。 PAS関連は87.9%の実行精度を達成し、BIRDデータセットの64.67%の実行精度を導いた。スパイダーベンチマークの結果は87.9%の精度でスパイダーベンチマークの最先端を新たに設定し、BIRDデータセットで64.67%の精度で結果を導いた。
論文参考訳（メタデータ） (2025-02-20T16:11:27Z)
E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.187832944550453]
E-レポジトリは、直接スキーマリンクと候補述語拡張による課題に対処するために設計された新しいパイプラインである。 E-は、関連するデータベースアイテム(テーブル、列、値)と条件を質問に直接組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。本研究では,従来の研究で広く研究されてきた手法であるスキーマフィルタリングの影響について検討し,先進的な大規模言語モデルと並行して適用した場合のリターンの低下を実証する。
論文参考訳（メタデータ） (2024-09-25T09:02:48Z)
Improving Retrieval-augmented Text-to-SQL with AST-based Ranking and Schema Pruning [10.731045939849125]
本稿では,テキストからセマンティックへの解析に注目する。商用データベースのスキーマのサイズとビジネスインテリジェンスソリューションのデプロイ可能性に関する課題から,入力データベース情報を動的に取得する $textASTReS$ を提案する。
論文参考訳（メタデータ） (2024-07-03T15:55:14Z)
LIST: Learning to Index Spatio-Textual Data for Embedding based Spatial Keyword Queries [53.843367588870585]
リスト K-kNN 空間キーワードクエリ (TkQ) は、空間的およびテキスト的関連性の両方を考慮したランキング関数に基づくオブジェクトのリストを返す。効率的かつ効率的な指標、すなわち高品質なラベルの欠如とバランスの取れない結果を構築する上で、大きな課題が2つある。この2つの課題に対処する新しい擬似ラベル生成手法を開発した。
論文参考訳（メタデータ） (2024-03-12T05:32:33Z)
SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文参考訳（メタデータ） (2023-05-26T21:39:05Z)
Semantic Parsing for Conversational Question Answering over Knowledge Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。本稿では,2つの意味解析手法を提案し,その課題を強調した。私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文参考訳（メタデータ） (2023-01-28T14:45:11Z)
Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge Base and Database [86.03294330305097]
知識ベース(KB)とデータベース(DB)の両方で質問応答(QA)を統一した意味的要素を提案する。フレームワークに不可欠な要素としてプリミティブ(KBのリレーションとエンティティ、テーブル名、列名、DBのセル値)を導入します。生成元を利用して、異なる操作でトップランクプリミティブを変更・構成することで、最終的な論理形式を予測する。
論文参考訳（メタデータ） (2022-11-09T19:33:27Z)
xDBTagger: Explainable Natural Language Interface to Databases Using Keyword Mappings and Schema Graph [0.17188280334580192]
自然言語クエリをインターフェース内の構造化クエリ言語(NLQ)にリレーショナルデータベースに変換することは、難しい作業である。我々は xDBTagger を提案する。xDBTagger は説明可能なハイブリッド翻訳パイプラインで,ユーザがテキストと視覚の両方で行う決定について説明する。 xDBTaggerは精度の点で有効であり、クエリを最先端のパイプラインベースシステムと比較して最大10000倍の効率で変換する。
論文参考訳（メタデータ） (2022-10-07T18:17:09Z)
Semantic Parsing Natural Language into Relational Algebra [4.56877715768796]
データベースへの自然なインターフェース(NLIDB)は、過去数十年で多く研究されてきた。ニューラルディープラーニングの最近の進歩は、一般的なNLIDBシステムを構築する上で有望な方向性をもたらすように思われる。
論文参考訳（メタデータ） (2021-06-25T19:36:02Z)
Multilingual Autoregressive Entity Linking [49.35994386221958]
mGENREはMultilingual Entity Linking問題のためのシーケンス対シーケンスシステムである。与えられた言語で言及すると、mGENREはターゲットエンティティの名前を左から右へ、トークンごとに予測します。提案手法の有効性を3つのMELベンチマーク実験を含む広範囲な評価により示す。
論文参考訳（メタデータ） (2021-03-23T13:25:55Z)
Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。 BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文参考訳（メタデータ） (2020-12-23T12:33:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。