Fugu-MT 論文翻訳(概要): Enhancing Text-to-SQL Translation for Financial System Design

論文の概要: Enhancing Text-to-SQL Translation for Financial System Design

arxiv url: http://arxiv.org/abs/2312.14725v1
Date: Fri, 22 Dec 2023 14:34:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-25 14:55:48.754370
Title: Enhancing Text-to-SQL Translation for Financial System Design
Title（参考訳）: 金融システム設計のためのテキスト-SQL翻訳の強化
Authors: Yewei Song, Saad Ezzini, Xunzhu Tang, Cedric Lothritz, Jacques Klein, Tegawend\'e Bissyand\'e, Andrey Boytsov, Ulrick Ble, Anne Goujon
Abstract要約: 様々なNLPタスクの最先端技術を実現したLarge Language Models (LLMs) について検討する。本稿では,関係クエリ間の類似性を適切に測定する2つの新しい指標を提案する。
参考スコア（独自算出の注目度）: 5.248014305403357
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Text-to-SQL, the task of translating natural language questions into SQL queries, is part of various business processes. Its automation, which is an emerging challenge, will empower software practitioners to seamlessly interact with relational databases using natural language, thereby bridging the gap between business needs and software capabilities. In this paper, we consider Large Language Models (LLMs), which have achieved state of the art for various NLP tasks. Specifically, we benchmark Text-to-SQL performance, the evaluation methodologies, as well as input optimization (e.g., prompting). In light of the empirical observations that we have made, we propose two novel metrics that were designed to adequately measure the similarity between SQL queries. Overall, we share with the community various findings, notably on how to select the right LLM on Text-to-SQL tasks. We further demonstrate that a tree-based edit distance constitutes a reliable metric for assessing the similarity between generated SQL queries and the oracle for benchmarking Text2SQL approaches. This metric is important as it relieves researchers from the need to perform computationally expensive experiments such as executing generated queries as done in prior works. Our work implements financial domain use cases and, therefore contributes to the advancement of Text2SQL systems and their practical adoption in this domain.
Abstract（参考訳）: 自然言語質問をSQLクエリに変換するタスクであるText-to-SQLは、さまざまなビジネスプロセスの一部である。その自動化は新たな課題であり、ソフトウェア実践者が自然言語を使ってリレーショナルデータベースとシームレスに対話できるようにし、ビジネスニーズとソフトウェア能力のギャップを埋める。本稿では,様々なNLPタスクの最先端技術を実現したLarge Language Models (LLMs)について考察する。具体的には、テキストからSQLまでのパフォーマンス、評価手法、および入力最適化(プロンプトなど)をベンチマークする。本稿では,SQLクエリ間の類似性を適切に測定するための2つの新しい指標を提案する。全体としては,テキストからsqlへのタスクで適切なllmを選択する方法など,さまざまな調査結果をコミュニティと共有しています。さらに、木ベースの編集距離が、生成したSQLクエリとText2SQLアプローチのベンチマークのオラクルとの類似性を評価するための信頼性の高い指標であることを示す。このメトリクスは、研究者が事前の作業で生成されたクエリを実行するなど、計算コストのかかる実験を行う必要がなくなるため、重要である。本研究は、金融ドメインのユースケースを実装し、text2sqlシステムの進歩と、このドメインでの実用化に寄与する。

関連論文リスト

Monte Carlo Tree Search with Reasoning Path Refinement for Small Language Models in Conversational Text-to-NoSQL [20.156191782890797]
本稿では,自然言語質問,データベース,対話履歴を問う問合せを生成するConversational Text-to-Noタスクを提案する。そこで我々は,クエリ固有の推論機能を備えた小さな言語モデルを実現するフレームワークであるStage-MCTSを提案する。提案手法は最先端の大規模推論モデルより優れ,実行値の一致精度を最大7.93%向上させる。
論文参考訳（メタデータ） (2026-02-13T03:35:38Z)
Bridging the Gap: Enabling Natural Language Queries for NoSQL Databases through Text-to-NoSQL Translation [25.638927795540454]
自然言語クエリをアクセス可能なクエリに変換することを目的としたText-to-Noタスクを導入する。この分野での研究を促進するために、我々はTEND(Text-to-Noデータセットのショートインターフェース)という、このタスクのための大規模かつオープンソースのデータセットをリリースした。また,SLM(Small Language Model)支援とRAG(Retrieval-augmented Generation)支援の多段階フレームワークSMARTを設計した。
論文参考訳（メタデータ） (2025-02-16T17:01:48Z)
A Survey of Large Language Model-Based Generative AI for Text-to-SQL: Benchmarks, Applications, Use Cases, and Challenges [0.7889270818022226]
自然言語クエリを構造化クエリ言語(技術)に変換することで,データベースとのスムーズな対話を容易にするこの調査は、AI駆動のテキスト・ツー・ワンシステムの進化の概要を提供する。医療、教育、金融といった分野におけるテキスト・ツー・ワンの適用について検討する。
論文参考訳（メタデータ） (2024-12-06T17:36:28Z)
Enhancing LLM Fine-tuning for Text-to-SQLs by SQL Quality Measurement [1.392448435105643]
Text-to-sにより、専門家でないユーザは、自然言語クエリを使用してデータベースから要求された情報を取得することができる。 GPT4やT5のような現在の最先端(SOTA)モデルは、BIRDのような大規模ベンチマークで素晴らしいパフォーマンスを示している。本稿では,テキスト・ツー・ス・パフォーマンスを向上させるためにSQL Qualityのみを必要とする新しい手法を提案する。
論文参考訳（メタデータ） (2024-10-02T17:21:51Z)
PTD-SQL: Partitioning and Targeted Drilling with LLMs in Text-to-SQL [54.304872649870575]
大規模言語モデル(LLM)は、テキスト・トゥ・センス・タスクの強力なツールとして登場した。本研究では,クエリグループパーティショニングを用いることで,単一問題に特有の思考プロセスの学習に集中できることを示す。
論文参考訳（メタデータ） (2024-09-21T09:33:14Z)
A Survey on Employing Large Language Models for Text-to-SQL Tasks [9.527891544418805]
リレーショナルデータベースにおけるデータ量の増加は、ユーザがデータにアクセスして分析する上での課題を引き起こします。 Text-to-sql (Text2) は自然言語処理(NLP)技術を用いて自然言語のintsqlクエリを変換することで問題を解決する。 LLM(Large Language Models)の開発により、LLMベースのText2メソッドが出現した。
論文参考訳（メタデータ） (2024-07-21T14:48:23Z)
Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL [15.75829309721909]
自然言語の質問(text-to-)から正確なsqlを生成することは、長年にわたる課題である。 PLMはテキスト・ツー・タスクに利用され、有望な性能を実現している。近年,大規模言語モデル (LLM) は自然言語理解において重要な機能を示している。
論文参考訳（メタデータ） (2024-06-12T17:13:17Z)
Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation [76.76046657162306]
大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。大規模言語モデル(LLM)はテキスト・ツー・タスクの新しいパラダイムとして登場した。
論文参考訳（メタデータ） (2023-08-29T14:59:54Z)
SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文参考訳（メタデータ） (2023-05-26T21:39:05Z)
UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文参考訳（メタデータ） (2023-05-25T17:19:52Z)
A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文参考訳（メタデータ） (2022-08-29T14:24:13Z)
"What Do You Mean by That?" A Parser-Independent Interactive Approach for Enhancing Text-to-SQL [49.85635994436742]
ループ内に人間を包含し,複数質問を用いてユーザと対話する,新規非依存型対話型アプローチ(PIIA)を提案する。 PIIAは、シミュレーションと人的評価の両方を用いて、限られたインタラクションターンでテキストとドメインのパフォーマンスを向上させることができる。
論文参考訳（メタデータ） (2020-11-09T02:14:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。