論文の概要: ODIN: A NL2SQL Recommender to Handle Schema Ambiguity
- arxiv url: http://arxiv.org/abs/2505.19302v1
- Date: Sun, 25 May 2025 20:22:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.041828
- Title: ODIN: A NL2SQL Recommender to Handle Schema Ambiguity
- Title(参考訳): ODIN:スキーマの曖昧さを処理するNL2SQLレコメンダ
- Authors: Kapil Vaidya, Abishek Sankararaman, Jialin Ding, Chuan Lei, Xiao Qin, Balakrishnan Narayanaswamy, Tim Kraska,
- Abstract要約: ODINはあいまいなスキーマコンポーネントの異なる解釈に基づいてクエリを生成する。
評価の結果,ODINはベースラインに比べて1.5-2$times$で正しいクエリを生成する可能性が向上した。
- 参考スコア(独自算出の注目度): 21.483551391764944
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: NL2SQL (natural language to SQL) systems translate natural language into SQL queries, allowing users with no technical background to interact with databases and create tools like reports or visualizations. While recent advancements in large language models (LLMs) have significantly improved NL2SQL accuracy, schema ambiguity remains a major challenge in enterprise environments with complex schemas, where multiple tables and columns with semantically similar names often co-exist. To address schema ambiguity, we introduce ODIN, a NL2SQL recommendation engine. Instead of producing a single SQL query given a natural language question, ODIN generates a set of potential SQL queries by accounting for different interpretations of ambiguous schema components. ODIN dynamically adjusts the number of suggestions based on the level of ambiguity, and ODIN learns from user feedback to personalize future SQL query recommendations. Our evaluation shows that ODIN improves the likelihood of generating the correct SQL query by 1.5-2$\times$ compared to baselines.
- Abstract(参考訳): NL2SQL(自然言語からSQL)システムは自然言語をSQLクエリに変換し、技術的バックグラウンドを持たないユーザがデータベースと対話し、レポートや視覚化のようなツールを作成することができる。
大規模言語モデル(LLM)の最近の進歩は、NL2SQLの精度を大幅に向上させたが、複雑なスキーマを持つエンタープライズ環境では、スキーマの曖昧さが大きな課題となっている。
スキーマのあいまいさに対処するために、NL2SQLレコメンデーションエンジンODINを紹介する。
自然言語の質問を与えられた単一のSQLクエリを生成する代わりに、ODINは曖昧なスキーマコンポーネントの異なる解釈を考慮し、潜在的なSQLクエリのセットを生成する。
ODINは曖昧さのレベルに基づいて提案の数を動的に調整し、ODINはユーザのフィードバックから学び、将来のSQLクエリレコメンデーションをパーソナライズする。
我々の評価では、ODINはベースラインに比べて1.5-2$\times$で正しいSQLクエリを生成する可能性を改善する。
関連論文リスト
- Text-to-SQL Domain Adaptation via Human-LLM Collaborative Data Annotation [26.834687657847454]
テキスト-to-sqlモデルは、現実世界のアプリケーションでますます採用されている。
このようなモデルを現実世界にデプロイするには、特定のアプリケーションで使用される高度に専門化されたデータベーススキーマにそれらを適用する必要があることが多い。
既存のtext-to-sqlモデルは、新しいスキーマに適用した場合、大幅なパフォーマンス低下を経験する。
スキーマの進化のための高品質なテキスト間データを継続的に取得することは、現実世界のシナリオでは違法に高価である。
論文 参考訳(メタデータ) (2025-02-21T22:32:35Z) - A Survey of NL2SQL with Large Language Models: Where are we, and where are we going? [32.84561352339466]
我々は,Large Language Models (LLM) を用いたNL2手法のレビューを行う。
LLM時代におけるNL2の研究課題とオープン問題について論じる。
論文 参考訳(メタデータ) (2024-08-09T14:59:36Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Prompting GPT-3.5 for Text-to-SQL with De-semanticization and Skeleton
Retrieval [17.747079214502673]
Text-to-は、自然言語の質問を構造化されたクエリ言語()に変換し、データベースから情報を取得するタスクである。
本稿では,テキスト・トゥ・テキストのための LLM ベースのフレームワークを提案する。
我々は,疑問骨格を抽出する非意味化機構を設計し,その構造的類似性に基づいて類似した例を検索する。
論文 参考訳(メタデータ) (2023-04-26T06:02:01Z) - STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing [64.80483736666123]
文脈依存型テキスト・ツー・パースのための新しい事前学習フレームワークSTARを提案する。
さらに,STARを事前学習するための大規模コンテキスト依存型テキスト対話コーパスを構築した。
大規模な実験により、STARは2つの下流ベンチマークで新しい最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2022-10-21T11:30:07Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z) - Relation Aware Semi-autoregressive Semantic Parsing for NL2SQL [17.605904256822786]
我々は,NL2のバックボーンに適応可能な,半自動意味解析(MODN)フレームワークを提案する。
実験結果とケーススタディから,本モデルはNL2における単語表現の学習に有効であることを示す。
論文 参考訳(メタデータ) (2021-08-02T12:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。