Fugu-MT 論文翻訳(概要): ODIN: A NL2SQL Recommender to Handle Schema Ambiguity

論文の概要: ODIN: A NL2SQL Recommender to Handle Schema Ambiguity

arxiv url: http://arxiv.org/abs/2505.19302v1
Date: Sun, 25 May 2025 20:22:32 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-27 16:58:43.041828
Title: ODIN: A NL2SQL Recommender to Handle Schema Ambiguity
Title（参考訳）: ODIN:スキーマの曖昧さを処理するNL2SQLレコメンダ
Authors: Kapil Vaidya, Abishek Sankararaman, Jialin Ding, Chuan Lei, Xiao Qin, Balakrishnan Narayanaswamy, Tim Kraska,
Abstract要約: ODINはあいまいなスキーマコンポーネントの異なる解釈に基づいてクエリを生成する。評価の結果,ODINはベースラインに比べて1.5-2$times$で正しいクエリを生成する可能性が向上した。
参考スコア（独自算出の注目度）: 21.483551391764944
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: NL2SQL (natural language to SQL) systems translate natural language into SQL queries, allowing users with no technical background to interact with databases and create tools like reports or visualizations. While recent advancements in large language models (LLMs) have significantly improved NL2SQL accuracy, schema ambiguity remains a major challenge in enterprise environments with complex schemas, where multiple tables and columns with semantically similar names often co-exist. To address schema ambiguity, we introduce ODIN, a NL2SQL recommendation engine. Instead of producing a single SQL query given a natural language question, ODIN generates a set of potential SQL queries by accounting for different interpretations of ambiguous schema components. ODIN dynamically adjusts the number of suggestions based on the level of ambiguity, and ODIN learns from user feedback to personalize future SQL query recommendations. Our evaluation shows that ODIN improves the likelihood of generating the correct SQL query by 1.5-2$\times$ compared to baselines.
Abstract（参考訳）: NL2SQL(自然言語からSQL)システムは自然言語をSQLクエリに変換し、技術的バックグラウンドを持たないユーザがデータベースと対話し、レポートや視覚化のようなツールを作成することができる。大規模言語モデル(LLM)の最近の進歩は、NL2SQLの精度を大幅に向上させたが、複雑なスキーマを持つエンタープライズ環境では、スキーマの曖昧さが大きな課題となっている。スキーマのあいまいさに対処するために、NL2SQLレコメンデーションエンジンODINを紹介する。自然言語の質問を与えられた単一のSQLクエリを生成する代わりに、ODINは曖昧なスキーマコンポーネントの異なる解釈を考慮し、潜在的なSQLクエリのセットを生成する。 ODINは曖昧さのレベルに基づいて提案の数を動的に調整し、ODINはユーザのフィードバックから学び、将来のSQLクエリレコメンデーションをパーソナライズする。我々の評価では、ODINはベースラインに比べて1.5-2$\times$で正しいSQLクエリを生成する可能性を改善する。

関連論文リスト

Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文参考訳（メタデータ） (2025-11-26T13:52:50Z)
LLMSQL: Upgrading WikiSQL for the LLM Era of Text-to-SQL [0.2799896314754614]
本稿では,Wiki の体系的な改訂と変換である LLM について述べる。これらのエラーを分類し、クリーニングと再アノテーションのための自動メソッドを実装します。 LLMはアップデートとして機能するのではなく、LLM対応のベンチマークとして導入された。
論文参考訳（メタデータ） (2025-09-27T15:08:43Z)
TailorSQL: An NL2SQL System Tailored to Your Query Workload [16.48291142955493]
最先端のNL2技術は典型的には、データベース固有の情報を取得することによって翻訳を行う。過去のクエリ処理における情報を活用するNL2システムであるTailorを紹介する。 Tailorは、標準化されたベンチマークの実行精度を最大2$times$改善する。
論文参考訳（メタデータ） (2025-05-29T03:27:22Z)
Text-to-SQL Domain Adaptation via Human-LLM Collaborative Data Annotation [26.834687657847454]
テキスト-to-sqlモデルは、現実世界のアプリケーションでますます採用されている。このようなモデルを現実世界にデプロイするには、特定のアプリケーションで使用される高度に専門化されたデータベーススキーマにそれらを適用する必要があることが多い。既存のtext-to-sqlモデルは、新しいスキーマに適用した場合、大幅なパフォーマンス低下を経験する。スキーマの進化のための高品質なテキスト間データを継続的に取得することは、現実世界のシナリオでは違法に高価である。
論文参考訳（メタデータ） (2025-02-21T22:32:35Z)
Is Long Context All You Need? Leveraging LLM's Extended Context for NL2SQL [1.1694928565998557]
大きな言語モデル(LLM)は、さまざまな自然言語処理タスクにまたがる印象的な機能を示している。この意味的曖昧な問題に対する一つのアプローチは、より十分な文脈情報を提供することである。長いコンテキストLLMは堅牢であり、拡張されたコンテキスト情報では失われないことを示す。
論文参考訳（メタデータ） (2025-01-21T18:52:15Z)
A Survey of NL2SQL with Large Language Models: Where are we, and where are we going? [32.84561352339466]
我々は,Large Language Models (LLM) を用いたNL2手法のレビューを行う。 LLM時代におけるNL2の研究課題とオープン問題について論じる。
論文参考訳（メタデータ） (2024-08-09T14:59:36Z)
DBCopilot: Natural Language Querying over Massive Databases via Schema Routing [47.009638761948466]
本稿では,DBCopilotについて述べる。DBCopilotは,大規模データベースをルーティングするためのコンパクトで柔軟なコピロットモデルを用いて,課題に対処するフレームワークである。このフレームワークは、単一の軽量な微分可能な検索インデックスを使用して、大規模データベーススキーマのセマンティックマッピングを構築し、自然言語質問を目的のデータベースやテーブルに関連付け検索方法でナビゲートする。
論文参考訳（メタデータ） (2023-12-06T12:37:28Z)
UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文参考訳（メタデータ） (2023-05-25T17:19:52Z)
Prompting GPT-3.5 for Text-to-SQL with De-semanticization and Skeleton Retrieval [17.747079214502673]
Text-to-は、自然言語の質問を構造化されたクエリ言語()に変換し、データベースから情報を取得するタスクである。本稿では,テキスト・トゥ・テキストのための LLM ベースのフレームワークを提案する。我々は,疑問骨格を抽出する非意味化機構を設計し,その構造的類似性に基づいて類似した例を検索する。
論文参考訳（メタデータ） (2023-04-26T06:02:01Z)
STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing [64.80483736666123]
文脈依存型テキスト・ツー・パースのための新しい事前学習フレームワークSTARを提案する。さらに,STARを事前学習するための大規模コンテキスト依存型テキスト対話コーパスを構築した。大規模な実験により、STARは2つの下流ベンチマークで新しい最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2022-10-21T11:30:07Z)
A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文参考訳（メタデータ） (2022-08-29T14:24:13Z)
Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文参考訳（メタデータ） (2021-12-12T20:02:42Z)
Relation Aware Semi-autoregressive Semantic Parsing for NL2SQL [17.605904256822786]
我々は,NL2のバックボーンに適応可能な,半自動意味解析(MODN)フレームワークを提案する。実験結果とケーススタディから,本モデルはNL2における単語表現の学習に有効であることを示す。
論文参考訳（メタデータ） (2021-08-02T12:21:08Z)
Photon: A Robust Cross-Domain Text-to-SQL System [189.1405317853752]
私たちは、マッピングを即座に決定できない自然言語入力にフラグを付けることができる、堅牢でモジュール化されたクロスドメインなNLIDBPhotonを紹介します。提案手法は,翻訳不能なユーザ入力に対して,テキストからネイティブシステムへのロバストさを効果的に向上させる。
論文参考訳（メタデータ） (2020-07-30T07:44:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。