論文の概要: ORANGE: An Online Reflection ANd GEneration framework with Domain Knowledge for Text-to-SQL
- arxiv url: http://arxiv.org/abs/2511.00985v2
- Date: Tue, 04 Nov 2025 17:28:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.014684
- Title: ORANGE: An Online Reflection ANd GEneration framework with Domain Knowledge for Text-to-SQL
- Title(参考訳): ORANGE: テキストからSQLへのドメイン知識を備えたオンラインリフレクションANd GEnerationフレームワーク
- Authors: Yiwen Jiao, Tonghui Ren, Yuche Gao, Zhenying He, Yinan Jing, Kai Zhang, X. Sean Wang,
- Abstract要約: 大規模言語モデル (LLM) は、自然言語 tosql の翻訳において顕著な進歩を示している。
データベースの一般的な知識とドメイン固有のセマンティクスの間には、重要なセマンティクスギャップが持続する。
翻訳ログからクエリを解析することでデータベース固有の知識ベースを構築するオンラインの自己進化フレームワークであるOrangeを紹介する。
- 参考スコア(独自算出の注目度): 8.241433772695018
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have demonstrated remarkable progress in translating natural language to SQL, but a significant semantic gap persists between their general knowledge and domain-specific semantics of databases. Historical translation logs constitute a rich source of this missing in-domain knowledge, where SQL queries inherently encapsulate real-world usage patterns of database schema. Existing methods primarily enhance the reasoning process for individual translations but fail to accumulate in-domain knowledge from past translations. We introduce ORANGE, an online self-evolutionary framework that constructs database-specific knowledge bases by parsing SQL queries from translation logs. By accumulating in-domain knowledge that contains schema and data semantics, ORANGE progressively reduces the semantic gap and enhances the accuracy of subsequent SQL translations. To ensure reliability, we propose a novel nested Chain-of-Thought SQL-to-Text strategy with tuple-semantic tracking, which reduces semantic errors during knowledge generation. Experiments on multiple benchmarks confirm the practicality of ORANGE, demonstrating its effectiveness for real-world Text-to-SQL deployment, particularly in handling complex and domain-specific queries.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自然言語をSQLに翻訳する際、顕著な進歩を見せている。
SQLクエリは本質的に、データベーススキーマの実際の使用パターンをカプセル化しています。
既存の手法は主に個々の翻訳の推論プロセスを強化するが、過去の翻訳からドメイン内の知識を蓄積することができない。
翻訳ログからSQLクエリを解析することでデータベース固有の知識ベースを構築するオンラインの自己進化フレームワークであるORANGEを紹介した。
スキーマとデータセマンティクスを含むドメイン内の知識を蓄積することにより、ORANGEはセマンティクスのギャップを徐々に減らし、その後のSQL翻訳の精度を高める。
信頼性を確保するため,タプル・セマンティック・トラッキングを用いた新しいネスト型SQL-to-Text戦略を提案し,知識生成時の意味的誤りを低減する。
複数のベンチマークの実験により、ORANGEの実用性が確認され、特に複雑なクエリやドメイン固有のクエリを扱う実世界のText-to-SQLデプロイメントの有効性が実証された。
関連論文リスト
- Retrieval and Augmentation of Domain Knowledge for Text-to-SQL Semantic Parsing [28.56221748194599]
本稿では,構造化ドメインステートメントをデータベースレベルで関連付けるための体系的なフレームワークを提案する。
本稿では,サブストリングレベルマッチングを用いたユーザクエリに対して,関連する構造化ドメイン文の検索を行う。
論文 参考訳(メタデータ) (2025-10-01T04:01:17Z) - End-to-End Text-to-SQL with Dataset Selection: Leveraging LLMs for Adaptive Query Generation [6.5390580456423555]
従来のアプローチでは、直接変換タスクとしてテキストからクエリをモデル化する。
大規模言語モデル(LLM)の最近の進歩は翻訳精度を大幅に改善した。
本稿では,ユーザの意図するデータベースを識別する3段階のエンドツーエンドテキスト・ツー・エンド・フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-08T15:16:36Z) - RASL: Retrieval Augmented Schema Linking for Massive Database Text-to-SQL [1.3654846342364308]
本稿では,データベーススキーマとメタデータを個別のセマンティック単位に分解するコンポーネントベースの検索アーキテクチャを提案する。
我々のソリューションは、高度な微調整をせずに、多様なエンタープライズ環境にまたがる実用的なテキスト・インタフェースを実現する。
論文 参考訳(メタデータ) (2025-07-30T21:09:47Z) - Large Language Models are Good Relational Learners [55.40941576497973]
本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。
従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文 参考訳(メタデータ) (2025-06-06T04:07:55Z) - Knowledge Base Construction for Knowledge-Augmented Text-to-SQL [37.87911346522774]
本稿では,与えられたクエリに必要な知識を生成する基礎となる知識源であるテキスト・ツー・ワンの知識基盤を構築することを提案する。
私たちの知識ベースは包括的であり、利用可能なすべての質問と関連するデータベーススキーマの組み合わせに基づいて構築されます。
重なり合うデータベースシナリオと非重なり合うデータベースシナリオの両方を考慮して、複数のテキストから1つのデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2025-05-28T08:17:58Z) - Datrics Text2SQL: A Framework for Natural Language to SQL Query Generation [0.0]
本稿では,構造化ドキュメンテーション,サンプルベース学習,ドメイン固有のルールを活用することで,正確なsqlクエリを生成するためのRAG(Retrieval-Augmented Generation)ベースのフレームワークを提案する。
アーキテクチャ、トレーニング方法論、検索ロジックについて詳述し、システムがどのようにユーザ意図とデータベース構造の間のギャップを、専門知識を必要とせずに埋めるかを強調した。
論文 参考訳(メタデータ) (2025-04-03T21:09:59Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers [61.48159785138462]
本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。
5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-09-14T06:27:51Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic
Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。
BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。
本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文 参考訳(メタデータ) (2020-12-23T12:33:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。