論文の概要: RASL: Retrieval Augmented Schema Linking for Massive Database Text-to-SQL
- arxiv url: http://arxiv.org/abs/2507.23104v1
- Date: Wed, 30 Jul 2025 21:09:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:08.729808
- Title: RASL: Retrieval Augmented Schema Linking for Massive Database Text-to-SQL
- Title(参考訳): RASL: 大規模データベーステキストからSQLへの検索拡張スキーマリンク
- Authors: Jeffrey Eben, Aitzaz Ahmad, Stephen Lau,
- Abstract要約: 本稿では,データベーススキーマとメタデータを個別のセマンティック単位に分解するコンポーネントベースの検索アーキテクチャを提案する。
我々のソリューションは、高度な微調整をせずに、多様なエンタープライズ環境にまたがる実用的なテキスト・インタフェースを実現する。
- 参考スコア(独自算出の注目度): 1.3654846342364308
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite advances in large language model (LLM)-based natural language interfaces for databases, scaling to enterprise-level data catalogs remains an under-explored challenge. Prior works addressing this challenge rely on domain-specific fine-tuning - complicating deployment - and fail to leverage important semantic context contained within database metadata. To address these limitations, we introduce a component-based retrieval architecture that decomposes database schemas and metadata into discrete semantic units, each separately indexed for targeted retrieval. Our approach prioritizes effective table identification while leveraging column-level information, ensuring the total number of retrieved tables remains within a manageable context budget. Experiments demonstrate that our method maintains high recall and accuracy, with our system outperforming baselines over massive databases with varying structure and available metadata. Our solution enables practical text-to-SQL systems deployable across diverse enterprise settings without specialized fine-tuning, addressing a critical scalability gap in natural language database interfaces.
- Abstract(参考訳): データベースのための大規模言語モデル(LLM)ベースの自然言語インターフェースの進歩にもかかわらず、エンタープライズレベルのデータカタログへのスケーリングは、まだ未調査の課題である。
この課題に対処する以前の作業は、ドメイン固有の微調整(デプロイメントの複雑化)に依存しており、データベースメタデータに含まれる重要なセマンティックコンテキストを活用できない。
これらの制約に対処するために、コンポーネントベースの検索アーキテクチャを導入し、データベーススキーマとメタデータを個別のセマンティックユニットに分解し、それぞれがターゲット検索のために個別にインデックス付けする。
提案手法は,列レベルの情報を活用しながら有効なテーブル識別を優先し,検索したテーブルの総数が管理可能なコンテキスト予算内に留まることを保証している。
実験により,本手法は,構造やメタデータの異なる大規模データベース上でのベースラインよりも優れており,高いリコールと精度を維持していることが示された。
我々のソリューションは、自然言語データベースインタフェースにおける重要なスケーラビリティギャップに対処しながら、特別な微調整をすることなく、多様なエンタープライズ環境にまたがる実用的なテキスト-SQLシステムのデプロイを可能にする。
関連論文リスト
- Large Language Models are Good Relational Learners [55.40941576497973]
本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。
従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文 参考訳(メタデータ) (2025-06-06T04:07:55Z) - DB-Explore: Automated Database Exploration and Instruction Synthesis for Text-to-SQL [18.915121803834698]
大規模言語モデルとデータベースの知識を体系的に整合させる新しいフレームワークであるDB-Exploreを提案する。
我々のフレームワークは、多様なサンプリング戦略と自動命令生成を通じて、包括的なデータベース理解を可能にする。
論文 参考訳(メタデータ) (2025-03-06T20:46:43Z) - Relational Database Augmented Large Language Model [59.38841050766026]
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクに優れる。
彼らは、トレーニングや教師付き微調整プロセスを通じてのみ、新しい知識を取り入れることができる。
この正確で最新のプライベート情報は、通常リレーショナルデータベースに格納される。
論文 参考訳(メタデータ) (2024-07-21T06:19:10Z) - CHESS: Contextual Harnessing for Efficient SQL Synthesis [1.9506402593665235]
効率的でスケーラブルなテキスト・ツー・クエリのためのフレームワークであるCHESSを紹介します。
特殊エージェントは4つあり、それぞれが上記の課題の1つをターゲットにしている。
私たちのフレームワークは、さまざまなデプロイメント制約に適応する機能を提供する。
論文 参考訳(メタデータ) (2024-05-27T01:54:16Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - DBCopilot: Natural Language Querying over Massive Databases via Schema Routing [47.009638761948466]
本稿では,DBCopilotについて述べる。DBCopilotは,大規模データベースをルーティングするためのコンパクトで柔軟なコピロットモデルを用いて,課題に対処するフレームワークである。
このフレームワークは、単一の軽量な微分可能な検索インデックスを使用して、大規模データベーススキーマのセマンティックマッピングを構築し、自然言語質問を目的のデータベースやテーブルに関連付け検索方法でナビゲートする。
論文 参考訳(メタデータ) (2023-12-06T12:37:28Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - BERT Meets Relational DB: Contextual Representations of Relational
Databases [4.029818252558553]
複数のテーブルからなる関係データベース上でエンティティの低次元表現を学習する問題に対処する。
これらの注意に基づくモデルを使用して、リレーショナルデータベース内のエンティティの埋め込みを学ぶ方法を検討します。
論文 参考訳(メタデータ) (2021-04-30T11:23:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。