論文の概要: From Questions to Queries: An AI-powered Multi-Agent Framework for Spatial Text-to-SQL
- arxiv url: http://arxiv.org/abs/2510.21045v1
- Date: Thu, 23 Oct 2025 22:58:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.338949
- Title: From Questions to Queries: An AI-powered Multi-Agent Framework for Spatial Text-to-SQL
- Title(参考訳): 質問からクエリへ:空間テキストからSQLへのAIによるマルチエージェントフレームワーク
- Authors: Ali Khosravi Kazazi, Zhenlong Li, M. Naser Lessani, Guido Cervone,
- Abstract要約: 単一エージェントアプローチは、空間的クエリのセマンティックおよび構文的複雑さにしばしば苦労する。
本稿では,自然言語質問を空間的クエリに正確に翻訳するためのマルチエージェントフレームワークを提案する。
我々は,非空間的KaggleDBQAベンチマークと包括的SpatialQAベンチマークを用いて,本システムの評価を行った。
- 参考スコア(独自算出の注目度): 0.4499833362998488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The complexity of Structured Query Language (SQL) and the specialized nature of geospatial functions in tools like PostGIS present significant barriers to non-experts seeking to analyze spatial data. While Large Language Models (LLMs) offer promise for translating natural language into SQL (Text-to-SQL), single-agent approaches often struggle with the semantic and syntactic complexities of spatial queries. To address this, we propose a multi-agent framework designed to accurately translate natural language questions into spatial SQL queries. The framework integrates several innovative components, including a knowledge base with programmatic schema profiling and semantic enrichment, embeddings for context retrieval, and a collaborative multi-agent pipeline as its core. This pipeline comprises specialized agents for entity extraction, metadata retrieval, query logic formulation, SQL generation, and a review agent that performs programmatic and semantic validation of the generated SQL to ensure correctness (self-verification). We evaluate our system using both the non-spatial KaggleDBQA benchmark and a new, comprehensive SpatialQueryQA benchmark that includes diverse geometry types, predicates, and three levels of query complexity. On KaggleDBQA, the system achieved an overall accuracy of 81.2% (221 out of 272 questions) after the review agent's review and corrections. For spatial queries, the system achieved an overall accuracy of 87.7% (79 out of 90 questions), compared with 76.7% without the review agent. Beyond accuracy, results also show that in some instances the system generates queries that are more semantically aligned with user intent than those in the benchmarks. This work makes spatial analysis more accessible, and provides a robust, generalizable foundation for spatial Text-to-SQL systems, advancing the development of autonomous GIS.
- Abstract(参考訳): 構造化クエリ言語(SQL)の複雑さとPostGISのようなツールにおける地理空間関数の特殊性は、空間データを解析しようとする非専門家にとって大きな障壁となる。
大きな言語モデル(LLM)は、自然言語をSQL(Text-to-SQL)に変換するという約束を提供するが、単一エージェントアプローチは、空間クエリのセマンティックな複雑さと構文的な複雑さに苦慮することが多い。
そこで本稿では,自然言語質問を空間的SQLクエリに正確に翻訳するためのマルチエージェントフレームワークを提案する。
このフレームワークは、プログラムスキーマのプロファイリングとセマンティックエンリッチメントを備えたナレッジベース、コンテキスト検索のための埋め込み、コラボレーティブなマルチエージェントパイプラインなど、いくつかの革新的なコンポーネントを統合している。
本パイプラインは、エンティティ抽出、メタデータ検索、クエリロジック定式化、SQL生成のための特殊エージェントと、生成したSQLのプログラム的および意味的検証を実行して正確性(自己検証)を保証するレビューエージェントとを含む。
我々は,空間的でないKaggleDBQAベンチマークと,多様な幾何学型,述語,3レベルのクエリ複雑性を含む新しい包括的SpatialQueryQAベンチマークを用いて,本システムの評価を行った。
KaggleDBQAでは、レビューエージェントのレビューと修正の後、全体的な精度は81.2%(272問中221問)に達した。
空間的なクエリでは、システム全体の精度は87.7%(90問中79問)で、レビューエージェントなしでは76.7%であった。
精度を超えた結果、いくつかのケースでは、システムはベンチマークよりもユーザ意図にセマンティックに整合したクエリを生成する。
この研究は、空間分析をよりアクセスしやすくし、空間テキスト-SQLシステムのための堅牢で一般化可能な基盤を提供し、自律型GISの開発を推進している。
関連論文リスト
- Text-to-SPARQL Goes Beyond English: Multilingual Question Answering Over Knowledge Graphs through Human-Inspired Reasoning [51.203811759364925]
mKGQAgentは、自然言語の質問をSPARQLクエリに変換し、モジュール化された解釈可能なサブタスクに変換するタスクを分解する。
2025年のText2SPARQLチャレンジにおいて、DBpediaとCorporateベースのKGQAベンチマークに基づいて評価され、私たちのアプローチは、他の参加者の中で第一に行われました。
論文 参考訳(メタデータ) (2025-07-22T19:23:03Z) - RAISE: Reasoning Agent for Interactive SQL Exploration [47.77323087050061]
本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。
本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文 参考訳(メタデータ) (2025-06-02T03:07:08Z) - Bridging the Gap: Enabling Natural Language Queries for NoSQL Databases through Text-to-NoSQL Translation [25.638927795540454]
自然言語クエリをアクセス可能なクエリに変換することを目的としたText-to-Noタスクを導入する。
この分野での研究を促進するために、我々はTEND(Text-to-Noデータセットのショートインターフェース)という、このタスクのための大規模かつオープンソースのデータセットをリリースした。
また,SLM(Small Language Model)支援とRAG(Retrieval-augmented Generation)支援の多段階フレームワークSMARTを設計した。
論文 参考訳(メタデータ) (2025-02-16T17:01:48Z) - BabelBench: An Omni Benchmark for Code-Driven Analysis of Multimodal and Multistructured Data [61.936320820180875]
大規模言語モデル(LLM)は、様々な領域でますます重要になっている。
BabelBenchは、コード実行によるマルチモーダルなマルチ構造化データ管理におけるLLMの熟練度を評価する革新的なベンチマークフレームワークである。
BabelBenchの実験結果から,ChatGPT 4のような最先端モデルでさえ,大幅な改善の余地があることが示唆された。
論文 参考訳(メタデータ) (2024-10-01T15:11:24Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - Automating Pharmacovigilance Evidence Generation: Using Large Language Models to Produce Context-Aware SQL [0.0]
検索拡張世代(RAG)フレームワークでOpenAIのGPT-4モデルを利用する。
ビジネスコンテキストドキュメントはビジネスコンテキストドキュメントでリッチ化され、NLQを構造化クエリ言語クエリに変換する。
複雑性の高いクエリが除外された場合、パフォーマンスは最大85%向上した。
論文 参考訳(メタデータ) (2024-06-15T17:07:31Z) - CHESS: Contextual Harnessing for Efficient SQL Synthesis [1.9506402593665235]
効率的でスケーラブルなテキスト・ツー・クエリのためのフレームワークであるCHESSを紹介します。
特殊エージェントは4つあり、それぞれが上記の課題の1つをターゲットにしている。
私たちのフレームワークは、さまざまなデプロイメント制約に適応する機能を提供する。
論文 参考訳(メタデータ) (2024-05-27T01:54:16Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。