論文の概要: Querying an astronomical database using large language models: the ALeRCE text-to-SQL system
- arxiv url: http://arxiv.org/abs/2606.18108v1
- Date: Tue, 16 Jun 2026 16:12:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.537255
- Title: Querying an astronomical database using large language models: the ALeRCE text-to-SQL system
- Title(参考訳): 大規模言語モデルを用いた天文学データベースのクエリ: ALeRCE text-to-SQLシステム
- Authors: P. A. Estevez, J. Espejo-Moreira, S. Sanfeliu-Alvarez, F. Forster, A. M. Munoz Arancibia, G. Cabrera-Vives, F. E. Bauer, A. Bayo, M. Catelan, R. Dastidar, L. Hernandez-Garcia, J. A. Intriago, G. Pignata,
- Abstract要約: 大規模言語モデル(LLM)に基づくテキスト・トゥ・コンテクスト(構造化クエリ言語)システムを開発した。
本稿では,ALeRCE(Automatic Learning for the Rapid Classification of Events)天文学データベースに適用する。
ALeRCEはZwicky Transient FacilityとVera C. Rubin Observatoryのコミュニティブローカーである。
- 参考スコア(独自算出の注目度): 0.6160458642720921
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We develop a text-to-SQL (structured query language) system based on large language models (LLMs) using in-context learning and apply it to the Automatic Learning for the Rapid Classification of Events (ALeRCE) astronomical database. ALeRCE is a community broker for the Zwicky Transient Facility and the Vera C. Rubin Observatory. The system enables users to query the database in natural language (NL) and generates executable SQL queries. To develop and evaluate the system, we constructed a dataset of 110 NL/SQL pairs. We propose a step-by-step generation framework comprising four modules: schema linking, query classification, prompt decomposition, and self-correction. The performance of thirteen LLMs is evaluated using in-context learning and prompt engineering techniques. Text-to-SQL performance is assessed using the perfect-match (PM) rate for row identifiers (e.g., object identifiers) and column identifiers (i.e., column names). The proposed step-by-step framework consistently outperforms a direct-inference baseline, while the self-correction module consistently reduces execution errors. For Claude Opus 4.6, PM performance on row (column) identifiers is high for simple queries, reaching 0.97 (0.94), and decreases with query complexity to 0.44 (0.72) for medium queries and 0.59 (0.49) for hard queries. Among the thirteen evaluated models, the best-performing LLMs for the text-to-SQL task are Claude Opus 4.6, Gemini 2.5 Pro, Gemini 3 Flash, and GPT-5.2-Codex.
- Abstract(参考訳): In-context Learning を用いた大規模言語モデル (LLMs) に基づくテキスト・ツー・SQL (構造化クエリ言語) システムを開発し,それをALeRCE (Automatic Learning for the Rapid Classification of Events) 天文データベースに適用する。
ALeRCEはZwicky Transient FacilityとVera C. Rubin Observatoryのコミュニティブローカーである。
このシステムでは、自然言語(NL)でデータベースをクエリし、実行可能なSQLクエリを生成することができる。
システムの開発と評価のために,110個のNL/SQLペアのデータセットを構築した。
本稿では,スキーマリンク,クエリ分類,即時分解,自己補正の4つのモジュールからなるステップバイステップ生成フレームワークを提案する。
13個のLLMの性能は、文脈内学習とプロンプトエンジニアリング技術を用いて評価する。
テキストとSQLのパフォーマンスは、行識別子(例:オブジェクト識別子)と列識別子(例:列名)の完全マッチ(PM)レートを用いて評価される。
提案したステップバイステップフレームワークは、直接参照ベースラインを一貫して上回り、自己補正モジュールは、実行エラーを一貫して減少させる。
Claude Opus 4.6では、行(カラム)識別子でのPM性能は単純なクエリでは高く、クエリの複雑性は0.97 (0.94)に達し、中間クエリでは0.44 (0.72)、ハードクエリでは0.59 (0.49)に低下する。
13の評価モデルのうち、テキスト・トゥ・SQLタスクの最高の性能を持つLCMは、Claude Opus 4.6、Gemini 2.5 Pro、Gemini 3 Flash、GPT-5.2-Codexである。
関連論文リスト
- From Queries to Insights: Agentic LLM Pipelines for Spatio-Temporal Text-to-SQL [8.496933324334167]
本研究では,MistralをベースとしたRellama-sqlcoder-8bによるオーケストレーションにより,簡単なテキストからActまでのベースライン(Rellama-sqlcoder-8b)を提案する。
ニューヨークと東京のチェックインで35の自然言語クエリを評価し,空間的・時間的マルチデータセット推論について検討した。
このエージェントは、データセット 91.4% 対 28.6% よりもかなり精度が高く、地図によるユーザビリティを高め、自然言語の要約を構造化する。
論文 参考訳(メタデータ) (2025-10-29T22:18:57Z) - PARROT: A Benchmark for Evaluating LLMs in Cross-System SQL Translation [21.0303026118673]
本稿では CrOss-System SQL Translation のための実践的で現実的なベンチマック PARROT を紹介する。
PARROTは38のオープンソースベンチマークと実世界のビジネスサービスから598の翻訳ペアで構成されている。
28,003 の PARROT-Diverse や 5,306 のサンプルを持つ PARROT-Simple など,複数のベンチマーク版も提供しています。
論文 参考訳(メタデータ) (2025-09-27T14:41:13Z) - CogniSQL-R1-Zero: Lightweight Reinforced Reasoning for Efficient SQL Generation [1.169202600932732]
本稿では,強化学習(RL)フレームワークとモデルであるCogni-R1-Zeroを紹介する。
我々は、実行の正しさとフォーマットタグのコンプライアンスに基づく軽量な報酬信号を使用する。
提案手法は,Text2ベンチマーク上での最先端実行精度を実現する。
効率的かつ解釈可能なテキスト・ツー・コード・モデリングのさらなる研究を支援するために、2つのキュレートされたデータセットをリリースする。
論文 参考訳(メタデータ) (2025-07-08T14:17:07Z) - DAC: Decomposed Automation Correction for Text-to-SQL [51.48239006107272]
De Automation Correction (DAC)を導入し、エンティティリンクとスケルトン解析を分解することでテキストから合成を補正する。
また,本手法では,ベースライン法と比較して,スパイダー,バード,カグルDBQAの平均値が平均3.7%向上することを示した。
論文 参考訳(メタデータ) (2024-08-16T14:43:15Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.120862170230566]
最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。
我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。