論文の概要: Arming Data Agents with Tribal Knowledge
- arxiv url: http://arxiv.org/abs/2602.13521v2
- Date: Tue, 17 Feb 2026 21:28:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 13:51:30.960146
- Title: Arming Data Agents with Tribal Knowledge
- Title(参考訳): 部族知識によるデータエージェントの武装
- Authors: Shubham Agarwal, Asim Biswal, Sepanta Zeighami, Alvin Cheung, Joseph Gonzalez, Aditya G. Parameswaran,
- Abstract要約: NL2エージェントは、大規模な現実世界のデータベースに直面すると間違いを犯す。
本稿では,Tk-Boostを提案する。
Tk-Boostは、データベース上のミスを分析してエージェントの誤解を特定し、それに対処するための部族的知識を生成する。
- 参考スコア(独自算出の注目度): 19.74439813965971
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Natural language to SQL (NL2SQL) translation enables non-expert users to query relational databases through natural language. Recently, NL2SQL agents, powered by the reasoning capabilities of Large Language Models (LLMs), have significantly advanced NL2SQL translation. Nonetheless, NL2SQL agents still make mistakes when faced with large-scale real-world databases because they lack knowledge of how to correctly leverage the underlying data (e.g., knowledge about the intent of each column) and form misconceptions about the data when querying it, leading to errors. Prior work has studied generating facts about the database to provide more context to NL2SQL agents, but such approaches simply restate database contents without addressing the agent's misconceptions. In this paper, we propose Tk-Boost, a bolt-on framework for augmenting any NL2SQL agent with tribal knowledge: knowledge that corrects the agent's misconceptions in querying the database accumulated through experience using the database. To accumulate experience, Tk-Boost first asks the NL2SQL agent to answer a few queries on the database, identifies the agent's misconceptions by analyzing its mistakes on the database, and generates tribal knowledge to address them. To enable accurate retrieval, Tk-Boost indexes this knowledge with applicability conditions that specify the query features for which the knowledge is useful. When answering new queries, Tk-Boost uses this knowledge to provide feedback to the NL2SQL agent, resolving the agent's misconceptions during SQL generation, and thus improving the agent's accuracy. Extensive experiments across the BIRD and Spider 2.0 benchmarks with various NL2SQL agents shows Tk-Boost improves NL2SQL agents accuracy by up to 16.9% on Spider 2.0 and 13.7% on BIRD
- Abstract(参考訳): 自然言語からSQLへの変換(NL2SQL)により、専門家でないユーザは自然言語でリレーショナルデータベースをクエリできる。
近年,Large Language Models (LLMs) の推論機能を利用した NL2SQL エージェントは,NL2SQL 翻訳を著しく進歩させた。
それでも、NL2SQLエージェントは、基盤となるデータ(例えば、各列の意図に関する知識)を正しく活用する方法の知識がなく、クエリ時にデータに対する誤解を形成し、エラーにつながるため、大規模な実世界のデータベースに直面すると間違いを犯します。
これまでの研究では、NL2SQLエージェントにもっとコンテキストを提供するために、データベースに関する事実の生成を研究してきたが、そのようなアプローチは、エージェントの誤解に対処することなく、単にデータベースの内容を再定義するだけである。
本稿では,NL2SQLエージェントを部族的知識で強化するためのボルトオンフレームワークであるTk-Boostを提案する。
経験を蓄積するために、Tk-Boost氏はまず、NL2SQLエージェントにデータベース上のいくつかのクエリに回答するよう要求し、データベース上のミスを分析してエージェントの誤解を特定し、それに対処するための部族的知識を生成する。
正確な検索を可能にするため、Tk-Boostはこの知識を、知識が有用であるクエリ機能を指定する適用性条件でインデックスする。
新しいクエリに応答する際、Tk-Boostはこの知識を使ってNL2SQLエージェントにフィードバックを提供し、SQL生成時のエージェントの誤解を解消し、エージェントの精度を向上させる。
様々なNL2SQLエージェントによるBIRDとSpider 2.0ベンチマークの広範な実験により、Tk-BoostはNL2SQLエージェントの精度を最大16.9%改善し、BIRDは13.7%向上した。
関連論文リスト
- TailorSQL: An NL2SQL System Tailored to Your Query Workload [16.48291142955493]
最先端のNL2技術は典型的には、データベース固有の情報を取得することによって翻訳を行う。
過去のクエリ処理における情報を活用するNL2システムであるTailorを紹介する。
Tailorは、標準化されたベンチマークの実行精度を最大2$times$改善する。
論文 参考訳(メタデータ) (2025-05-29T03:27:22Z) - Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows [64.94146689665628]
Spider 2.0は、エンタープライズレベルのデータベースのユースケースから派生した、現実のテキストからsqlの問題に対する評価フレームワークである。
Spider 2.0のデータベースは、実際のデータアプリケーションからソースされ、1,000以上の列を含み、BigQueryやSnowflakeなどのローカルまたはクラウドデータベースシステムに格納されることが多い。
Spider 2.0の問題解決には、データベースメタデータ、方言文書、さらにはプロジェクトレベルの理解と検索が頻繁に必要であることを示す。
論文 参考訳(メタデータ) (2024-11-12T12:52:17Z) - A Survey of Text-to-SQL in the Era of LLMs: Where are we, and where are we going? [32.84561352339466]
我々は,Large Language Models (LLMs) を利用したテキスト翻訳技術についてレビューする。
LLM時代におけるテキスト・ツー・アセスメントの研究課題とオープンな課題について論じる。
論文 参考訳(メタデータ) (2024-08-09T14:59:36Z) - MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.120862170230566]
最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。
我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文 参考訳(メタデータ) (2023-12-18T14:40:20Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Interactive Text-to-SQL Generation via Editable Step-by-Step
Explanations [31.3376894001311]
本稿では,ユーザがクエリのステップバイステップ説明を直接編集してエラーを修正する,新たなインタラクションメカニズムを提案する。
複数のデータセットに対する我々の実験は、24人の参加者を持つユーザとともに、我々のアプローチが複数のSOTAアプローチより優れていることを実証している。
論文 参考訳(メタデータ) (2023-05-12T10:45:29Z) - Can LLM Already Serve as A Database Interface? A BIg Bench for
Large-Scale Database Grounded Text-to-SQLs [89.68522473384522]
テキストから効率のよいタスクをベースとした大規模データベースのための大規模なベンチマークであるBirdを紹介します。
データベースの値に重点を置いていると、汚いデータベースコンテンツに対する新たな課題が浮き彫りになる。
最も効果的なテキストから効率のよいモデルであるChatGPTでさえ、実行精度はわずか40.08%である。
論文 参考訳(メタデータ) (2023-05-04T19:02:29Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。