Fugu-MT 論文翻訳(概要): Arming Data Agents with Tribal Knowledge

論文の概要: Arming Data Agents with Tribal Knowledge

arxiv url: http://arxiv.org/abs/2602.13521v2
Date: Tue, 17 Feb 2026 21:28:23 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-19 13:51:30.960146
Title: Arming Data Agents with Tribal Knowledge
Title（参考訳）: 部族知識によるデータエージェントの武装
Authors: Shubham Agarwal, Asim Biswal, Sepanta Zeighami, Alvin Cheung, Joseph Gonzalez, Aditya G. Parameswaran,
Abstract要約: NL2エージェントは、大規模な現実世界のデータベースに直面すると間違いを犯す。本稿では,Tk-Boostを提案する。 Tk-Boostは、データベース上のミスを分析してエージェントの誤解を特定し、それに対処するための部族的知識を生成する。
参考スコア（独自算出の注目度）: 19.74439813965971
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Natural language to SQL (NL2SQL) translation enables non-expert users to query relational databases through natural language. Recently, NL2SQL agents, powered by the reasoning capabilities of Large Language Models (LLMs), have significantly advanced NL2SQL translation. Nonetheless, NL2SQL agents still make mistakes when faced with large-scale real-world databases because they lack knowledge of how to correctly leverage the underlying data (e.g., knowledge about the intent of each column) and form misconceptions about the data when querying it, leading to errors. Prior work has studied generating facts about the database to provide more context to NL2SQL agents, but such approaches simply restate database contents without addressing the agent's misconceptions. In this paper, we propose Tk-Boost, a bolt-on framework for augmenting any NL2SQL agent with tribal knowledge: knowledge that corrects the agent's misconceptions in querying the database accumulated through experience using the database. To accumulate experience, Tk-Boost first asks the NL2SQL agent to answer a few queries on the database, identifies the agent's misconceptions by analyzing its mistakes on the database, and generates tribal knowledge to address them. To enable accurate retrieval, Tk-Boost indexes this knowledge with applicability conditions that specify the query features for which the knowledge is useful. When answering new queries, Tk-Boost uses this knowledge to provide feedback to the NL2SQL agent, resolving the agent's misconceptions during SQL generation, and thus improving the agent's accuracy. Extensive experiments across the BIRD and Spider 2.0 benchmarks with various NL2SQL agents shows Tk-Boost improves NL2SQL agents accuracy by up to 16.9% on Spider 2.0 and 13.7% on BIRD
Abstract（参考訳）: 自然言語からSQLへの変換(NL2SQL)により、専門家でないユーザは自然言語でリレーショナルデータベースをクエリできる。近年,Large Language Models (LLMs) の推論機能を利用した NL2SQL エージェントは,NL2SQL 翻訳を著しく進歩させた。それでも、NL2SQLエージェントは、基盤となるデータ(例えば、各列の意図に関する知識)を正しく活用する方法の知識がなく、クエリ時にデータに対する誤解を形成し、エラーにつながるため、大規模な実世界のデータベースに直面すると間違いを犯します。これまでの研究では、NL2SQLエージェントにもっとコンテキストを提供するために、データベースに関する事実の生成を研究してきたが、そのようなアプローチは、エージェントの誤解に対処することなく、単にデータベースの内容を再定義するだけである。本稿では,NL2SQLエージェントを部族的知識で強化するためのボルトオンフレームワークであるTk-Boostを提案する。経験を蓄積するために、Tk-Boost氏はまず、NL2SQLエージェントにデータベース上のいくつかのクエリに回答するよう要求し、データベース上のミスを分析してエージェントの誤解を特定し、それに対処するための部族的知識を生成する。正確な検索を可能にするため、Tk-Boostはこの知識を、知識が有用であるクエリ機能を指定する適用性条件でインデックスする。新しいクエリに応答する際、Tk-Boostはこの知識を使ってNL2SQLエージェントにフィードバックを提供し、SQL生成時のエージェントの誤解を解消し、エージェントの精度を向上させる。様々なNL2SQLエージェントによるBIRDとSpider 2.0ベンチマークの広範な実験により、Tk-BoostはNL2SQLエージェントの精度を最大16.9%改善し、BIRDは13.7%向上した。

関連論文リスト

Monte Carlo Tree Search with Reasoning Path Refinement for Small Language Models in Conversational Text-to-NoSQL [20.156191782890797]
本稿では,自然言語質問,データベース,対話履歴を問う問合せを生成するConversational Text-to-Noタスクを提案する。そこで我々は,クエリ固有の推論機能を備えた小さな言語モデルを実現するフレームワークであるStage-MCTSを提案する。提案手法は最先端の大規模推論モデルより優れ,実行値の一致精度を最大7.93%向上させる。
論文参考訳（メタデータ） (2026-02-13T03:35:38Z)
From Queries to Insights: Agentic LLM Pipelines for Spatio-Temporal Text-to-SQL [8.496933324334167]
本研究では,MistralをベースとしたRellama-sqlcoder-8bによるオーケストレーションにより,簡単なテキストからActまでのベースライン(Rellama-sqlcoder-8b)を提案する。ニューヨークと東京のチェックインで35の自然言語クエリを評価し,空間的・時間的マルチデータセット推論について検討した。このエージェントは、データセット 91.4% 対 28.6% よりもかなり精度が高く、地図によるユーザビリティを高め、自然言語の要約を構造化する。
論文参考訳（メタデータ） (2025-10-29T22:18:57Z)
End-to-End Text-to-SQL with Dataset Selection: Leveraging LLMs for Adaptive Query Generation [6.5390580456423555]
従来のアプローチでは、直接変換タスクとしてテキストからクエリをモデル化する。大規模言語モデル(LLM)の最近の進歩は翻訳精度を大幅に改善した。本稿では,ユーザの意図するデータベースを識別する3段階のエンドツーエンドテキスト・ツー・エンド・フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-08T15:16:36Z)
RAISE: Reasoning Agent for Interactive SQL Exploration [47.77323087050061]
本稿では,スキーマリンク,クエリ生成,反復的改善を1つのエンドツーエンドコンポーネントに統一する新しいフレームワークを提案する。本手法は、不慣れなデータベースを扱う際に、人間がどう答えるかをエミュレートする。
論文参考訳（メタデータ） (2025-06-02T03:07:08Z)
TailorSQL: An NL2SQL System Tailored to Your Query Workload [16.48291142955493]
最先端のNL2技術は典型的には、データベース固有の情報を取得することによって翻訳を行う。過去のクエリ処理における情報を活用するNL2システムであるTailorを紹介する。 Tailorは、標準化されたベンチマークの実行精度を最大2$times$改善する。
論文参考訳（メタデータ） (2025-05-29T03:27:22Z)
Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows [64.94146689665628]
Spider 2.0は、エンタープライズレベルのデータベースのユースケースから派生した、現実のテキストからsqlの問題に対する評価フレームワークである。 Spider 2.0のデータベースは、実際のデータアプリケーションからソースされ、1,000以上の列を含み、BigQueryやSnowflakeなどのローカルまたはクラウドデータベースシステムに格納されることが多い。 Spider 2.0の問題解決には、データベースメタデータ、方言文書、さらにはプロジェクトレベルの理解と検索が頻繁に必要であることを示す。
論文参考訳（メタデータ） (2024-11-12T12:52:17Z)
A Survey of Text-to-SQL in the Era of LLMs: Where are we, and where are we going? [32.84561352339466]
我々は,Large Language Models (LLMs) を利用したテキスト翻訳技術についてレビューする。 LLM時代におけるテキスト・ツー・アセスメントの研究課題とオープンな課題について論じる。
論文参考訳（メタデータ） (2024-08-09T14:59:36Z)
MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.120862170230566]
最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文参考訳（メタデータ） (2023-12-18T14:40:20Z)
Natural language to SQL in low-code platforms [0.0]
自然言語(NL)クエリを記述可能なパイプラインを提案する。 OutSystemsユーザによって最も頻繁に実行されるクエリをカバーするデータを収集、ラベル付け、検証します。パイプライン全体について説明します。フィードバックループによって,運用データの迅速な収集が可能になります。
論文参考訳（メタデータ） (2023-08-29T11:59:02Z)
SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文参考訳（メタデータ） (2023-05-26T21:39:05Z)
UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文参考訳（メタデータ） (2023-05-25T17:19:52Z)
Interactive Text-to-SQL Generation via Editable Step-by-Step Explanations [31.3376894001311]
本稿では,ユーザがクエリのステップバイステップ説明を直接編集してエラーを修正する,新たなインタラクションメカニズムを提案する。複数のデータセットに対する我々の実験は、24人の参加者を持つユーザとともに、我々のアプローチが複数のSOTAアプローチより優れていることを実証している。
論文参考訳（メタデータ） (2023-05-12T10:45:29Z)
Can LLM Already Serve as A Database Interface? A BIg Bench for Large-Scale Database Grounded Text-to-SQLs [89.68522473384522]
テキストから効率のよいタスクをベースとした大規模データベースのための大規模なベンチマークであるBirdを紹介します。データベースの値に重点を置いていると、汚いデータベースコンテンツに対する新たな課題が浮き彫りになる。最も効果的なテキストから効率のよいモデルであるChatGPTでさえ、実行精度はわずか40.08%である。
論文参考訳（メタデータ） (2023-05-04T19:02:29Z)
Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文参考訳（メタデータ） (2021-12-12T20:02:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。