Fugu-MT 論文翻訳(概要): Knapsack Optimization-based Schema Linking for LLM-based Text-to-SQL Generation

論文の概要: Knapsack Optimization-based Schema Linking for LLM-based Text-to-SQL Generation

arxiv url: http://arxiv.org/abs/2502.12911v1
Date: Tue, 18 Feb 2025 14:53:45 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-19 20:12:08.997316
Title: Knapsack Optimization-based Schema Linking for LLM-based Text-to-SQL Generation
Title（参考訳）: LLMに基づくテキスト-SQL生成のためのKnapsack最適化に基づくスキーマリンク
Authors: Zheng Yuan, Hao Chen, Zijin Hong, Qinggang Zhang, Feiran Huang, Xiao Huang,
Abstract要約: 我々は、Knapsack最適化に基づくリンクエージェント(KaSLA)を紹介する。 KaSLAは、冗長なスキーマ要素を最小化しながら、関連するスキーマ要素の欠如を防ぐために設計された、プラグインスキーマリンクエージェントである。スパイダーおよびBIRDベンチマークの実験では、KaSLAがSOTAモデルの生成性能を大幅に改善できることが確認された。
参考スコア（独自算出の注目度）: 15.888784472807775
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generating SQLs from user queries is a long-standing challenge, where the accuracy of initial schema linking significantly impacts subsequent SQL generation performance. However, current schema linking models still struggle with missing relevant schema elements or an excess of redundant ones. A crucial reason for this is that commonly used metrics, recall and precision, fail to capture relevant element missing and thus cannot reflect actual schema linking performance. Motivated by this, we propose an enhanced schema linking metric by introducing a restricted missing indicator. Accordingly, we introduce Knapsack optimization-based Schema Linking Agent (KaSLA), a plug-in schema linking agent designed to prevent the missing of relevant schema elements while minimizing the inclusion of redundant ones. KaSLA employs a hierarchical linking strategy that first identifies the optimal table linking and subsequently links columns within the selected table to reduce linking candidate space. In each linking process, it utilize a knapsack optimization approach to link potentially relevant elements while accounting for a limited tolerance of potential redundant ones.With this optimization, KaSLA-1.6B achieves superior schema linking results compared to large-scale LLMs, including deepseek-v3 with state-of-the-art (SOTA) schema linking method. Extensive experiments on Spider and BIRD benchmarks verify that KaSLA can significantly improve the SQL generation performance of SOTA text-to-SQL models by substituting their schema linking processes.
Abstract（参考訳）: ユーザクエリからSQLを生成することは長期にわたる課題であり、初期スキーマリンクの精度がその後のSQL生成のパフォーマンスに大きく影響する。しかしながら、現在のスキーマリンクモデルでは、関連するスキーマ要素の欠如や、余分なスキーマ要素の過多に悩まされている。この決定的な理由は、一般的に使用されるメトリクス、リコールと精度が、関連する要素の欠如を捉えていないため、実際のスキーマリンクのパフォーマンスを反映できないためである。そこで本研究では,制限された欠落指標を導入することで,拡張されたスキーマリンクメトリックを提案する。そこで我々は、Knapsack最適化ベースのスキーマリンクエージェント(KaSLA)を紹介した。これは、冗長なスキーマ要素を最小化しつつ、関連するスキーマ要素の欠如を防止するために設計されたプラグインスキーマリンクエージェントである。 KaSLAでは、まず最適なテーブルリンクを識別し、次に選択したテーブル内の列をリンクして、リンク候補空間を減らす階層的なリンク戦略を採用している。この最適化により、KaSLA-1.6B は、Deepseek-v3 や State-of-the-art (SOTA) スキーマリンク手法を含む大規模 LLM と比較して、優れたスキーマリンク結果が得られる。 Spider と BIRD ベンチマークの大規模な実験により、KaSLA はスキーマリンクプロセスに代えて、SOTA テキスト-SQL モデルの SQL 生成性能を大幅に改善できることを確認した。

関連論文リスト

CORE-T: COherent REtrieval of Tables for Text-to-SQL [91.76918495375384]
CORE-Tはスケーラブルでトレーニング不要なフレームワークで、テーブルに目的のメタデータを付加し、軽量なテーブル互換キャッシュをプリコンプリートする。バード、スパイダー、MMQAを越えて、CORE-Tはテーブル選択F1を最大22.7ポイント改善し、最大42%のテーブルを検索する。
論文参考訳（メタデータ） (2026-01-19T14:51:23Z)
AutoLink: Autonomous Schema Exploration and Expansion for Scalable Schema Linking in Text-to-SQL at Scale [68.29002818359844]
既存の方法は違法なコストを発生させ、リコールとノイズのトレードオフに苦労し、大規模データベースに不利なスケーリングを行う。我々は、反復的エージェント駆動プロセスとしてスキーマリンクを再構成する、自律的なエージェントフレームワークであるtextbfAutoLinkを提案する。実験ではAutoLinkの優れたパフォーマンスを示し、最先端の厳密なスキーマリンクのリコール、すなわち textbf68.7% EX on Bird-Dev (CHESSより優れている)、 textbf34.9% EX on Spider-2.0-Lite (第2位)を実現している。
論文参考訳（メタデータ） (2025-11-21T12:12:17Z)
Rethinking Schema Linking: A Context-Aware Bidirectional Retrieval Approach for Text-to-SQL [14.44163500388232]
本稿では,スキーマリンクを独立した問題として扱う,コンテキスト対応の双方向スキーマ検索フレームワークを提案する。提案手法は,テーブル優先検索と列選択,列優先検索とテーブル選択の2つの相補的戦略を組み合わせる。提案手法は,完全なスキーマ設定と完全なスキーマ設定のギャップを50%縮小する。
論文参考訳（メタデータ） (2025-10-16T04:46:22Z)
Schema-R1: A reasoning training approach for schema linking in Text-to-SQL Task [3.686808512438363]
スキーマリンクモデルに対する現在の微調整アプローチは、ロートラーニングパラダイムを採用している。強化学習を用いて学習した推論スキーマリンクモデルである-R1を提案する。
論文参考訳（メタデータ） (2025-06-13T17:46:02Z)
LLM-Symbolic Integration for Robust Temporal Tabular Reasoning [69.27153114778748]
本研究では,システムおよび制御された評価のための合成データセットであるTempTabQA-Cを紹介する。この構造化アプローチにより、LLM(Large Language Models)はsqlクエリの生成と実行を可能にし、一般化とバイアス軽減の強化を行う。
論文参考訳（メタデータ） (2025-06-06T05:14:04Z)
SchemaGraphSQL: Efficient Schema Linking with Pathfinding Graph Algorithms for Text-to-SQL on Large-Scale Databases [1.6544167074080365]
本稿では、まず、外部キー関係に基づくスキーマグラフを構築する、ゼロショットでトレーニング不要なスキーマリンク手法を提案する。我々は、結合すべきテーブルや列の最適なシーケンスを特定するために、古典的なパスフィニングアルゴリズムと後処理を適用する。提案手法はBIRDベンチマークの最先端結果を実現し,従来の特殊化,微調整,複雑な多段階LCMに基づくアプローチよりも優れていた。
論文参考訳（メタデータ） (2025-05-23T20:42:36Z)
UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification [50.59009084277447]
論理生成からスキーマ要素の検索を分離するフレームワークUNJOINを紹介する。最初の段階では、各列をテーブル名でプレフィックスすることで、データベース内のすべてのテーブルの列名を単一のテーブル表現にマージします。第2段階では、クエリは、この単純化されたスキーマに基づいて生成され、JOIN、UNION、リレーショナルロジックを再構築することで、元のスキーマにマップされる。
論文参考訳（メタデータ） (2025-05-23T17:28:43Z)
LinkAlign: Scalable Schema Linking for Real-World Large-Scale Multi-Database Text-to-SQL [14.677024710675838]
LinkAlignは、既存のベースラインを現実の環境に効果的に適応できる新しいフレームワークである。 SPIDERおよびBIRDベンチマークを用いて,本手法の性能評価を行った。 LinkAlignは、長いチェーン・オブ・プリーティングLPMを使用するモデルを除くモデルの中では最高である。
論文参考訳（メタデータ） (2025-03-24T11:53:06Z)
PSM-SQL: Progressive Schema Learning with Multi-granularity Semantics for Text-to-SQL [8.416319689644556]
冗長性を持った膨大な数のデータベーススキーマのため、タスクの変換は困難である。マルチグラニュラリティセマンティクス(PSM-)とリンクするプログレッシブスキーマを提案する。 PSM-は列、テーブル、データベースレベルでスキーマのセマンティクスを学ぶ。
論文参考訳（メタデータ） (2025-02-07T08:31:57Z)
Extractive Schema Linking for Text-to-SQL [17.757832644216446]
テキスト・トゥ・ワンは、現実世界のデータベースの実用的なインターフェースとして現れつつある。本稿では,デコーダのみのLLMをスキーマリンクに適用するための新しいアプローチを提案する。
論文参考訳（メタデータ） (2025-01-23T19:57:08Z)
Matchmaker: Self-Improving Large Language Model Programs for Schema Matching [60.23571456538149]
本稿では,スキーママッチングのための合成言語モデルプログラムを提案する。 Matchmakerは、ラベル付きデモを必要とせずに、ゼロショットで自己改善する。実証的に、Matchmakerが以前のMLベースのアプローチより優れている実世界の医療スキーママッチングベンチマークを実証する。
論文参考訳（メタデータ） (2024-10-31T16:34:03Z)
RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文参考訳（メタデータ） (2024-10-31T16:22:26Z)
The Death of Schema Linking? Text-to-SQL in the Age of Well-Reasoned Language Models [0.9149661171430259]
次世代の大規模言語モデル(LLM)を使用する場合のスキーマリンクを再検討する。より新しいモデルでは,無関係なモデルが多数存在する場合でも,生成時に関連するスキーマ要素を利用することが可能であることが実証的に判明した。文脈情報をフィルタリングする代わりに、拡張、選択、修正などのテクニックを強調し、テキストからBIRDパイプラインの精度を向上させるためにそれらを採用する。
論文参考訳（メタデータ） (2024-08-14T17:59:04Z)
Schema-Aware Multi-Task Learning for Complex Text-to-SQL [4.913409359995421]
複雑なsqlクエリのためのスキーマ対応マルチタスク学習フレームワーク(MT)を提案する。具体的には、有効な質問スキーマリンクを識別するために、識別器モジュールを設計する。デコーダ側では、テーブルと列の接続を記述するために、6種類の関係を定義します。
論文参考訳（メタデータ） (2024-03-09T01:13:37Z)
CRUSH4SQL: Collective Retrieval Using Schema Hallucination For Text2SQL [47.14954737590405]
既存のテキストからテキストへのジェネレータでは、スキーマ全体をユーザテキストでエンコードする必要がある。大規模な構造化データベースをサブセット化するのに、標準的な高密度検索技術は不十分である。大規模データベース上でスキーマサブセットを作成するためのベンチマークを3つ導入する。
論文参考訳（メタデータ） (2023-11-02T12:13:52Z)
Schema-adaptable Knowledge Graph Construction [47.772335354080795]
従来の知識グラフ構築(KGC)アプローチは、通常、事前定義されたスキーマの閉じたセットで静的情報抽出パラダイムに従う。我々は,スキーマ適応型KGCと呼ばれる新しいタスクを提案する。このタスクは,動的に変化するスキーマグラフに基づいて,再学習せずにエンティティ,リレーション,イベントを継続的に抽出することを目的としている。
論文参考訳（メタデータ） (2023-05-15T15:06:20Z)
Improving Text-to-SQL Semantic Parsing with Fine-grained Query Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文参考訳（メタデータ） (2022-09-28T21:00:30Z)
Proton: Probing Schema Linking Information from Pre-trained Language Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文参考訳（メタデータ） (2022-06-28T14:05:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。