Fugu-MT 論文翻訳(概要): BlendSQL: A Scalable Dialect for Unifying Hybrid Question Answering in Relational Algebra

論文の概要: BlendSQL: A Scalable Dialect for Unifying Hybrid Question Answering in Relational Algebra

arxiv url: http://arxiv.org/abs/2402.17882v1
Date: Tue, 27 Feb 2024 20:48:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-29 17:15:52.659318
Title: BlendSQL: A Scalable Dialect for Unifying Hybrid Question Answering in Relational Algebra
Title（参考訳）: blendsql:リレーショナル代数におけるハイブリッド質問応答を統一するスケーラブルな方言
Authors: Parker Glenn, Parag Pravin Dakle, Liang Wang, Preethi Raghavan
Abstract要約: ブレンドは構造化データと非構造化データの両方にわたる推論をオーケストレーションするための統一方言として機能する。 Blendは大規模なデータセットにスケールでき、トークンを35%減らしながらエンドツーエンドシステムの性能を向上させることができる。
参考スコア（独自算出の注目度）: 6.196809687461253
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Many existing end-to-end systems for hybrid question answering tasks can often be boiled down to a "prompt-and-pray" paradigm, where the user has limited control and insight into the intermediate reasoning steps used to achieve the final result. Additionally, due to the context size limitation of many transformer-based LLMs, it is often not reasonable to expect that the full structured and unstructured context will fit into a given prompt in a zero-shot setting, let alone a few-shot setting. We introduce BlendSQL, a superset of SQLite to act as a unified dialect for orchestrating reasoning across both unstructured and structured data. For hybrid question answering tasks involving multi-hop reasoning, we encode the full decomposed reasoning roadmap into a single interpretable BlendSQL query. Notably, we show that BlendSQL can scale to massive datasets and improve the performance of end-to-end systems while using 35% fewer tokens. Our code is available and installable as a package at https://github.com/parkervg/blendsql.
Abstract（参考訳）: ハイブリッドな質問応答タスクのための既存のエンドツーエンドシステムの多くは、ユーザが最終的な結果を達成するのに使用される中間的推論ステップを制限された制御と洞察を持つ"prompt-and-pray"パラダイムに導かれることが多い。加えて、多くのトランスフォーマーベースのLCMのコンテキストサイズ制限のため、フル構造化および非構造化のコンテキストがゼロショット設定で与えられたプロンプトに収まることを期待することは、数ショット設定で言うまでもない。我々は、sqliteのスーパーセットであるblendsqlを紹介し、非構造化データと構造化データの両方で推論をオーケストレーションするための統合方言として機能する。マルチホップ推論を含むハイブリッドな質問応答タスクでは、分解された推論ロードマップを単一解釈可能なblendsqlクエリにエンコードします。特に、BlendSQLは、トークンを35%減らしながら、大量のデータセットにスケールし、エンドツーエンドシステムのパフォーマンスを向上させることができることを示す。私たちのコードはhttps://github.com/parkervg/blendsqlでパッケージとしてインストールできます。

関連論文リスト

Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文参考訳（メタデータ） (2025-11-26T13:52:50Z)
CRED-SQL: Enhancing Real-world Large Scale Database Text-to-SQL Parsing through Cluster Retrieval and Execution Description [15.080310729603466]
CRED-は大規模データベース向けに設計されたフレームワークで、クラスタ検索と実行記述を統合している。自然言語質問(NLQ)と対応するsqlクエリのギャップを埋める。 CRED-は最新のgit-the-art(SOTA)パフォーマンスを実現し、その有効性とスケーラビリティを検証する。
論文参考訳（メタデータ） (2025-08-18T09:43:07Z)
Chain-of-Query: Unleashing the Power of LLMs in SQL-Aided Table Understanding via Multi-Agent Collaboration [22.351384833450567]
Chain-of-Query (CoQ)は、テーブル理解のための新しいマルチエージェントフレームワークである。 CoQは、構造的ノイズを抽象化し、理解を深めるために、テーブルスキーマの自然言語スタイルの表現を採用する。 4つのモデルと5つの広く使用されているベンチマークによる実験は、CoQが相当な精度改善を実現していることを示している。
論文参考訳（メタデータ） (2025-08-14T19:46:46Z)
Weaver: Interweaving SQL and LLM for Table Reasoning [63.09519234853953]
Weaverは、構造化データ検索のためのsqlとセマンティック処理のためのLLMを組み合わせたフレキシブルなステップバイステッププランを生成する。 Weaverは、4つのTableQAデータセットの最先端メソッドを一貫して上回り、API呼び出しとエラー率の両方を削減する。
論文参考訳（メタデータ） (2025-05-25T03:27:37Z)
TinySQL: A Progressive Text-to-SQL Dataset for Mechanistic Interpretability Research [0.0]
本研究では,おもちゃのタスクの形式的構造と実世界の複雑さを組み合わせることで,テキスト・ツー・ジェネレーションを学習の理想的なタスクとして提案する。最小回路の識別にはエッジパッチやスパースオートエンコーダなどの解釈可能性技術を適用する。私たちの研究は、構造化され、段階的に複雑な設定における解釈可能性メソッドの探索と比較のための堅牢なフレームワークを提供します。
論文参考訳（メタデータ） (2025-03-17T01:47:50Z)
ReFoRCE: A Text-to-SQL Agent with Self-Refinement, Format Restriction, and Column Exploration [32.83579488224367]
スパイダー2.0データセットの現在の最先端のパフォーマンスは、まだ20%に制限されている。長文制約を緩和するテーブル圧縮を導入したReFoRCEを提案する。 ReFoRCEはスパイダー2.0-Snowで31.26点、スパイダー2.0-Liteで30.35点を得た。
論文参考訳（メタデータ） (2025-02-02T05:25:03Z)
Evaluating and Enhancing LLMs for Multi-turn Text-to-SQL with Multiple Question Types [11.391598870596392]
大規模言語モデル (LLM) は、かなり高度な音声合成システムを備えている。 LLMは、しばしばSQL生成に焦点を合わせ、現実世界の会話クエリの複雑さを無視している。 LLMの問合せ分類とSQL生成能力を評価するためのテストスイートMMを提案する。
論文参考訳（メタデータ） (2024-12-21T10:13:45Z)
RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering [11.214912072391108]
現実世界のデータセットは、大きな属性と複雑な値の配列を特徴とすることが多い。従来の手法ではデータセットのサイズと複雑さをLarge Language Modelsに完全にリレーすることはできません。入力テーブル上でFTS(Full-Text Search)を利用する新しいフレームワークを提案する。
論文参考訳（メタデータ） (2024-08-22T13:13:06Z)
AMBROSIA: A Benchmark for Parsing Ambiguous Questions into Database Queries [56.82807063333088]
我々は,新たなベンチマークであるAMBROSIAを導入し,テキスト・ツー・オープン・プログラムの開発を促進することを期待する。私たちのデータセットには、3種類のあいまいさ(スコープのあいまいさ、アタッチメントのあいまいさ、あいまいさ)を示す質問が含まれている。いずれの場合も、データベースのコンテキストが提供されてもあいまいさは持続する。これは、スクラッチからデータベースを制御して生成する、新しいアプローチによって実現される。
論文参考訳（メタデータ） (2024-06-27T10:43:04Z)
QDA-SQL: Questions Enhanced Dialogue Augmentation for Multi-Turn Text-to-SQL [14.321009553155285]
特定のドメインタスクのための細調整された大きな言語モデル(LLM)は、Text-to-Awerタスクで大きな成功を収めました。 LLMは、曖昧な質問や解決不可能な質問によって引き起こされるマルチターンのテキスト-問合せタスクにおいて、しばしば課題に直面している。マルチターンテキスト-問合せタスクにおいて,複数種類の質問を処理するためのLLMの拡張が望まれる。
論文参考訳（メタデータ） (2024-06-15T10:54:54Z)
Retrieval-augmented GPT-3.5-based Text-to-SQL Framework with Sample-aware Prompting and Dynamic Revision Chain [21.593701177605652]
サンプルと動的リビジョンチェーンを含むテキスト・ツー・アウェア・プロンプト・フレームワークを提案する。提案手法は,質問項目のサンプルと詳細な情報を含む。人間の介入なしに実行可能で正確なスクルを生成するために、我々は、きめ細かいフィードバックを反復的に適応する動的リビジョンチェーンを設計する。
論文参考訳（メタデータ） (2023-07-11T07:16:22Z)
Conversational Text-to-SQL: An Odyssey into State-of-the-Art and Challenges Ahead [6.966624873109535]
State-of-the-art (SOTA) システムは、T5ファミリーのような大規模で訓練済み、微調整された言語モデルを使用する。トレーニング中に個別のプロンプトを持つコヒーレントなタスクに対するマルチタスク(MT)により、特殊なテキストから3つのモデルよりも改善する。我々は、領域と構成の一般化に起因する誤りを分解する研究を行う。
論文参考訳（メタデータ） (2023-02-21T23:15:33Z)
Successive Prompting for Decomposing Complex Questions [50.00659445976735]
最近の研究は、大規模言語モデル(LM)の機能を活用して、数ショットで複雑な質問応答を行う。そこでは、複雑なタスクを単純なタスクに繰り返し分解し、それを解決し、最終解を得るまでプロセスを繰り返します。我々の最良のモデル(逐次プロンプト付き)は、DROPデータセットの数ショットバージョンにおいて、5%の絶対F1の改善を実現します。
論文参考訳（メタデータ） (2022-12-08T06:03:38Z)
S$^2$SQL: Injecting Syntax to Question-Schema Interaction Graph Encoder for Text-to-SQL Parsers [66.78665327694625]
テキスト-関係解析のための質問-エンコーダグラフに構文を注入するS$2$を提案する。また、疎結合制約を用いて多様なエッジ埋め込みを誘導し、ネットワークの性能をさらに向上させる。スパイダーとロバスト性設定の実験は、提案手法が事前学習モデルを使用する場合、既存のすべての手法より優れていることを示した。
論文参考訳（メタデータ） (2022-03-14T09:49:15Z)
Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文参考訳（メタデータ） (2021-12-12T20:02:42Z)
Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文参考訳（メタデータ） (2021-08-05T22:04:13Z)
Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Semantic Parsing [110.97778888305506]
BRIDGEは、フィールドのサブセットが質問に言及されたセル値で拡張されるタグ付きシーケンスの質問とDBスキーマを表します。 BRIDGEは、人気のクロスDBテキスト-リレーショナルベンチマークで最先端のパフォーマンスを達成しました。本分析は,BRIDGEが望まれる相互依存を効果的に捕捉し,さらにテキストDB関連タスクに一般化する可能性を示唆している。
論文参考訳（メタデータ） (2020-12-23T12:33:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。