Fugu-MT 論文翻訳(概要): Multi-Hop Table Retrieval for Open-Domain Text-to-SQL

論文の概要: Multi-Hop Table Retrieval for Open-Domain Text-to-SQL

arxiv url: http://arxiv.org/abs/2402.10666v1
Date: Fri, 16 Feb 2024 13:14:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-19 16:16:50.705822
Title: Multi-Hop Table Retrieval for Open-Domain Text-to-SQL
Title（参考訳）: Open-Domain Text-to-SQLのためのマルチホップテーブル検索
Authors: Xuanliang Zhang, Dingzirui Wang, Longxu Dou, Qingfu Zhu, Wanxiang Che
Abstract要約: 我々はリライトとビームサーチによるマルチホップテーブル検索を提案する(Murre)。我々はSpiderUnionとBirdUnion+の実験を行い、6.38%の平均的な改善で新しい最先端の結果を得た。
参考スコア（独自算出の注目度）: 55.2326738851157
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Open-domain text-to-SQL is an important task that retrieves question-relevant tables from massive databases and then generates SQL. However, existing retrieval methods that retrieve in a single hop do not pay attention to the text-to-SQL challenge of schema linking, which is aligning the entities in the question with table entities, reflected in two aspects: similar irrelevant entity and domain mismatch entity. Therefore, we propose our method, the multi-hop table retrieval with rewrite and beam search (Murre). To reduce the effect of the similar irrelevant entity, our method focuses on unretrieved entities at each hop and considers the low-ranked tables by beam search. To alleviate the limitation of domain mismatch entity, Murre rewrites the question based on retrieved tables in multiple hops, decreasing the domain gap with relevant tables. We conduct experiments on SpiderUnion and BirdUnion+, reaching new state-of-the-art results with an average improvement of 6.38%.
Abstract（参考訳）: オープンドメインのテキスト-to-SQLは、巨大なデータベースから質問関連テーブルを取得し、SQLを生成する重要なタスクである。しかし、単一のホップで検索する既存の検索方法は、テーブルエンティティと問題内のエンティティを一致させるスキーマリンクのテキストからSQLへの挑戦には注意を払わない。そこで本研究では,リライトとビームサーチによるマルチホップテーブル検索(Murre)を提案する。類似の非関連エンティティの効果を低減するため,本手法ではホップ毎の未検索エンティティに着目し,ビームサーチによる低ランクテーブルの検討を行う。ドメインミスマッチエンティティの制限を軽減するため、Murre氏は複数のホップで取得したテーブルに基づいて質問を書き直し、関連するテーブルとのドメインギャップを減らした。我々はSpiderUnionとBirdUnion+の実験を行い、6.38%の平均的な改善で新しい最先端の結果を得た。

関連論文リスト

Improving Table Retrieval with Question Generation from Partial Tables [2.2169618382995764]
本稿では,LLMを用いてテーブルの小さな部分に基づいて合成質問を生成する簡易かつ効果的な方法であるQGpTを提案する。生成された質問は、生成に使用される部分テーブルセグメントに結合され、ユーザクエリとのセマンティックアライメントが強化される。
論文参考訳（メタデータ） (2025-08-08T09:35:56Z)
Can we Retrieve Everything All at Once? ARM: An Alignment-Oriented LLM-based Retrieval Method [48.14236175156835]
ARMは、データオブジェクト間の関係を探索することで、データ収集の組織とよりよく一致させることを目指している。クエリ分解の精度は最大5.2 pt、エージェントRAG(ReAct)は最大15.9 ptである。最大5.5 pt、19.3 ptのF1マッチスコアをこれらのアプローチと比較して達成する。
論文参考訳（メタデータ） (2025-01-30T18:07:19Z)
Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。 DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文参考訳（メタデータ） (2024-06-23T05:02:21Z)
Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval [52.592071689901196]
本稿では,テーブル検索において,任意のクエリやデータベースに対して有用な結合関係を明らかにする手法を提案する。提案手法は,F1スコアの最大9.3%,エンドツーエンドQAの最大5.4%の精度で,テーブル検索の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-04-15T15:55:01Z)
Denoising Table-Text Retrieval for Open-Domain Question Answering [6.711626456283439]
テーブルテキストのオープンドメイン質問応答において、検索システムは、テーブルとテキストから関連する証拠を検索し、質問に答える。従来の研究には、トレーニングデータセットにおける偽陽性ラベルの影響を受けやすい、という2つの共通の課題がある。本稿では,これらの問題を克服するために,Denoized Table-Text Retriever (DoTTeR)を提案する。
論文参考訳（メタデータ） (2024-03-26T11:44:49Z)
Enhancing Open-Domain Table Question Answering via Syntax- and Structure-aware Dense Retrieval [21.585255812861632]
オープンドメインのテーブル質問応答は、大量のテーブルから情報を検索して抽出することで、質問に対する回答を提供することを目的としている。オープンドメインテーブルQAの既存の研究は、直接テキスト検索手法を採用するか、テーブル検索のための符号化層にのみテーブル構造を考慮する。オープンドメインテーブルQAタスクに対する構文と構造を意識した検索手法を提案する。
論文参考訳（メタデータ） (2023-09-19T10:40:09Z)
Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文参考訳（メタデータ） (2021-08-05T22:04:13Z)
Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文参考訳（メタデータ） (2020-10-20T16:48:14Z)
Answering Any-hop Open-domain Questions with Iterative Document Reranking [62.76025579681472]
オープンドメインの問に答える統合QAフレームワークを提案する。提案手法は,シングルホップおよびマルチホップのオープンドメインQAデータセットにおいて,最先端技術に匹敵する性能を継続的に達成する。
論文参考訳（メタデータ） (2020-09-16T04:31:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。