論文の概要: SUQL: Conversational Search over Structured and Unstructured Data with
Large Language Models
- arxiv url: http://arxiv.org/abs/2311.09818v1
- Date: Thu, 16 Nov 2023 11:48:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 14:47:44.449679
- Title: SUQL: Conversational Search over Structured and Unstructured Data with
Large Language Models
- Title(参考訳): suql: 大規模言語モデルによる構造化および非構造化データの会話検索
- Authors: Shicheng Liu, Jialiang Xu, Wesley Tjangnaka, Sina J. Semnani, Chen Jie
Yu, Gui D\'avid, Monica S. Lam
- Abstract要約: 構造化データクエリと非構造化データクエリの合成を自然にカバーする最初の形式的実行可能表現であるSUQLを提案する。
また,SUQLのコンテキストセマンティクスを含む,大規模言語モデルに基づく対話型検索エージェントを提案する。
SUQLをベースとした会話エージェントでは,強い,一般的に使用されるベースラインの65.0%に対して,すべてのユーザの要求を満たすエンティティが89.3%であることがわかった。
- 参考スコア(独自算出の注目度): 6.933892616704001
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many knowledge sources consist of both structured information such as
relational databases as well as unstructured free text. Building a
conversational interface to such data sources is challenging.
This paper introduces SUQL, Structured and Unstructured Query Language, the
first formal executable representation that naturally covers compositions of
structured and unstructured data queries. Specifically, it augments SQL with
several free-text primitives to form a precise, succinct, and expressive
representation. This paper also presents a conversational search agent based on
large language models, including a few-shot contextual semantic parser for
SUQL.
To validate our approach, we introduce a dataset consisting of crowdsourced
questions and conversations about real restaurants. Over 51% of the questions
in the dataset require both structured and unstructured data, suggesting that
it is a common phenomenon. We show that our few-shot conversational agent based
on SUQL finds an entity satisfying all user requirements 89.3% of the time,
compared to just 65.0% for a strong and commonly used baseline.
- Abstract(参考訳): 多くの知識ソースは、リレーショナルデータベースのような構造化情報と非構造化自由テキストの両方から成り立っている。
このようなデータソースへの対話インターフェースの構築は難しい。
本稿では、構造化および非構造化データクエリの構成を自然にカバーする最初の形式的実行可能表現であるSUQL、Structured and Unstructured Query Languageを紹介する。
具体的には、SQLをいくつかのフリーテキストプリミティブで拡張し、正確で簡潔で表現力のある表現を形成する。
本稿では,SUQLの文脈意味解析機能を含む,大規模言語モデルに基づく対話型検索エージェントを提案する。
このアプローチを検証するために,実際のレストランに関するクラウドソース質問と会話からなるデータセットを導入する。
データセットの51%以上が構造化データと非構造化データの両方を必要としており、これは一般的な現象であることを示している。
SUQLをベースとした会話エージェントでは,強い,一般的に使用されるベースラインの65.0%に対して,すべてのユーザの要求を満たすエンティティが89.3%であることがわかった。
関連論文リスト
- STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストとリレーショナルベース知識に関する大規模半構造検索ベンチマークSTARKを開発した。
多様な情報と複雑なテキスト特性を統合した,自然かつ現実的なユーザクエリを合成する,新しいパイプラインを設計する。
本ベンチマークは,検索システムの性能評価のための総合的なテストベッドとして機能する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z) - NL2KQL: From Natural Language to Kusto Query [1.7931930942711818]
NL2KQLは、大規模言語モデル(LLM)を使用して自然言語クエリ(NLQ)をKusto Query Language(KQL)クエリに変換する革新的なフレームワークである。
NL2KQLのパフォーマンスを検証するために、オンライン(クエリ実行に基づく)とオフライン(クエリ解析に基づく)メトリクスの配列を使用します。
論文 参考訳(メタデータ) (2024-04-03T01:09:41Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Text-to-OverpassQL: A Natural Language Interface for Complex Geodata
Querying of OpenStreetMap [17.01783992725517]
OpenStreetMap (OSM)からジオデータをクエリするための自然言語インタフェースを容易にするタスクであるText-to-OverpassQLを提案する。
自然言語入力からOverpassクエリを生成することは、複数のユースケースに役立つ。
論文 参考訳(メタデータ) (2023-08-30T14:33:25Z) - QTSumm: Query-Focused Summarization over Tabular Data [58.62152746690958]
人々は主に、データ分析を行うか、特定の質問に答えるためにテーブルをコンサルティングします。
そこで本研究では,テキスト生成モデルに人間的な推論を行なわなければならない,クエリ中心のテーブル要約タスクを新たに定義する。
このタスクには,2,934テーブル上の7,111の人間注釈付きクエリ-サマリーペアを含む,QTSummという新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:43:51Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - BigText-QA: Question Answering over a Large-Scale Hybrid Knowledge Graph [23.739432128095107]
BigText-QAは構造化知識グラフに基づいて質問に答えることができる。
その結果,BigText-QAはニューラルネットワークベースのQAシステムであるDrQAよりも優れており,グラフベースの教師なしQAシステムであるQUESTと競合する結果が得られた。
論文 参考訳(メタデータ) (2022-12-12T09:49:02Z) - Open Domain Question Answering over Virtual Documents: A Unified
Approach for Data and Text [62.489652395307914]
我々は、知識集約型アプリケーションのための構造化知識を符号化する手段として、Data-to-text法、すなわち、オープンドメイン質問応答(QA)を用いる。
具体的には、ウィキペディアとウィキソースの3つのテーブルを付加知識源として使用する、データとテキスト上でのオープンドメインQAのための冗長化-レトリバー・リーダー・フレームワークを提案する。
UDT-QA(Unified Data and Text QA)は,知識インデックスの拡大を効果的に活用できることを示す。
論文 参考訳(メタデータ) (2021-10-16T00:11:21Z) - Dual Reader-Parser on Hybrid Textual and Tabular Evidence for Open
Domain Question Answering [78.9863753810787]
世界の知識は構造化データベースに保存されている。
クエリ言語は、複雑な推論を必要とする質問に答えるだけでなく、完全な説明可能性を提供することができる。
論文 参考訳(メタデータ) (2021-08-05T22:04:13Z) - ColloQL: Robust Cross-Domain Text-to-SQL Over Search Queries [10.273545005890496]
データ拡張技術とサンプリングベースコンテンツ対応BERTモデル(ColloQL)を紹介する。
ColloQLは、Wikilogicalデータセット上で84.9%(実行)と90.7%(実行)の精度を達成する。
論文 参考訳(メタデータ) (2020-10-19T23:53:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。