論文の概要: Towards Multi-Modal DBMSs for Seamless Querying of Texts and Tables
- arxiv url: http://arxiv.org/abs/2304.13559v2
- Date: Fri, 28 Apr 2023 14:55:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-01 11:09:35.387938
- Title: Towards Multi-Modal DBMSs for Seamless Querying of Texts and Tables
- Title(参考訳): テキストとテーブルのシームレスなクエリのためのマルチモーダルdbmsに向けて
- Authors: Matthias Urban and Carsten Binnig
- Abstract要約: マルチモーダルリレーショナル演算子(MMOps)によるデータベースの拡張を提案する。
MMOpsでは、手動でデータ変換することなく、テキストコレクションをテーブルとして扱うことができる。
我々のMMDBプロトタイプは、テキスト・ツー・テーブルのような最先端のアプローチを精度と性能の点で上回りません。
- 参考スコア(独自算出の注目度): 14.249508312922334
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose Multi-Modal Databases (MMDBs), which is a new class
of database systems that can seamlessly query text and tables using SQL. To
enable seamless querying of textual data using SQL in an MMDB, we propose to
extend relational databases with so-called multi-modal operators (MMOps) which
are based on the advances of recent large language models such as GPT-3. The
main idea of MMOps is that they allow text collections to be treated as tables
without the need to manually transform the data. As we show in our evaluation,
our MMDB prototype can not only outperform state-of-the-art approaches such as
text-to-table in terms of accuracy and performance but it also requires
significantly less training data to fine-tune the model for an unseen text
collection.
- Abstract(参考訳): 本稿では,SQL を用いてテキストやテーブルをシームレスにクエリできる新しいデータベースシステムである Multi-Modal Databases (MMDB) を提案する。
MMDBにおけるSQLを用いたテキストデータのシームレスなクエリを実現するために,GPT-3のような最近の大規模言語モデルの発展を基盤として,いわゆるマルチモーダル演算子(MMOps)による関係データベースの拡張を提案する。
MMOpsの主な考え方は、手動でデータを変換することなく、テキストコレクションをテーブルとして扱うことができることだ。
評価で示すように,我々のMMDBプロトタイプは,テキスト・ツー・テーブルのような最先端のアプローチを精度と性能で上回るだけでなく,未知のテキスト・コレクションのモデルを微調整するためには,トレーニングデータも大幅に少なくする。
関連論文リスト
- Metasql: A Generate-then-Rank Framework for Natural Language to SQL
Translation [10.812409371488913]
本稿では,既存のNLIDBに柔軟に組み込むことができ,翻訳精度を一貫して向上する統合生成列フレームワークを提案する。
Metasqlは、より良いクエリ候補の生成を制御するためにクエリメタデータを導入し、グローバルに最適化されたクエリを検索するために学習からランクアルゴリズムを使用する。
その結果,Metasqlを用いて翻訳モデルの性能を効果的に改善できることが示唆された。
論文 参考訳(メタデータ) (2024-02-27T02:16:07Z) - SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data [54.69489315952524]
Prompt"は、Text-to-LLMのいくつかのショットプロンプト機能を改善するように設計されている。
Prompt"は、ラベル付きデータが少なく、テキスト内学習における従来のアプローチよりも大きなマージンで優れている。
emphPromptはテキスト内学習における従来の手法よりも優れており,ラベル付きデータはほとんどない。
論文 参考訳(メタデータ) (2023-11-06T05:24:06Z) - UNITE: A Unified Benchmark for Text-to-SQL Evaluation [72.72040379293718]
テキスト・ツー・ドメイン・システムのためのUNIfiedベンチマークを導入する。
公開されているテキストからドメインへのデータセットと29Kデータベースで構成されている。
広く使われているSpiderベンチマークと比較すると、SQLパターンの3倍の増加が紹介されている。
論文 参考訳(メタデータ) (2023-05-25T17:19:52Z) - Prompting GPT-3.5 for Text-to-SQL with De-semanticization and Skeleton
Retrieval [17.747079214502673]
Text-to-は、自然言語の質問を構造化されたクエリ言語()に変換し、データベースから情報を取得するタスクである。
本稿では,テキスト・トゥ・テキストのための LLM ベースのフレームワークを提案する。
我々は,疑問骨格を抽出する非意味化機構を設計し,その構造的類似性に基づいて類似した例を検索する。
論文 参考訳(メタデータ) (2023-04-26T06:02:01Z) - Querying Large Language Models with SQL [16.383179496709737]
多くのユースケースでは、情報はテキストに格納されるが、構造化データでは利用できない。
事前訓練されたLarge Language Models (LLMs) の台頭に伴い、大量のテキストコーパスから抽出された情報を保存および使用するための効果的なソリューションが現在存在する。
本稿では,従来のデータベースアーキテクチャに基づくプロトタイプであるGaloisについて紹介する。
論文 参考訳(メタデータ) (2023-04-02T06:58:14Z) - Diverse Parallel Data Synthesis for Cross-Database Adaptation of
Text-to-SQL Parsers [21.272952382662215]
新しいデータベースへの適応は、新しいスキーマに自然言語クエリがないため、難しい問題である。
ターゲットスキーマにText-to-editを適用するためのフレームワークであるReFillを提案する。
論文 参考訳(メタデータ) (2022-10-29T14:30:53Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - UniSAr: A Unified Structure-Aware Autoregressive Language Model for
Text-to-SQL [48.21638676148253]
We present UniSAr (Unified Structure-Aware Autoregressive Language Model), which is benefit of using a off-the-shelf language model。
具体的には、UniSArは既存の自己回帰モデルを拡張して、3つの非侵襲的拡張を組み込んで構造認識する。
論文 参考訳(メタデータ) (2022-03-15T11:02:55Z) - BERT Meets Relational DB: Contextual Representations of Relational
Databases [4.029818252558553]
複数のテーブルからなる関係データベース上でエンティティの低次元表現を学習する問題に対処する。
これらの注意に基づくモデルを使用して、リレーショナルデータベース内のエンティティの埋め込みを学ぶ方法を検討します。
論文 参考訳(メタデータ) (2021-04-30T11:23:26Z) - Structure-Grounded Pretraining for Text-to-SQL [75.19554243393814]
本稿では,テキストからLARGEへの構造化事前学習フレームワーク(G)について述べる。
カラムグラウンド、バリューグラウンド、カラム値マッピングといった新しい予測タスクのセットを特定し、それらをテキストテーブルエンコーダの事前訓練に活用する。
論文 参考訳(メタデータ) (2020-10-24T04:35:35Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。