論文の概要: A Scalable Space-efficient In-database Interpretability Framework for
Embedding-based Semantic SQL Queries
- arxiv url: http://arxiv.org/abs/2302.12178v2
- Date: Fri, 24 Feb 2023 17:22:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-27 15:47:40.590472
- Title: A Scalable Space-efficient In-database Interpretability Framework for
Embedding-based Semantic SQL Queries
- Title(参考訳): 埋め込み型セマンティックSQLクエリのためのスケーラブルな空間効率インデータベース解釈フレームワーク
- Authors: Prabhakar Kudva, Rajesh Bordawekar, Apoorva Nitsure
- Abstract要約: 我々は、関係エンティティ間の関係を捉えるために、共起に基づく新しい解釈可能性アプローチを導入する。
我々のアプローチは、クエリ非依存(グロバル)とクエリ特化(ローカル)の両方の解釈機能を提供する。
- 参考スコア(独自算出の注目度): 3.0938904602244346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI-Powered database (AI-DB) is a novel relational database system that uses a
self-supervised neural network, database embedding, to enable semantic SQL
queries on relational tables. In this paper, we describe an architecture and
implementation of in-database interpretability infrastructure designed to
provide simple, transparent, and relatable insights into ranked results of
semantic SQL queries supported by AI-DB. We introduce a new co-occurrence based
interpretability approach to capture relationships between relational entities
and describe a space-efficient probabilistic Sketch implementation to store and
process co-occurrence counts. Our approach provides both query-agnostic
(global) and query-specific (local) interpretabilities. Experimental evaluation
demonstrate that our in-database probabilistic approach provides the same
interpretability quality as the precise space-inefficient approach, while
providing scalable and space efficient runtime behavior (up to 8X space
savings), without any user intervention.
- Abstract(参考訳): AI-Powered Database(AI-DB)は、リレーショナルテーブル上のセマンティックSQLクエリを可能にする、自己教師付きニューラルネットワークであるデータベース埋め込みを使用する、新しいリレーショナルデータベースシステムである。
本稿では、AI-DBがサポートするセマンティックSQLクエリのランキング結果に対する、シンプルで透明で関連性の高い洞察を提供するために設計されたデータベース内解釈可能性インフラストラクチャのアーキテクチャと実装について述べる。
我々は,共起数を保存するための空間効率のよい確率的スケッチ実装を記述するために,共起数に基づく新しい解釈可能性アプローチを導入する。
このアプローチはクエリ非依存(グローバル)とクエリ固有(ローカル)の両方の解釈を提供する。
実験により、我々のデータベース内確率的アプローチは、正確な空間非効率アプローチと同じ解釈可能性品質を提供する一方で、スケーラブルで空間効率のよい実行時挙動(最大8倍の空間節約)をユーザーの介入なしに提供することを示した。
関連論文リスト
- Interactive-T2S: Multi-Turn Interactions for Text-to-SQL with Large Language Models [9.914489049993495]
本稿では,データベースとの直接対話を通じてクエリを生成するフレームワークであるInteractive-T2Sを紹介する。
フレームワーク内のステップワイズ推論プロセスを示すための詳細な例を開発してきた。
BIRD-Devデータセットを用いた実験により,本手法が最先端の成果を達成できたのは2つの例に過ぎなかった。
論文 参考訳(メタデータ) (2024-08-09T07:43:21Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers [61.48159785138462]
本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。
5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-09-14T06:27:51Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - BERT Meets Relational DB: Contextual Representations of Relational
Databases [4.029818252558553]
複数のテーブルからなる関係データベース上でエンティティの低次元表現を学習する問題に対処する。
これらの注意に基づくモデルを使用して、リレーショナルデータベース内のエンティティの埋め込みを学ぶ方法を検討します。
論文 参考訳(メタデータ) (2021-04-30T11:23:26Z) - Dynamic Hybrid Relation Network for Cross-Domain Context-Dependent
Semantic Parsing [52.24507547010127]
ドメイン間コンテキスト依存のセマンティック解析は研究の新たな焦点である。
本稿では,コンテキストの発話,トークン,データベーススキーマ,会話の進行に伴う複雑なインタラクションを効果的にモデル化する動的グラフフレームワークを提案する。
提案したフレームワークは既存のモデルを大きなマージンで上回り、2つの大規模ベンチマークで新しい最先端性能を達成する。
論文 参考訳(メタデータ) (2021-01-05T18:11:29Z) - Complex Coordinate-Based Meta-Analysis with Probabilistic Programming [0.0]
報告されたピークアクティベーションの座標と項関連を自動的に抽出することにより、コーディネートベースのメタアナリシス(CBMA)データベースを構築する。
本稿では,近年,大規模なニューロイメージングデータに拡張可能なクエリ処理アルゴリズムについて述べる。
シミュレーションされたメタアナリシスデータベースと広く使われているニューロシンスデータベースの両方において、2つの長期接続型クエリの結果を示す。
論文 参考訳(メタデータ) (2020-12-02T16:16:26Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - On Embeddings in Relational Databases [11.52782249184251]
低次元埋め込みを用いた関係データベースにおけるエンティティの分散表現学習の問題に対処する。
近年の埋め込み学習法は,すべてのテーブルの完全結合をリレーショナル化し,知識グラフとして表すことにより,データベースの完全非正規化を考慮に入れたナイーブな手法である。
本稿では,テーブル内の列の基本的なセマンティクスを利用して表現を学習する上で,関係結合と潜時関係を用いて,より優れた方法論を実証する。
論文 参考訳(メタデータ) (2020-05-13T17:21:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。