論文の概要: Context-Enhanced Relational Operators with Vector Embeddings
- arxiv url: http://arxiv.org/abs/2312.01476v1
- Date: Sun, 3 Dec 2023 18:23:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 17:07:32.712792
- Title: Context-Enhanced Relational Operators with Vector Embeddings
- Title(参考訳): ベクトル埋め込みを持つ文脈エンハンス関係作用素
- Authors: Viktor Sanca, Manos Chatzakis, Anastasia Ailamaki
- Abstract要約: 本稿では,コンテキスト強化型リレーショナル結合を提案し,リレーショナル演算子と結合可能な埋め込み演算子を提案する。
これにより、リレーショナル代数と代数的同値性を持つハイブリッドリレーショナルおよびコンテキストリッチなベクトルデータ処理が可能となる。
論理的から物理的まで、全体最適化の重要性は、実行時間を大幅に改善する順に示される。
- 参考スコア(独自算出の注目度): 8.80592433569832
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collecting data, extracting value, and combining insights from relational and
context-rich multi-modal sources in data processing pipelines presents a
challenge for traditional relational DBMS. While relational operators allow
declarative and optimizable query specification, they are limited to data
transformations unsuitable for capturing or analyzing context. On the other
hand, representation learning models can map context-rich data into embeddings,
allowing machine-automated context processing but requiring imperative data
transformation integration with the analytical query.
To bridge this dichotomy, we present a context-enhanced relational join and
introduce an embedding operator composable with relational operators. This
enables hybrid relational and context-rich vector data processing, with
algebraic equivalences compatible with relational algebra and corresponding
logical and physical optimizations. We investigate model-operator interaction
with vector data processing and study the characteristics of the E-join
operator. Using an example of string embeddings, we demonstrate enabling hybrid
context-enhanced processing on relational join operators with vector
embeddings. The importance of holistic optimization, from logical to physical,
is demonstrated in an order of magnitude execution time improvement.
- Abstract(参考訳): データ収集、値抽出、およびデータ処理パイプラインにおけるリレーショナルとコンテキストに富んだマルチモーダルソースからの洞察の組み合わせは、従来のリレーショナルDBMSにとっての課題である。
リレーショナル演算子は宣言的で最適化可能なクエリ仕様を許すが、コンテキストのキャプチャや分析には適さないデータ変換に限られる。
一方、表現学習モデルは、文脈に富んだデータを埋め込みにマッピングし、マシン自動化されたコンテキスト処理を可能にする。
この二分法を橋渡しするために,関係演算子と結合可能な埋め込み演算子を提案する。
これにより、リレーショナル代数と対応する論理的および物理的最適化と代数的同値性を持つハイブリッドリレーショナルおよびコンテキストリッチなベクトルデータ処理が可能となる。
ベクトルデータ処理とモデル・オペレータの相互作用を調査し,e-join演算子の特性について検討する。
文字列埋め込みの例を用いて,ベクトル埋め込みを用いた関係結合演算子上でのコンテキスト強調処理の実現を実証する。
論理的から物理的まで、全体最適化の重要性は、実行時間を大幅に改善する順に示される。
関連論文リスト
- Understanding Synthetic Context Extension via Retrieval Heads [51.8869530817334]
本稿では,検索と推論を必要とする3つの長文タスクに対する合成データの微調整について検討する。
合成データに基づいてトレーニングされたモデルは、実際のデータには及ばないが、驚くべきことに、ミスマッチを解釈できる。
我々の結果は、合成データの微調整性能の解釈方法と、長期にわたる実世界の能力学習のためのより良いデータ作成方法に光を当てた。
論文 参考訳(メタデータ) (2024-10-29T17:55:00Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - Modeling Comparative Logical Relation with Contrastive Learning for Text Generation [43.814189025925096]
比較論理関係生成(CLRG)と呼ばれる新しいD2Tタスクを導入する。
比較論理(CoLo)に基づくテキスト生成手法を提案する。
本手法は, 自動評価と人的評価の両方において, 優れた性能を実現する。
論文 参考訳(メタデータ) (2024-06-13T13:25:50Z) - Type-based Neural Link Prediction Adapter for Complex Query Answering [2.1098688291287475]
本稿では,タイプベースエンティティ関係グラフを構成する新しいモデルであるTypEベースのニューラルリンク予測アダプタ(TENLPA)を提案する。
型情報と複雑な論理的クエリを効果的に結合するために,適応学習機構を導入する。
3つの標準データセットの実験により、TENLPAモデルが複雑なクエリ応答における最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-01-29T10:54:28Z) - GADePo: Graph-Assisted Declarative Pooling Transformers for Document-Level Relation Extraction [28.403174369346715]
本稿では,共同テキストグラフ変換モデルとグラフ支援宣言型プール(GADePo)仕様を導入する。
GADePoにより、プールプロセスはドメイン固有の知識や望ましい結果によってガイドされるが、Transformerによって学習される。
提案手法は,手書きプーリング関数により達成された結果よりも一貫した有望な結果が得られることを示す。
論文 参考訳(メタデータ) (2023-08-28T09:04:03Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - Analytical Engines With Context-Rich Processing: Towards Efficient
Next-Generation Analytics [12.317930859033149]
我々は、文脈に富む分析を可能にするコンポーネントと協調して最適化された分析エンジンを構想する。
我々は、リレーショナルおよびモデルベース演算子間の総括的なパイプラインコストとルールベースの最適化を目指している。
論文 参考訳(メタデータ) (2022-12-14T21:46:33Z) - Logical Reasoning for Task Oriented Dialogue Systems [57.440956636333325]
本稿では,ロバータやT5などの変圧器モデルに対して,与えられた対話コンテキストにおける事実の集合を推論する新しい手法を提案する。
本手法は,モデルが論理関係を学習するのに役立つ合成データ生成機構を含む。
対話コンテキストが全ての必要な情報を含む場合、変換器に基づくモデルが論理的推論を行い、質問に答えることを示す。
論文 参考訳(メタデータ) (2022-02-08T21:46:27Z) - Iterative Rule Extension for Logic Analysis of Data: an MILP-based
heuristic to derive interpretable binary classification from large datasets [0.6526824510982799]
この研究は、最大10,000のサンプルとサンプル特性を持つデータからDNFのブールフレーズを抽象化するアルゴリズムIRELANDを提示する。
その結果、大規模なデータセットIRELANDは現在の最先端よりも優れており、現在のモデルがメモリを使い果たしたり、過剰なランタイムを必要とするデータセットのソリューションを見つけることができることがわかった。
論文 参考訳(メタデータ) (2021-10-25T13:31:30Z) - HittER: Hierarchical Transformers for Knowledge Graph Embeddings [85.93509934018499]
複雑な知識グラフにおける実体と関係の表現を学習するためにHittを提案する。
実験結果から,Hittは複数リンク予測において最先端の新たな結果が得られることがわかった。
さらに,HittをBERTに統合する簡単なアプローチを提案し,その効果を2つのFreebaseファクトイド対応データセットで示す。
論文 参考訳(メタデータ) (2020-08-28T18:58:15Z) - Relation of the Relations: A New Paradigm of the Relation Extraction
Problem [52.21210549224131]
我々は,関係抽出(RE)の新たなパラダイムを提案し,同じ文脈におけるすべての関係の予測を総合的に検討する。
我々は、手作りのルールを必要としないデータ駆動型アプローチを開発し、グラフニューラルネットワークと関係行列変換器を用いた関係関係(RoR)をそれ自体で学習する。
実験の結果、私たちのモデルはACE05データセットでは+1.12%、SemEval 2018 Task 7.2では2.55%で最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-06-05T22:25:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。