Fugu-MT 論文翻訳(概要): High-Throughput Vector Similarity Search in Knowledge Graphs

論文の概要: High-Throughput Vector Similarity Search in Knowledge Graphs

arxiv url: http://arxiv.org/abs/2304.01926v1
Date: Tue, 4 Apr 2023 16:19:15 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-05 13:14:56.802531
Title: High-Throughput Vector Similarity Search in Knowledge Graphs
Title（参考訳）: 知識グラフを用いた高速ベクトル類似度探索
Authors: Jason Mohoney, Anil Pacaci, Shihabur Rahman Chowdhury, Ali Mousavi, Ihab F. Ilyas, Umar Farooq Minhas, Jeffrey Pound, Theodoros Rekatsinas
Abstract要約: 最近のデータ管理システムでは,オンラインベクトル類似検索によるクエリ処理の拡張が提案されている。本稿では,クエリの一部がベクトル類似性検索に対応するような,ハイブリッドなベクトル類似性検索(略してハイブリッドクエリ)に焦点を当てる。本稿では,ハイブリッドクエリの高スループットバッチ処理のためのシステムHQIを提案する。
参考スコア（独自算出の注目度）: 17.41683819564348
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: There is an increasing adoption of machine learning for encoding data into vectors to serve online recommendation and search use cases. As a result, recent data management systems propose augmenting query processing with online vector similarity search. In this work, we explore vector similarity search in the context of Knowledge Graphs (KGs). Motivated by the tasks of finding related KG queries and entities for past KG query workloads, we focus on hybrid vector similarity search (hybrid queries for short) where part of the query corresponds to vector similarity search and part of the query corresponds to predicates over relational attributes associated with the underlying data vectors. For example, given past KG queries for a song entity, we want to construct new queries for new song entities whose vector representations are close to the vector representation of the entity in the past KG query. But entities in a KG also have non-vector attributes such as a song associated with an artist, a genre, and a release date. Therefore, suggested entities must also satisfy query predicates over non-vector attributes beyond a vector-based similarity predicate. While these tasks are central to KGs, our contributions are generally applicable to hybrid queries. In contrast to prior works that optimize online queries, we focus on enabling efficient batch processing of past hybrid query workloads. We present our system, HQI, for high-throughput batch processing of hybrid queries. We introduce a workload-aware vector data partitioning scheme to tailor the vector index layout to the given workload and describe a multi-query optimization technique to reduce the overhead of vector similarity computations. We evaluate our methods on industrial workloads and demonstrate that HQI yields a 31x improvement in throughput for finding related KG queries compared to existing hybrid query processing approaches.
Abstract（参考訳）: オンラインレコメンデーションと検索のユースケースを提供するために、ベクターにデータをエンコードするための機械学習の採用が増えている。その結果、最近のデータ管理システムでは、オンラインベクトル類似検索によるクエリ処理の強化が提案されている。本研究では,知識グラフ(KG)の文脈におけるベクトル類似性探索について検討する。 KGクエリと過去のKGクエリ処理のエンティティを検索するタスクによって、クエリの一部がベクトル類似性検索に対応し、クエリの一部が基礎となるデータベクトルに関連する関係属性を述語するハイブリッドベクトル類似性検索(略してハイブリッドクエリ)に焦点を当てる。例えば、過去のKGクエリが楽曲エンティティに対して与えられた場合、ベクトル表現が過去のKGクエリのエンティティのベクトル表現に近い新しい曲エンティティのための新しいクエリを構築したい。しかし、KGのエンティティは、アーティストに関連する曲、ジャンル、リリース日といった非ベクター属性も持っている。したがって、提案されたエンティティは、ベクトルベースの類似性述語以外の非ベクトル属性に対するクエリ述語も満たさなければならない。これらのタスクはKGの中心ですが、私たちのコントリビューションは一般的にハイブリッドクエリに適用できます。オンラインクエリを最適化する以前の作業とは対照的に、過去のハイブリッドクエリワークロードの効率的なバッチ処理の実現に重点を置いています。本稿では,ハイブリッドクエリの高スループットバッチ処理のためのシステムhqiを提案する。本稿では,与えられたワークロードに対してベクトルインデックスレイアウトを調整するためのワークロード対応ベクトルデータパーティショニングスキームを導入し,ベクトル類似性計算のオーバーヘッドを削減するマルチクエリ最適化手法について述べる。産業負荷に対する我々の手法を評価し,HQIが既存のハイブリッドクエリ処理手法と比較して,関連するKGクエリのスループットを31倍に向上することを示す。

関連論文リスト

SAGE: Structure Aware Graph Expansion for Retrieval of Heterogeneous Data [47.930782177987446]
不均一なコーパスに答える検索拡張された質問は、テキスト、テーブル、グラフノード間で接続されたエビデンスを必要とする。標準レトリバーリーダーパイプラインは、独立にチャンクされたテキスト上の平坦な類似性検索を使用し、モダリティ間のマルチホップエビデンスチェーンを欠いている。 SAGE(Structure Aware Graph Expansion)フレームワークを提案する。これは、パーセンタイルベースのプルーニングとメタデータ駆動の類似性を利用して、チャンクレベルのグラフをオフラインで構築する。暗黙的クロスモーダルコーパスと明示的スキーマグラフのエージェント検索であるSPARK(Structure Aware Planning Agent for Retrieval over Knowledge Graphs)のハイブリッド高密度スパース検索を用いて初期検索をインスタンス化する。
論文参考訳（メタデータ） (2026-02-18T23:57:19Z)
Beyond Nearest Neighbors: Semantic Compression and Graph-Augmented Retrieval for Enhanced Vector Search [2.377892000761193]
本稿では,クエリの周囲のより広いセマンティック構造をキャプチャする,コンパクトで代表的なベクトル群を選択することを目的としたセマンティック圧縮という新しい検索パラダイムを提案する。このアイデアを運用するために,ベクトル空間上に意味グラフ(kNNや知識ベースリンクなど)をオーバーレイするグラフ拡張ベクター検索を提案する。本研究は,ハイブリットインデックス,多様性を考慮したクエリ,構造化セマンティック検索を重視した意味中心ベクトル探索システムの基礎を概説する。
論文参考訳（メタデータ） (2025-07-25T23:35:11Z)
Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.71038700559195]
The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。 SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文参考訳（メタデータ） (2025-07-14T08:41:53Z)
LLM-assisted Vector Similarity Search [0.0]
本稿では,ベクトル類似性探索とLarge Language Models(LLMs)を組み合わせたハイブリッド手法を提案する。構造化データセットの実験では、ベクトル類似性検索は単純なクエリに対してのみうまく機能するが、LLM支援アプローチは制約、否定、概念的な要求を含む複雑なクエリを処理するのに優れている。
論文参考訳（メタデータ） (2024-12-25T08:17:37Z)
Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.33342412699939]
知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文参考訳（メタデータ） (2024-10-27T03:18:52Z)
Operational Advice for Dense and Sparse Retrievers: HNSW, Flat, or Inverted Indexes? [62.57689536630933]
本稿では,オープンソースのLucene検索ライブラリを用いたBEIRデータセットの実験結果について述べる。本研究は,高密度かつ疎密なレトリバーの設計空間を理解するための,今日の検索実践者へのガイダンスを提供する。
論文参考訳（メタデータ） (2024-09-10T12:46:23Z)
User Intent Recognition and Semantic Cache Optimization-Based Query Processing Framework using CFLIS and MGR-LAU [0.0]
この研究は、拡張QPのためのクエリにおける情報、ナビゲーション、およびトランザクションベースのインテントを分析した。効率的なQPのために、データはEpanechnikov Kernel-Ordering Pointsを用いて構造化され、クラスタリング構造(EK-OPTICS)を同定する。抽出された特徴、検出された意図、構造化データは、MGR-LAU(Multi-head Gated Recurrent Learnable Attention Unit)に入力される。
論文参考訳（メタデータ） (2024-06-06T20:28:05Z)
Generative Retrieval as Multi-Vector Dense Retrieval [71.75503049199897]
生成検索は、文書の識別子をエンドツーエンドで生成する。それまでの研究は、原子識別子による生成的検索が単一ベクトル密度検索と等価であることを示した。生成的検索と多ベクトル高密度検索は,文書の問合せに対する関連性を測定するのと同じ枠組みを共有していることを示す。
論文参考訳（メタデータ） (2024-03-31T13:29:43Z)
Efficient Data Access Paths for Mixed Vector-Relational Search [8.80592433569832]
機械学習とベクトル埋め込みを用いたデータ処理手法の採用は、ベクトルデータ管理のためのシステム構築に大きな関心を喚起した。ベクトルデータ管理の主流のアプローチは、ベクトル埋め込み全体を高速に検索するために特別なインデックス構造を使用することであるが、一度他の(メタ)データと組み合わせると、検索クエリはリレーショナル属性に対して選択的になる。ベクトルインデックスは従来の関係データアクセスと異なるため、効率的な混合ベクトル関係探索のための代替アクセスパスを再検討し分析する。
論文参考訳（メタデータ） (2024-03-23T11:34:17Z)
LeanVec: Searching vectors faster by making them fit [1.0863382547662974]
本稿では,高次元ベクトル上での類似性探索を高速化するために,線形次元減少とベクトル量子化を組み合わせたフレームワークLeanVecを提案する。 LeanVecは、検索のスループットを最大3.7倍改善し、インデックスビルド時間を最大4.9倍高速化する、最先端の結果を生成する。
論文参考訳（メタデータ） (2023-12-26T21:14:59Z)
Building Interpretable and Reliable Open Information Retriever for New Domains Overnight [67.03842581848299]
情報検索は、オープンドメイン質問応答(QA)など、多くのダウンストリームタスクにとって重要な要素である。本稿では、エンティティ/イベントリンクモデルとクエリ分解モデルを用いて、クエリの異なる情報単位により正確にフォーカスする情報検索パイプラインを提案する。より解釈可能で信頼性が高いが,提案したパイプラインは,5つのIRおよびQAベンチマークにおける通過カバレッジと記述精度を大幅に向上することを示す。
論文参考訳（メタデータ） (2023-08-09T07:47:17Z)
UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文参考訳（メタデータ） (2022-12-02T04:08:09Z)
Navigable Proximity Graph-Driven Native Hybrid Queries with Structured and Unstructured Constraints [10.842138336245384]
本稿では,近接グラフ(PG)に基づくネイティブハイブリッドクエリ(NHQ)フレームワークを提案する。エッジ選択とルーティング戦略を最適化したナビゲーション可能な新しいPGを2つ提案し、既存のPGよりも全体的な性能が向上した。
論文参考訳（メタデータ） (2022-03-25T12:02:37Z)
Learning Query Expansion over the Nearest Neighbor Graph [94.80212602202518]
グラフクエリ拡張(GQE)が提示され、教師付き方法で学習され、クエリの拡張近傍で集約を実行する。この技術は既知のベンチマークよりも最先端の結果が得られる。
論文参考訳（メタデータ） (2021-12-05T19:48:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。