論文の概要: Navigable Proximity Graph-Driven Native Hybrid Queries with Structured
and Unstructured Constraints
- arxiv url: http://arxiv.org/abs/2203.13601v1
- Date: Fri, 25 Mar 2022 12:02:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-28 14:39:50.928875
- Title: Navigable Proximity Graph-Driven Native Hybrid Queries with Structured
and Unstructured Constraints
- Title(参考訳): 構造化および非構造化制約付きナビゲート可能なグラフ駆動ネイティブハイブリッドクエリ
- Authors: Mengzhao Wang, Lingwei Lv, Xiaoliang Xu, Yuxiang Wang, Qiang Yue,
Jiongkang Ni
- Abstract要約: 本稿では,近接グラフ(PG)に基づくネイティブハイブリッドクエリ(NHQ)フレームワークを提案する。
エッジ選択とルーティング戦略を最適化したナビゲーション可能な新しいPGを2つ提案し、既存のPGよりも全体的な性能が向上した。
- 参考スコア(独自算出の注目度): 10.842138336245384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As research interest surges, vector similarity search is applied in multiple
fields, including data mining, computer vision, and information retrieval.
{Given a set of objects (e.g., a set of images) and a query object, we can
easily transform each object into a feature vector and apply the vector
similarity search to retrieve the most similar objects. However, the original
vector similarity search cannot well support \textit{hybrid queries}, where
users not only input unstructured query constraint (i.e., the feature vector of
query object) but also structured query constraint (i.e., the desired
attributes of interest). Hybrid query processing aims at identifying these
objects with similar feature vectors to query object and satisfying the given
attribute constraints. Recent efforts have attempted to answer a hybrid query
by performing attribute filtering and vector similarity search separately and
then merging the results later, which limits efficiency and accuracy because
they are not purpose-built for hybrid queries.} In this paper, we propose a
native hybrid query (NHQ) framework based on proximity graph (PG), which
provides the specialized \textit{composite index and joint pruning} modules for
hybrid queries. We easily deploy existing various PGs on this framework to
process hybrid queries efficiently. Moreover, we present two novel navigable
PGs (NPGs) with optimized edge selection and routing strategies, which obtain
better overall performance than existing PGs. After that, we deploy the
proposed NPGs in NHQ to form two hybrid query methods, which significantly
outperform the state-of-the-art competitors on all experimental datasets
(10$\times$ faster under the same \textit{Recall}), including eight public and
one in-house real-world datasets. Our code and datasets have been released at
\url{https://github.com/AshenOn3/NHQ}.
- Abstract(参考訳): 研究の関心が高まるにつれて、ベクトル類似性探索はデータマイニング、コンピュータビジョン、情報検索など様々な分野に適用される。
一連のオブジェクト(イメージのセットなど)とクエリオブジェクトを使えば、各オブジェクトを簡単に特徴ベクトルに変換して、ベクトル類似性検索を適用して、最も類似したオブジェクトを取得することができます。
しかし、元のベクトル類似性検索は、未構造化クエリ制約(すなわち、クエリオブジェクトの特徴ベクトル)だけでなく、構造化クエリ制約(すなわち、所望の興味のある属性)も入力する、 \textit{hybrid query} を十分にサポートできない。
ハイブリッドクエリ処理は、オブジェクトに類似した機能ベクトルでこれらのオブジェクトを識別し、与えられた属性制約を満たすことを目的としている。
近年,属性フィルタリングとベクトル類似性探索を別々に行い,その結果をマージすることで,ハイブリッドクエリを目的としていないため,効率と精度を抑える手法が試みられている。
本稿では,ハイブリッドクエリのための特別な\textit{composite index and joint pruning}モジュールを提供する,近接グラフ(pg)に基づくネイティブハイブリッドクエリ(nhq)フレームワークを提案する。
このフレームワーク上で既存の様々なPGを簡単にデプロイし、ハイブリッドクエリを効率的に処理します。
さらに、エッジ選択とルーティング戦略を最適化した2つの新しいナビゲート型PG(NPG)を提案し、既存のPGよりも全体的な性能が向上した。
その後、提案されたNPGをNHQにデプロイして、2つのハイブリッドクエリメソッドを構築しました。これは、すべての実験データセット(同じ \textit{Recall} の下で10$\times$高速)において、最先端の競合よりも大幅に優れています。
我々のコードとデータセットは \url{https://github.com/AshenOn3/NHQ} でリリースされた。
関連論文リスト
- DAGE: DAG Query Answering via Relational Combinator with Logical Constraints [24.60431781360608]
DAGEと呼ばれるDAGクエリに対するクエリ埋め込み手法を提案する。
DAGEは2つのノード間の可能性のある複数のパスを、トレーニング可能なオペレータで単一のパスに結合する。
既存のクエリ埋め込みメソッド上にDAGEを実装することが可能であることを示す。
論文 参考訳(メタデータ) (2024-10-29T15:02:48Z) - Database-Augmented Query Representation for Information Retrieval [59.57065228857247]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。
DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。
リレーショナルデータベースのメタデータを組み込む様々な検索シナリオにおいてDAQuを検証する。
論文 参考訳(メタデータ) (2024-06-23T05:02:21Z) - Generative Retrieval as Multi-Vector Dense Retrieval [71.75503049199897]
生成検索は、文書の識別子をエンドツーエンドで生成する。
それまでの研究は、原子識別子による生成的検索が単一ベクトル密度検索と等価であることを示した。
生成的検索と多ベクトル高密度検索は,文書の問合せに対する関連性を測定するのと同じ枠組みを共有していることを示す。
論文 参考訳(メタデータ) (2024-03-31T13:29:43Z) - Group Testing for Accurate and Efficient Range-Based Near Neighbor Search for Plagiarism Detection [2.3814052021083354]
本研究は, 近接探索問題に対する適応型群検定フレームワークを提案する。
本研究では,データベース内の各項目を問合せ点の隣人あるいは非隣人として,余剰距離閾値に基づいて効率よくマークする。
本研究では,ソフトマックスに基づく特徴量を用いて,完全探索よりも10倍以上の高速化を実現し,精度を損なわないことを示す。
論文 参考訳(メタデータ) (2023-11-05T06:12:03Z) - High-Throughput Vector Similarity Search in Knowledge Graphs [17.41683819564348]
最近のデータ管理システムでは,オンラインベクトル類似検索によるクエリ処理の拡張が提案されている。
本稿では,クエリの一部がベクトル類似性検索に対応するような,ハイブリッドなベクトル類似性検索(略してハイブリッドクエリ)に焦点を当てる。
本稿では,ハイブリッドクエリの高スループットバッチ処理のためのシステムHQIを提案する。
論文 参考訳(メタデータ) (2023-04-04T16:19:15Z) - Integrating connection search in graph queries [6.948362325254044]
SPARQLやCypherといったグラフクエリ言語に接続ツリーパターン(CTP)を統合する方法を示す。
非常に大きな探索空間に対処するため,我々は効率的な刈り込み手法を提案し,我々のアルゴリズムMOLESPがプルーニングでも完備しているケースの集合を正式に確立する。
論文 参考訳(メタデータ) (2022-08-09T14:27:57Z) - Query2Particles: Knowledge Graph Reasoning with Particle Embeddings [49.64006979045662]
本稿では,知識グラフにエッジを欠いた複雑な論理的クエリに応答するクエリ埋め込み手法を提案する。
回答エンティティは、エンティティの埋め込みとクエリの埋め込みの類似性に応じて選択される。
埋め込み空間上の様々な領域から多様な回答を検索するために,複雑なKGクエリ応答方法Q2Pを提案する。
論文 参考訳(メタデータ) (2022-04-27T11:16:08Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - Generation-Augmented Retrieval for Open-domain Question Answering [134.27768711201202]
GAR(Generation-Augmented Retrieval)は、オープンドメインの質問に答える機能である。
クエリーに対して多様なコンテキストを生成することは、結果の融合が常により良い検索精度をもたらすので有益であることを示す。
GARは、抽出読取装置を備えた場合、抽出QA設定の下で、自然質問およびトリビアQAデータセットの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-09-17T23:08:01Z) - Query Understanding via Intent Description Generation [75.64800976586771]
問合せ理解のためのQ2ID(Query-to-Intent-Description)タスクを提案する。
クエリとその記述を利用してドキュメントの関連性を計算する既存のランキングタスクとは異なり、Q2IDは自然言語のインテント記述を生成するための逆タスクである。
Q2IDタスクにおける複数の最先端生成モデルとの比較により,本モデルの有効性を実証する。
論文 参考訳(メタデータ) (2020-08-25T08:56:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。