論文の概要: Retrieval with Multiple Query Vectors through Anomalous Pattern Detection
- arxiv url: http://arxiv.org/abs/2605.01965v1
- Date: Sun, 03 May 2026 16:51:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.020415
- Title: Retrieval with Multiple Query Vectors through Anomalous Pattern Detection
- Title(参考訳): 異常パターン検出による複数クエリベクトルの検索
- Authors: Allassan Tchangmena A Nken, Baimam Boukar Jean Jacques, Miriam Rateike, Celia Cintas, Skyler Speakman,
- Abstract要約: 古典的ベクトル検索問題は典型的には、Emphsingleクエリの埋め込みベクトルを入力として考慮し、最もよく似た埋め込みベクトルをベクトルデータベースから検索する。
本稿では,複数のクエリベクトルを同時に検討し,異常パターン検出の概念を用いてデータベースから最も関連性の高いベクトルを検索する手法を提案する。
- 参考スコア(独自算出の注目度): 3.5501866628044563
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A classical vector retrieval problem typically considers a \emph{single} query embedding vector as input and retrieves the most similar embedding vectors from a vector database. However, complex reasoning and retrieval tasks frequently require \emph{multiple query vectors}, rather than a single one. In this work, we propose a retrieval method that considers multiple query vectors simultaneously and retrieves the most relevant vectors from the database using concepts from anomalous pattern detection. Specifically, our approach leverages a set of query vectors $Q$ (with $|Q|\geq 1$), and identifies the subset of vector dimensions within $Q$ that standout (anomalous) from the rest of dimensions. Next, we scan the vector database to retrieve the set of vectors that are also anomalous across the previously identified vector dimensions and return them as our retrieved set of vectors. We validate our approach on two image datasets, a text dataset, and a tabular dataset. Overall, we observe that, across most datasets, larger query sets lead to improved retrieval performance. The improvement is most pronounced when increasing the query sets from 1 to 8, while the gains become smaller beyond that.
- Abstract(参考訳): 古典的ベクトル検索問題は通常、入力として \emph{single} クエリの埋め込みベクトルを考慮し、ベクトルデータベースから最もよく似た埋め込みベクトルを検索する。
しかし、複雑な推論と検索タスクは、単一ではなく、しばしば 'emph{multiple query vectors} を必要とする。
本研究では,複数のクエリベクトルを同時に検討し,異常パターン検出の概念を用いてデータベースから最も関連性の高いベクトルを検索する手法を提案する。
具体的には、我々のアプローチは、$Q$($|Q|\geq 1$)というクエリベクトルの集合を利用し、残りの次元からのスタンドアウト(非正則)である$Q$内のベクトル次元のサブセットを特定する。
次に、ベクトルデータベースをスキャンして、以前に特定されたベクトル次元にまたがる異常なベクトルの集合を検索し、それらの集合を検索したベクトルの集合として返します。
我々は,2つの画像データセット,テキストデータセット,表付きデータセットに対するアプローチを検証する。
全体として、ほとんどのデータセットにおいて、より大きなクエリセットが検索性能を向上させることが観察される。
クエリセットを1から8に増やすと、改善は最も顕著になりますが、ゲインはそれよりも小さくなります。
関連論文リスト
- Beyond Single Embeddings: Capturing Diverse Targets with Multi-Query Retrieval [45.166788898665665]
我々は新しい検索アーキテクチャemphAutoregressive emphMulti-emphEmbedding emphRetriever(AMER)を開発した。
我々のモデルは複数のクエリベクトルを自動回帰的に生成し、予測されたクエリベクトルはすべてコーパスから文書を取得するために使用される。
AMERは、評価した2つのデータセットに対して、単一の埋め込みベースラインに対して4と21%の相対的なゲインを示します。
論文 参考訳(メタデータ) (2025-11-04T17:57:20Z) - Efficient Data Access Paths for Mixed Vector-Relational Search [8.80592433569832]
機械学習とベクトル埋め込みを用いたデータ処理手法の採用は、ベクトルデータ管理のためのシステム構築に大きな関心を喚起した。
ベクトルデータ管理の主流のアプローチは、ベクトル埋め込み全体を高速に検索するために特別なインデックス構造を使用することであるが、一度他の(メタ)データと組み合わせると、検索クエリはリレーショナル属性に対して選択的になる。
ベクトルインデックスは従来の関係データアクセスと異なるため、効率的な混合ベクトル関係探索のための代替アクセスパスを再検討し分析する。
論文 参考訳(メタデータ) (2024-03-23T11:34:17Z) - Vector search with small radiuses [10.880913075221361]
本稿では,ベクトル検索結果に応じて難しい決定を下す必要がある場合に着目する。
本研究では,クエリー・ツー・ベクター距離に基づいて,範囲探索結果の値を厳密にモデル化できることを示す。
これにより、範囲探索の指標 RSM が得られ、これは原則的であり、エンドツーエンドの評価を行なわずに計算が容易である。
論文 参考訳(メタデータ) (2024-03-16T00:34:25Z) - The Faiss library [48.38564920607163]
Faissは、インデックス化手法と関連するプリミティブのツールキットで、ベクトルの検索、クラスタ化、圧縮、変換に使用される。
本稿では,ベクトル探索のトレードオフ空間とFaissの設計原理について,構造,最適化,インターフェースの観点から述べる。
論文 参考訳(メタデータ) (2024-01-16T11:12:36Z) - CITADEL: Conditional Token Interaction via Dynamic Lexical Routing for
Efficient and Effective Multi-Vector Retrieval [72.90850213615427]
マルチベクター検索法はスパース(例えばBM25)と高密度(例えばDPR)レトリバーの利点を組み合わせたものである。
これらの手法は桁違いに遅く、単ベクトルの手法に比べてインデックスを格納するのにはるかに多くのスペースを必要とする。
動的語彙ルーティング(CITADEL)による条件付きトークンの相互作用を,効率的かつ効率的なマルチベクタ検索のために提案する。
論文 参考訳(メタデータ) (2022-11-18T18:27:35Z) - Efficient Set of Vectors Search [2.741266294612776]
一般事例に対する近似探索アルゴリズムを提案する。
これらのアルゴリズムの根底にある考え方は、一組のベクトルを「長い」単一ベクトルで符号化することである。
論文 参考訳(メタデータ) (2021-07-14T16:22:20Z) - Recovery of sparse linear classifiers from mixture of responses [42.228977798395846]
双対応答列から超平面の集合を学習する方法を示す。
各応答はベクトルとのクエリの結果であり、クエリベクトルが属するコレクションからランダムに選択された超平面の側面を示す。
論文 参考訳(メタデータ) (2020-10-22T22:03:53Z) - Vector-Matrix-Vector Queries for Solving Linear Algebra, Statistics, and
Graph Problems [58.83118651518438]
ベクトル行列ベクトルクエリを用いて行列について学習する一般的な問題を考える。
これらのクエリは、固定フィールド上の$boldsymbolumathrmTboldsymbolMboldsymbolv$の値を提供する。
我々は、線形代数、統計、グラフにまたがる様々な問題に対して、新しい上界と下界を提供する。
論文 参考訳(メタデータ) (2020-06-24T19:33:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。