論文の概要: Semantic Recall for Vector Search
- arxiv url: http://arxiv.org/abs/2604.20417v1
- Date: Wed, 22 Apr 2026 10:34:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.084659
- Title: Semantic Recall for Vector Search
- Title(参考訳): ベクトル探索のための意味的リコール
- Authors: Leonardo Kuffo, Ioanna Tsakalidou, Roberta De Viti, Albert Angel, Jiří Iša, Rastislav Lenhardt,
- Abstract要約: 本稿では,近接した近接探索アルゴリズムの品質を評価するための新しい指標であるSemantic Recallを紹介する。
セマンティック関連オブジェクトを識別できない場合にセマンティックリコールを近似するプロキシメトリックであるTolerant Recallを導入する。
- 参考スコア(独自算出の注目度): 0.18472148461613158
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Semantic Recall, a novel metric to assess the quality of approximate nearest neighbor search algorithms by considering only semantically relevant objects that are theoretically retrievable via exact nearest neighbor search. Unlike traditional recall, semantic recall does not penalize algorithms for failing to retrieve objects that are semantically irrelevant to the query, even if those objects are among their nearest neighbors. We demonstrate that semantic recall is particularly useful for assessing retrieval quality on queries that have few relevant results among their nearest neighbors-a scenario we uncover to be common within embedding datasets. Additionally, we introduce Tolerant Recall, a proxy metric that approximates semantic recall when semantically relevant objects cannot be identified. We empirically show that our metrics are more effective indicators of retrieval quality, and that optimizing search algorithms for these metrics can lead to improved cost-quality tradeoffs.
- Abstract(参考訳): 本稿では,近接探索により理論的に検索可能な意味的関連オブジェクトのみを考慮し,近接探索アルゴリズムの品質を評価するための新しい指標であるSemantic Recallを紹介する。
従来のリコールとは異なり、セマンティックリコールは、たとえそのオブジェクトが最も近い隣人であっても、クエリと意味的に無関係なオブジェクトの検索に失敗するアルゴリズムを罰しない。
セマンティックリコールは, 近隣住民の間では関係のないクエリの検索品質を評価するのに特に有用であることを示す。
さらに、意味的関連オブジェクトを識別できない場合にセマンティックリコールを近似するプロキシメトリックであるTolerant Recallを導入する。
我々は、我々のメトリクスが検索品質のより効果的な指標であることを実証的に示し、これらのメトリクスに対して探索アルゴリズムを最適化することで、コスト品質のトレードオフの改善につながることを実証した。
関連論文リスト
- WeDetect: Fast Open-Vocabulary Object Detection as Retrieval [74.39703419628829]
Open-vocabularyオブジェクト検出は、テキストプロンプトを通じて任意のクラスを検出することを目的としている。
クロスモーダル融合層(ノンフュージョン)を持たない手法は、認識を検索問題として扱うことにより、より高速な推論を提供する。
WeDetectという名前のモデルファミリを開発し、推論効率の高い15ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-12-13T12:40:28Z) - Context-Aware Search and Retrieval Over Erasure Channels [12.794591022795355]
本稿では,シンボル消去チャネル上で動作している遠隔文書検索システムの情報理論解析について述べる。
提案モデルは、言語コーパスの項周波数重みから導かれるクエリの特徴ベクトルを符号化する。
我々は、検索誤差確率、すなわち、より類似の少ない文書が選択される確率の明示的な式を導出する。
論文 参考訳(メタデータ) (2025-07-16T04:21:46Z) - VectorSearch: Enhancing Document Retrieval with Semantic Embeddings and
Optimized Search [1.0411820336052784]
本稿では、高度なアルゴリズム、埋め込み、インデックス化技術を活用して洗練された検索を行うVectorSearchを提案する。
提案手法は,革新的なマルチベクタ探索操作と高度な言語モデルによる検索の符号化を利用して,検索精度を大幅に向上させる。
実世界のデータセットの実験では、VectorSearchがベースラインのメトリクスを上回っている。
論文 参考訳(メタデータ) (2024-09-25T21:58:08Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - Group Testing for Accurate and Efficient Range-Based Near Neighbor Search for Plagiarism Detection [2.3814052021083354]
本研究は, 近接探索問題に対する適応型群検定フレームワークを提案する。
本研究では,データベース内の各項目を問合せ点の隣人あるいは非隣人として,余剰距離閾値に基づいて効率よくマークする。
本研究では,ソフトマックスに基づく特徴量を用いて,完全探索よりも10倍以上の高速化を実現し,精度を損なわないことを示す。
論文 参考訳(メタデータ) (2023-11-05T06:12:03Z) - Lexically-Accelerated Dense Retrieval [29.327878974130055]
LADR (Lexically-Accelerated Dense Retrieval) は, 既存の高密度検索モデルの効率を向上する, 簡便な手法である。
LADRは、標準ベンチマークでの徹底的な検索と同等の精度とリコールの両方を一貫して達成する。
論文 参考訳(メタデータ) (2023-07-31T15:44:26Z) - ReFIT: Relevance Feedback from a Reranker during Inference [109.33278799999582]
Retrieve-and-Rerankは、ニューラル情報検索の一般的なフレームワークである。
本稿では,リランカを利用してリコールを改善する手法を提案する。
論文 参考訳(メタデータ) (2023-05-19T15:30:33Z) - RbA: Segmenting Unknown Regions Rejected by All [1.3381749415517021]
マスク分類におけるオブジェクトクエリは、1対全分類器のように振る舞う傾向があることを示す。
本稿では,RbA と呼ばれる新しい外れ値スコアリング関数を提案する。
実験の結果,マスクの分類により既存の外乱検出法の性能が向上し,提案したRbAで最良の結果が得られた。
論文 参考訳(メタデータ) (2022-11-25T18:50:04Z) - Adversarial Semantic Collisions [129.55896108684433]
意味的衝突:意味論的に無関係だが、NLPモデルにより類似と判断されるテキストについて検討する。
我々は,意味的衝突を生成するための勾配に基づくアプローチを開発した。
パープレキシティに基づくフィルタリングを避けるために,意味的衝突を生成する方法を示す。
論文 参考訳(メタデータ) (2020-11-09T20:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。