論文の概要: Training for Compositional Sensitivity Reduces Dense Retrieval Generalization
- arxiv url: http://arxiv.org/abs/2604.16351v1
- Date: Mon, 16 Mar 2026 20:25:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.920082
- Title: Training for Compositional Sensitivity Reduces Dense Retrieval Generalization
- Title(参考訳): 合成感度のトレーニングは高密度検索の一般化を減らします
- Authors: Radoslav Ralev, Aditeya Baral, Iliya Zhechev, Jen Agarwal, Srijith Rajamohan,
- Abstract要約: センス検索はテキストをコサイン類似度でランク付けした単一の埋め込みに圧縮する。
リコールには効率的だが、このインターフェースはアイデンティティレベルのマッチングには脆弱である。
テキストのみの検索において、この検索合成テンションをテストする。
- 参考スコア(独自算出の注目度): 0.07456526005219319
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dense retrieval compresses texts into single embeddings ranked by cosine similarity. While efficient for recall, this interface is brittle for identity-level matching: minimal compositional edits (negation, role swaps) flip meaning yet retain high similarity. Motivated by geometric results for unit-sphere cosine spaces (Kang et al., 2025), we test this retrieval-composition tension in text-only retrieval. Across four dual-encoder backbones, adding structure-targeted negatives consistently reduces zero-shot NanoBEIR retrieval (8-9% mean nDCG@10 drop on small backbones; up to 40% on medium ones), while only partially improving pooled-space separation. Treating pooled cosine as a recall interface, we then benchmark verifiers scoring token--token cosine maps. MaxSim (late interaction) excels at reranking but fails to reject structural near-misses, whereas a small Transformer over similarity maps reliably separates near-misses under end-to-end training.
- Abstract(参考訳): センス検索はテキストをコサイン類似度でランク付けした単一の埋め込みに圧縮する。
最小構成編集(ネゲーション、ロールスワップ)フリップは高い類似性を保っている。
単位球コサイン空間の幾何学的結果(Kang et al , 2025)により、テキストのみの検索において、この検索合成張力をテストする。
4つの二重エンコーダのバックボーンをまたいで、構造をターゲットとした負の付加は、ゼロショットのNanoBEIR検索を継続的に減少させ(8-9%は小さなバックボーンでnDCG@10ドロップ、中規模では40%)、プール空間分離を部分的に改善するだけである。
プール化コサインをリコールインタフェースとして扱うと、トークンを判定する検証器をベンチマークしてコサインマップを作成する。
MaxSim(後期の相互作用)は再ランク時に優れるが、構造上の近距離距離を拒否するのに失敗する。
関連論文リスト
- CraterBench-R: Instance-Level Crater Retrieval for Planetary Scale [8.898996772941716]
CraterBench-Rは、キュレートされたベンチマークで、25,000個のクレーターのアイデンティティとマルチスケールのギャラリービューを特徴としている。
評価の結果,自己監督型視覚変換器(ViT)がタスクを担っていることが明らかとなった。
我々は、Kシードトークンを選択し、コサイン類似性によって残りのトークンをこれらのシードに割り当て、各クラスタを単一の代表トークンに集約するスケーラブルでトレーニング不要な手法であるインスタンストークンアグリゲーションを提案する。
論文 参考訳(メタデータ) (2026-04-06T03:04:31Z) - SARA: Scene-Aware Reconstruction Accelerator [8.403194119298622]
SARAは、SfM(Structure-from-Motion)のための幾何学駆動のペア選択モジュールである。
視覚的類似性のみに基づいてペアを選択する従来のパイプラインとは異なり、SARAは幾何学第一対選択を導入する。
軽量のプレマッチングステージは、互いに近接する隣人とRANSACを使用して、再建情報度を推定する。
論文 参考訳(メタデータ) (2026-01-11T09:45:03Z) - Semantic Alignment of Multilingual Knowledge Graphs via Contextualized Vector Projections [8.709638469928448]
埋め込みに基づくコサイン類似性マッチングを用いた言語間アライメントシステム
我々は、より優れた埋め込みを生成するために、微調整変換器に基づく多言語モデルを使用する。
我々はOAEI-2022マルチファームトラックについて検討した。
論文 参考訳(メタデータ) (2025-12-22T11:02:30Z) - Ensemble Threshold Calibration for Stable Sensitivity Control [0.0]
本稿では,数千万組の幾何対もの幾何に対して,過度に分散した正確なリコールを実現するエンド・ツー・エンドのフレームワークを提案する。
我々のアプローチは、小さなエラーで常にリコールターゲットにヒットし、他のキャリブレーションと比較して冗長な検証を減らし、単一のTPU v3コア上でエンドツーエンドで実行します。
論文 参考訳(メタデータ) (2025-10-02T15:22:28Z) - Relevance Filtering for Embedding-based Retrieval [46.851594313019895]
埋め込み型検索では、ANN(Approximate Nearest Neighbor)検索により、大規模データセットから類似したアイテムを効率的に検索することができる。
本稿では,この課題に対処するために,埋め込み型検索のための新しい関連フィルタリングコンポーネント("Cosine Adapter" と呼ぶ)を提案する。
少ないリコールの損失を犠牲にして、回収したセットの精度を大幅に向上することが可能です。
論文 参考訳(メタデータ) (2024-08-09T06:21:20Z) - SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。
類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。
文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文 参考訳(メタデータ) (2024-06-15T21:57:03Z) - AffineGlue: Joint Matching and Robust Estimation [74.04609046690913]
AffineGlue, 連立2視点特徴マッチングとロバストな推定法を提案する。
AffineGlueは、最小限のモデルを推定するために、1対多の対応から潜在的なマッチを選択する。
ガイドマッチングはモデルと一致した一致を見つけるために使用され、1対1の一致の曖昧さに悩まされる。
論文 参考訳(メタデータ) (2023-07-28T08:05:36Z) - Rapid Person Re-Identification via Sub-space Consistency Regularization [51.76876061721556]
Person Re-Identification (ReID) は、歩行者を分離したカメラで識別する。
実値特徴記述子を用いた既存のReID法は精度が高いが、ユークリッド距離計算が遅いため効率が低い。
本稿では,ReID 処理を 0.25 倍高速化するサブスペース一貫性規則化 (SCR) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-13T02:44:05Z) - Geometric Transformer for Fast and Robust Point Cloud Registration [53.10568889775553]
点雲登録のための正確な対応を抽出する問題について検討する。
最近のキーポイントフリー手法は、低オーバーラップシナリオでは難しい繰り返し可能なキーポイントの検出を回避している。
本稿では,ロバストなスーパーポイントマッチングのための幾何学的特徴を学習するための幾何学変換器を提案する。
論文 参考訳(メタデータ) (2022-02-14T13:26:09Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。