論文の概要: A Representation Sharpening Framework for Zero Shot Dense Retrieval
- arxiv url: http://arxiv.org/abs/2511.05684v1
- Date: Fri, 07 Nov 2025 20:07:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.530225
- Title: A Representation Sharpening Framework for Zero Shot Dense Retrieval
- Title(参考訳): ゼロショット高密度検索のための表現強調フレームワーク
- Authors: Dhananjay Ashok, Suraj Nair, Mutasem Al-Darabsah, Choon Hui Teo, Tarun Agarwal, Jonathan May,
- Abstract要約: 本稿では,文書の表現をコーパス内の類似文書と区別する上で有用な情報で強化する,学習自由表現のシャープニングフレームワークを提案する。
表現のシャープ化はゼロショット高密度検索に対する従来の手法と互換性があることを示し、その性能を一貫して改善する。
- 参考スコア(独自算出の注目度): 23.324559938595602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero-shot dense retrieval is a challenging setting where a document corpus is provided without relevant queries, necessitating a reliance on pretrained dense retrievers (DRs). However, since these DRs are not trained on the target corpus, they struggle to represent semantic differences between similar documents. To address this failing, we introduce a training-free representation sharpening framework that augments a document's representation with information that helps differentiate it from similar documents in the corpus. On over twenty datasets spanning multiple languages, the representation sharpening framework proves consistently superior to traditional retrieval, setting a new state-of-the-art on the BRIGHT benchmark. We show that representation sharpening is compatible with prior approaches to zero-shot dense retrieval and consistently improves their performance. Finally, we address the performance-cost tradeoff presented by our framework and devise an indexing-time approximation that preserves the majority of our performance gains over traditional retrieval, yet suffers no additional inference-time cost.
- Abstract(参考訳): ゼロショット高密度検索(ゼロショット高密度検索)は、文書コーパスが関連するクエリなしで提供され、事前訓練された高密度検索(DR)に依存する必要がある、という難しい設定である。
しかし、これらのDRはターゲットコーパスで訓練されていないため、類似した文書間の意味的差異を表現するのに苦労している。
このような問題に対処するために,文書の表現をコーパス内の類似文書と区別するのに役立つ情報で強化する,トレーニング不要な表現強化フレームワークを導入する。
複数の言語にまたがる20以上のデータセットにおいて、表現のシャープ化フレームワークは従来の検索よりも一貫して優れていることが証明され、BRIGHTベンチマークに新しい最先端のベンチマークが設定された。
表現のシャープ化はゼロショット高密度検索に対する従来の手法と互換性があることを示し、その性能を一貫して改善する。
最後に、我々のフレームワークが提示したパフォーマンスコストのトレードオフに対処し、従来の検索よりもパフォーマンス向上の大部分を保ちながら、追加の推論時間コストを被るインデックス化時間近似を考案する。
関連論文リスト
- Learning Refined Document Representations for Dense Retrieval via Deliberate Thinking [58.69615583599489]
Deliberate Thinking based Retriever (Debater) は、段階的な思考プロセスを導入することで文書表現を強化する新しいアプローチである。
Debaterは、いくつかのベンチマークで既存のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-02-18T15:56:34Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Augmenting Document Representations for Dense Retrieval with
Interpolation and Perturbation [49.940525611640346]
ドキュメント拡張(Document Augmentation for dense Retrieval)フレームワークは、ドキュメントの表現をDense Augmentationとperturbationsで強化する。
2つのベンチマークデータセットによる検索タスクにおけるDARの性能評価を行い、ラベル付き文書とラベルなし文書の密集検索において、提案したDARが関連するベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-03-15T09:07:38Z) - LaPraDoR: Unsupervised Pretrained Dense Retriever for Zero-Shot Text
Retrieval [55.097573036580066]
実験結果から,LaPraDoRは教師付き高密度検索モデルと比較して最先端の性能が得られることがわかった。
再ランクと比較すると,1ミリ秒 (22.5倍高速) でレキシコン強化手法を動作させることができるが,性能は良好である。
論文 参考訳(メタデータ) (2022-03-11T18:53:12Z) - CODER: An efficient framework for improving retrieval through
COntextualized Document Embedding Reranking [11.635294568328625]
本稿では,最小計算コストで広範囲の検索モデルの性能を向上させるためのフレームワークを提案する。
ベース密度検索法により抽出された事前計算された文書表現を利用する。
実行時に第一段階のメソッドの上に無視可能な計算オーバーヘッドを発生させ、最先端の高密度検索手法と簡単に組み合わせられるようにする。
論文 参考訳(メタデータ) (2021-12-16T10:25:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。