論文の概要: Learning to Select: Query-Aware Adaptive Dimension Selection for Dense Retrieval
- arxiv url: http://arxiv.org/abs/2602.03306v1
- Date: Tue, 03 Feb 2026 09:32:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.362011
- Title: Learning to Select: Query-Aware Adaptive Dimension Selection for Dense Retrieval
- Title(参考訳): 難易度検索のための問合せ型適応次元選択の学習
- Authors: Zhanyu Wu, Richong Zhang, Zhijie Nie,
- Abstract要約: 本稿では,クエリ埋め込みから直接,パラメータごとのim-019ポータンスを予測できるQuery-024 Aware Adaptive Dimension Selection frame-018を提案する。
実験の結果,学習次元セレクタは全次元032ベースライン上でのre-031の3次効果を向上させることがわかった。
- 参考スコア(独自算出の注目度): 37.24586920652237
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dense retrieval represents queries and docu-002 ments as high-dimensional embeddings, but003 these representations can be redundant at the004 query level: for a given information need, only005 a subset of dimensions is consistently help-006 ful for ranking. Prior work addresses this via007 pseudo-relevance feedback (PRF) based dimen-008 sion importance estimation, which can produce009 query-aware masks without labeled data but010 often relies on noisy pseudo signals and heuris-011 tic test-time procedures. In contrast, super-012 vised adapter methods leverage relevance labels013 to improve embedding quality, yet they learn014 global transformations shared across queries015 and do not explicitly model query-aware di-016 mension importance. We propose a Query-017 Aware Adaptive Dimension Selection frame-018 work that learns to predict per-dimension im-019 portance directly from query embedding. We020 first construct oracle dimension importance dis-021 tributions over embedding dimensions using022 supervised relevance labels, and then train a023 predictor to map a query embedding to these024 label-distilled importance scores. At inference,025 the predictor selects a query-aware subset of026 dimensions for similarity computation based027 solely on the query embedding, without pseudo-028 relevance feedback. Experiments across multi-029 ple dense retrievers and benchmarks show that030 our learned dimension selector improves re-031 trieval effectiveness over the full-dimensional032 baseline as well as PRF-based masking and033 supervised adapter baselines.
- Abstract(参考訳): デンス検索はクエリとdocu-002メントを高次元埋め込みとして表現するが、003は004クエリレベルで冗長である。
従来の作業では、007の擬似関連フィードバック(PRF)ベースのダイメン-008の重み付けにより、ラベル付きデータなしで009のクエリ対応マスクを生成できるが、010はしばしばノイズの多い擬似信号と Heuris-011 のテストタイムプロシージャに依存している。
対照的に、Super-012 vised Adapterメソッドは、関連ラベル 013 を利用して埋め込み品質を改善するが、クエリ015間で共有される014のグローバル変換を学習し、クエリ対応の di-016 メンションの重要性を明示的にモデル化しない。
本稿では,クエリ埋め込みから直接,次元ごとのim-019ポータンスを予測できるQuery-017 Aware Adaptive Dimension Selection frame-018を提案する。
We020は、まず、022の教師付きレバレンスラベルを用いて、埋め込み次元よりもオラクル次元の重要性を論じ、その後、a023予測器を訓練して、これら024のラベルに埋め込んだクエリの重要度スコアにマッピングする。
推測すると、025は、擬似028関連フィードバックなしで、クエリ埋め込みのみに基づく類似性計算ベース027に対して、026次元のクエリ対応サブセットを選択する。
マルチ029プル高密度検索器とベンチマークによる実験の結果,学習次元セレクタの030は,全次元032ベースライン,PRFベースのマスキングと3033教師付きアダプタベースラインに対して,re-031トリエンバルの有効性を向上することがわかった。
関連論文リスト
- Reveal Hidden Pitfalls and Navigate Next Generation of Vector Similarity Search from Task-Centric Views [24.456069497637035]
高次元空間におけるベクトル類似度探索(VSS)は,次世代データベースシステムにおけるコア機能として急速に発展しつつある。
最近のベンチマークでは、主に距離メトリクスのみによって定義された基本真実に対するリコールレイテンシトレードオフに基づいてVSSを評価している。
我々は、現実的なアプリケーションコンテキストにおけるVSSメソッドのエンドツーエンド評価のための総合ベンチマークスイートであるIcebergを紹介する。
論文 参考訳(メタデータ) (2025-12-15T04:49:33Z) - Evaluating Embedding Models and Pipeline Optimization for AI Search Quality [0.0]
我々は,AI駆動検索システムにおける各種テキスト埋め込みモデルとパイプライン構成の性能を評価する。
11,975対のクエリチャンクペアのカスタム評価データセットを,米国市議会の会議記録から合成した。
論文 参考訳(メタデータ) (2025-11-27T09:09:39Z) - ECLIPSE: Contrastive Dimension Importance Estimation with Pseudo-Irrelevance Feedback for Dense Retrieval [14.72046677914345]
近年のInformation Retrievalは、高次元埋め込み空間を活用して、関連文書の検索を改善している。
これらの高次元表現にもかかわらず、クエリに関連する文書は、低次元のクエリ依存多様体に存在する。
本稿では,関連文書と非関連文書の両方からの情報を活用することによって,これらの制約に対処する手法を提案する。
論文 参考訳(メタデータ) (2024-12-19T15:45:06Z) - BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.54576644403115]
BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
クエリに関する明示的な推論を取り入れることで、検索性能が最大12.2ポイント向上することを示す。
論文 参考訳(メタデータ) (2024-07-16T17:58:27Z) - A Deep Dive into the Trade-Offs of Parameter-Efficient Preference Alignment Techniques [63.10251271444959]
大規模言語モデルは最初、数兆のトークンで事前訓練され、その後、特定の好みに合わせて命令調整または調整される。
我々は,3つの重要な軸に対する人気選択の影響を詳細に調査する。
300以上の実験にまたがるセットアップでは、一貫した傾向と予期せぬ結果が明らかになる。
論文 参考訳(メタデータ) (2024-06-07T12:25:51Z) - Improving significance of binary black hole mergers in Advanced LIGO
data using deep learning : Confirmation of GW151216 [0.0]
地中重力波(GW)観測所のデータから二元ブラックホール(BBH)の融合を探索するための機械学習(ML)に基づく新しい手法を提案する。
これは、最初のGWトランジェントカタログ(GWTC-1)のCBCを復元するだけでなく、GW151216をクリーンに検出する最初のMLベースの探索である。
論文 参考訳(メタデータ) (2020-10-16T18:27:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。