論文の概要: Enhancing Documents with Multidimensional Relevance Statements in
Cross-encoder Re-ranking
- arxiv url: http://arxiv.org/abs/2306.10979v1
- Date: Mon, 19 Jun 2023 14:37:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 17:28:41.893862
- Title: Enhancing Documents with Multidimensional Relevance Statements in
Cross-encoder Re-ranking
- Title(参考訳): クロスエンコーダにおける多次元関連文書の強化
- Authors: Rishabh Upadhyay, Arian Askari, Gabriella Pasi and Marco Viviani
- Abstract要約: 我々は,クロスエンコーダの再ランク付けにおいて,話題性を超えた複数の関連性を考慮した新しい手法を提案する。
提案手法は,アグリゲーションベースとクロスエンコーダリランカの両方で統計的に優れていた。
- 参考スコア(独自算出の注目度): 2.2691623651741
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose a novel approach to consider multiple dimensions of
relevance beyond topicality in cross-encoder re-ranking. On the one hand,
current multidimensional retrieval models often use na\"ive solutions at the
re-ranking stage to aggregate multiple relevance scores into an overall one. On
the other hand, cross-encoder re-rankers are effective in considering
topicality but are not designed to straightforwardly account for other
relevance dimensions. To overcome these issues, we envisage enhancing the
candidate documents -- which are retrieved by a first-stage lexical retrieval
model -- with "relevance statements" related to additional dimensions of
relevance and then performing a re-ranking on them with cross-encoders. In
particular, here we consider an additional relevance dimension beyond
topicality, which is credibility. We test the effectiveness of our solution in
the context of the Consumer Health Search task, considering publicly available
datasets. Our results show that the proposed approach statistically outperforms
both aggregation-based and cross-encoder re-rankers.
- Abstract(参考訳): 本稿では,クロスエンコーダの再ランキングにおいて,トピック性を超えて関連性の多次元を考えるための新しい手法を提案する。
On the one hand, current multidimensional retrieval models often use na\"ive solutions at the re-ranking stage to aggregate multiple relevance scores into an overall one. On the other hand, cross-encoder re-rankers are effective in considering topicality but are not designed to straightforwardly account for other relevance dimensions. To overcome these issues, we envisage enhancing the candidate documents -- which are retrieved by a first-stage lexical retrieval model -- with "relevance statements" related to additional dimensions of relevance and then performing a re-ranking on them with cross-encoders.
特に、ここでは話題性を超えて、信頼性という追加の関連次元を考える。
消費者健康検索タスクのコンテキストにおいて、公開データセットを考慮したソリューションの有効性を検証する。
提案手法は,アグリゲーションベースとクロスエンコーダリランカの両方で統計的に優れていた。
関連論文リスト
- Quam: Adaptive Retrieval through Query Affinity Modelling [15.3583908068962]
ユーザ情報要求に基づいて文書をランク付けする関連モデルを構築することは,情報検索とNLPコミュニティの中心的な課題である。
提案するQuamにより,適応検索の初期段階の統一的な視点を提案する。
提案手法であるQuamは,リコール性能を26%向上させる。
論文 参考訳(メタデータ) (2024-10-26T22:52:12Z) - Generative Retrieval Meets Multi-Graded Relevance [104.75244721442756]
GRADed Generative Retrieval (GR$2$)というフレームワークを紹介します。
GR$2$は2つの重要なコンポーネントに焦点を当てている。
マルチグレードとバイナリの関連性を持つデータセットの実験は,GR$2$の有効性を示した。
論文 参考訳(メタデータ) (2024-09-27T02:55:53Z) - How Does Generative Retrieval Scale to Millions of Passages? [68.98628807288972]
各種コーパス尺度における生成的検索手法の実証的研究を行った。
我々は8.8Mパスのコーパスで数百万のパスに生成検索をスケールし、モデルサイズを最大11Bパラメータまで評価する。
生成的検索は、小さなコーパス上の最先端のデュアルエンコーダと競合するが、数百万のパスへのスケーリングは依然として重要で未解決の課題である。
論文 参考訳(メタデータ) (2023-05-19T17:33:38Z) - Improving Out-of-Distribution Generalization of Neural Rerankers with
Contextualized Late Interaction [52.63663547523033]
マルチベクトルの最も単純な形式である後期相互作用は、[]ベクトルのみを使用して類似度スコアを計算する神経リランカにも役立ちます。
異なるモデルサイズと多様な性質の第一段階のレトリバーに一貫性があることが示される。
論文 参考訳(メタデータ) (2023-02-13T18:42:17Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - Augmenting Document Representations for Dense Retrieval with
Interpolation and Perturbation [49.940525611640346]
ドキュメント拡張(Document Augmentation for dense Retrieval)フレームワークは、ドキュメントの表現をDense Augmentationとperturbationsで強化する。
2つのベンチマークデータセットによる検索タスクにおけるDARの性能評価を行い、ラベル付き文書とラベルなし文書の密集検索において、提案したDARが関連するベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-03-15T09:07:38Z) - PAIR: Leveraging Passage-Centric Similarity Relation for Improving Dense
Passage Retrieval [87.68667887072324]
本稿では,クエリ中心とPAssage中心のsmilarity Relations(PAIR)を併用した新しい手法を提案する。
本稿では,2種類の類似性関係の形式的定式化を導入することにより,3つの主要な技術的貢献を行う。
MSMARCOとNatural Questionsの両方のデータセットにおいて、従来の最先端モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2021-08-13T02:07:43Z) - Sequential Cross-Document Coreference Resolution [14.099694053823765]
クロスドキュメントのコリファレンス解決は、マルチドキュメント分析タスクへの関心が高まる上で重要である。
コアファレンス分解能の効率的なシーケンシャル予測パラダイムを文書間設定に拡張する新しいモデルを提案する。
私たちのモデルは、参照をクラスタ表現にインクリメンタルに合成し、参照とすでに構築されたクラスタ間のリンクを予測する。
論文 参考訳(メタデータ) (2021-04-17T00:46:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。