論文の概要: jina-reranker-v3: Last but Not Late Interaction for Listwise Document Reranking
- arxiv url: http://arxiv.org/abs/2509.25085v3
- Date: Fri, 03 Oct 2025 15:42:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 14:21:29.908904
- Title: jina-reranker-v3: Last but Not Late Interaction for Listwise Document Reranking
- Title(参考訳): jina-reranker-v3: Listwise Document Re rankの最後だが、遅くはない相互作用
- Authors: Feng Wang, Yuqing Li, Han Xiao,
- Abstract要約: jina-reranker-v3は0.6Bパラメータの多言語リストワイド・リランカである。
モデルは61.94 nDCG@10で最先端のBEIR性能を達成するが、同等の性能を持つ他のモデルよりも大幅に小さい。
- 参考スコア(独自算出の注目度): 16.73571462259572
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: jina-reranker-v3 is a 0.6B-parameter multilingual listwise reranker that introduces a novel "last but not late" interaction. Unlike late interaction models like ColBERT that encode documents separately before multi-vector matching, our approach applies causal attention between the query and all candidate documents in the same context window, enabling rich interactions before extracting contextual embeddings from each document's final token. The new model achieves state-of-the-art BEIR performance with 61.94 nDCG@10 while being significantly smaller than other models with comparable performance.
- Abstract(参考訳): jina-reranker-v3は0.6Bパラメータの多言語リストワイド・リランカであり、新しい「ラストだが遅くはない」相互作用を導入している。
マルチベクトルマッチングの前に文書を個別にエンコードするColBERTのような後期インタラクションモデルとは異なり、我々のアプローチでは、クエリとすべての候補ドキュメントを同じコンテキストウィンドウで因果的注意を適用でき、各ドキュメントの最終トークンからコンテキスト埋め込みを抽出する前に、リッチなインタラクションを可能にする。
新しいモデルは最先端のBEIR性能を61.94 nDCG@10で達成し、同等の性能を持つ他のモデルよりも大幅に小さい。
関連論文リスト
- Subtopic-aware View Sampling and Temporal Aggregation for Long-form Document Matching [34.81690842091582]
長文文書マッチングは、2つの文書間の関係を判断することを目的としている。
代表的マッチング信号のモデル化のための新しいフレームワークを提案する。
我々の学習フレームワークは,ニュース重複や判例検索など,いくつかの文書マッチング作業に有効である。
論文 参考訳(メタデータ) (2024-12-10T15:06:48Z) - In-context Pretraining: Language Modeling Beyond Document Boundaries [137.53145699439898]
In-Context Pretrainingは、言語モデルが関連するドキュメントのシーケンスで事前トレーニングされる新しいアプローチである。
本稿では, 近接探索を効率的に行うための近似アルゴリズムを提案する。
より複雑なコンテキスト推論を必要とするタスクの顕著な改善が見られます。
論文 参考訳(メタデータ) (2023-10-16T17:57:12Z) - Large-Scale Multi-Document Summarization with Information Extraction and
Compression [31.601707033466766]
複数の異種文書のラベル付きデータとは無関係に抽象的な要約フレームワークを開発する。
我々のフレームワークは、同じトピックのドキュメントではなく、異なるストーリーを伝えるドキュメントを処理する。
我々の実験は、このより汎用的な設定において、我々のフレームワークが現在の最先端メソッドより優れていることを示した。
論文 参考訳(メタデータ) (2022-05-01T19:49:15Z) - Pairwise Multi-Class Document Classification for Semantic Relations
between Wikipedia Articles [5.40541521227338]
2つの文書間の関係をペアワイズ文書分類タスクとして検索する問題をモデル化する。
文書間の意味的関係を見つけるために,GloVe, paragraph-s,BERT,XLNetなどの一連の手法を適用する。
我々は,新たに提案された32,168のウィキペディア記事ペアと,セマンティックドキュメントの関係を定義するウィキデータプロパティに関する実験を行った。
論文 参考訳(メタデータ) (2020-03-22T12:52:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。