論文の概要: jina-reranker-v3: Last but Not Late Interaction for Document Reranking
- arxiv url: http://arxiv.org/abs/2509.25085v2
- Date: Wed, 01 Oct 2025 17:49:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-02 14:33:21.819929
- Title: jina-reranker-v3: Last but Not Late Interaction for Document Reranking
- Title(参考訳): jina-reranker-v3: ドキュメントのリグレードのための最後のインタラクション
- Authors: Feng Wang, Yuqing Li, Han Xiao,
- Abstract要約: jina-reranker-v3は0.6Bパラメータの多言語ドキュメント再ランカである。
このアーキテクチャは、61.94 nDCG@10で最先端のBEIR性能を実現し、生成的リストワイド・リランカよりも大幅に小さい。
- 参考スコア(独自算出の注目度): 16.73571462259572
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: jina-reranker-v3 is a 0.6B parameter multilingual document reranker that introduces a novel last but not late interaction. Unlike late interaction models such as ColBERT that perform separate encoding followed by multi-vector matching, our approach conducts causal self-attention between query and documents within the same context window, enabling rich cross-document interactions before extracting contextual embeddings from the last token of each document. This compact architecture achieves state-of-the-art BEIR performance with 61.94 nDCG@10 while being significant smaller than generative listwise rerankers.
- Abstract(参考訳): jina-reranker-v3は0.6Bパラメータの多言語ドキュメント再ランカである。
個別のエンコーディングとマルチベクタマッチングを行うColBERTのような後期インタラクションモデルとは異なり,本手法では,クエリとドキュメント間の因果自己アテンションを同じコンテキストウィンドウ内で行うことにより,各ドキュメントの最後のトークンからコンテキスト埋め込みを抽出する前に,リッチな相互ドキュメント間インタラクションを可能にする。
このコンパクトなアーキテクチャは、61.94 nDCG@10で最先端のBEIR性能を実現し、生成的リストワイド・リランカよりもかなり小さい。
関連論文リスト
- Subtopic-aware View Sampling and Temporal Aggregation for Long-form Document Matching [34.81690842091582]
長文文書マッチングは、2つの文書間の関係を判断することを目的としている。
代表的マッチング信号のモデル化のための新しいフレームワークを提案する。
我々の学習フレームワークは,ニュース重複や判例検索など,いくつかの文書マッチング作業に有効である。
論文 参考訳(メタデータ) (2024-12-10T15:06:48Z) - In-context Pretraining: Language Modeling Beyond Document Boundaries [137.53145699439898]
In-Context Pretrainingは、言語モデルが関連するドキュメントのシーケンスで事前トレーニングされる新しいアプローチである。
本稿では, 近接探索を効率的に行うための近似アルゴリズムを提案する。
より複雑なコンテキスト推論を必要とするタスクの顕著な改善が見られます。
論文 参考訳(メタデータ) (2023-10-16T17:57:12Z) - Large-Scale Multi-Document Summarization with Information Extraction and
Compression [31.601707033466766]
複数の異種文書のラベル付きデータとは無関係に抽象的な要約フレームワークを開発する。
我々のフレームワークは、同じトピックのドキュメントではなく、異なるストーリーを伝えるドキュメントを処理する。
我々の実験は、このより汎用的な設定において、我々のフレームワークが現在の最先端メソッドより優れていることを示した。
論文 参考訳(メタデータ) (2022-05-01T19:49:15Z) - Pairwise Multi-Class Document Classification for Semantic Relations
between Wikipedia Articles [5.40541521227338]
2つの文書間の関係をペアワイズ文書分類タスクとして検索する問題をモデル化する。
文書間の意味的関係を見つけるために,GloVe, paragraph-s,BERT,XLNetなどの一連の手法を適用する。
我々は,新たに提案された32,168のウィキペディア記事ペアと,セマンティックドキュメントの関係を定義するウィキデータプロパティに関する実験を行った。
論文 参考訳(メタデータ) (2020-03-22T12:52:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。