論文の概要: SumRank: Aligning Summarization Models for Long-Document Listwise Reranking
- arxiv url: http://arxiv.org/abs/2603.24204v1
- Date: Wed, 25 Mar 2026 11:28:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.261156
- Title: SumRank: Aligning Summarization Models for Long-Document Listwise Reranking
- Title(参考訳): SumRank: 長いドキュメントリストのランク付けのための要約モデルの調整
- Authors: Jincheng Feng, Wenhan Liu, Zhicheng Dou,
- Abstract要約: 本稿では、長文文書をランク順の要約に圧縮するポイントワイド要約モデルSumRankを提案する。
我々の軽量SumRankモデルは、最先端のランキング性能を実現し、効率を著しく向上させる。
- 参考スコア(独自算出の注目度): 47.98275764216792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have demonstrated superior performance in listwise passage reranking task. However, directly applying them to rank long-form documents introduces both effectiveness and efficiency issues due to the substantially increased context length. To address this challenge, we propose a pointwise summarization model SumRank, aligned with downstream listwise reranking, to compress long-form documents into concise rank-aligned summaries before the final listwise reranking stage. To obtain our summarization model SumRank, we introduce a three-stage training pipeline comprising cold-start Supervised Fine-Tuning (SFT), specialized RL data construction, and rank-driven alignment via Reinforcement Learning. This paradigm aligns the SumRank with downstream ranking objectives to preserve relevance signals. We conduct extensive experiments on five benchmark datasets from the TREC Deep Learning tracks (TREC DL 19-23). Results show that our lightweight SumRank model achieves state-of-the-art (SOTA) ranking performance while significantly improving efficiency by reducing both summarization overhead and reranking complexity.
- Abstract(参考訳): 大規模言語モデル (LLM) はリストワイド・パス・リグレード・タスクにおいて優れた性能を示した。
しかし, 長期文書への直接適用は, 文脈長が著しく増大するため, 有効性と効率性の両方の問題をもたらす。
この課題に対処するため、長文文書を列挙前の簡潔な階数順の要約に圧縮する、ダウンストリームリストワイズに整合したポイントワイズ要約モデルSumRankを提案する。
要約モデル SumRank を得るために,冷間開始型スーパービジョンファインチューニング(SFT),特殊RLデータ構築,強化学習によるランク駆動アライメントを含む3段階のトレーニングパイプラインを導入する。
このパラダイムは、SumRankと下流ランキングの目的を一致させ、関連性信号を保存する。
TRECディープラーニングトラック(TREC DL 19-23)の5つのベンチマークデータセットについて広範な実験を行った。
その結果,我々の軽量SumRankモデルでは,総和オーバヘッドを低減し,複雑さを再評価することにより効率を著しく向上し,最先端のSOTA(State-of-the-art)ランキング性能を実現していることがわかった。
関連論文リスト
- ReasonRank: Empowering Passage Ranking with Strong Reasoning Ability [83.16850534680505]
本稿では,自動推論集約型トレーニングデータ合成フレームワークを提案する。
自己整合性データフィルタリング機構は、データ品質を保証するために設計されている。
トレーニングされた推論集約型リランカ textbfReasonRank は,BRIGHT のリーダボード上での最先端 (SOTA) のパフォーマンス40.6 を達成する。
論文 参考訳(メタデータ) (2025-08-09T17:26:18Z) - CoRanking: Collaborative Ranking with Small and Large Ranking Agents [94.09834629572403]
大規模言語モデル(LLM)は、優れたリストワイドランキング性能を示している。
CoRankingは、小規模と大規模なランキングモデルを組み合わせて、効率的かつ効果的なランク付けを行う。
論文 参考訳(メタデータ) (2025-03-30T13:00:52Z) - Sliding Windows Are Not the End: Exploring Full Ranking with Long-Context Large Language Models [40.21540137079309]
LLM(Long-context Language Models)は、単一の推論内で全ての節の完全なランク付けを可能にする。
教師付き微調整環境において,LLMの完全ランク付けにより優れた性能が得られることを示す。
本稿では,リストワイドなラベル構築手法を提案する。
論文 参考訳(メタデータ) (2024-12-19T06:44:59Z) - FIRST: Faster Improved Listwise Reranking with Single Token Decoding [56.727761901751194]
まず、第1生成識別子の出力ロジットを活用して、候補のランク付け順序を直接取得する新しいリストワイズLLMリグレードアプローチであるFIRSTを紹介する。
実験結果から、BEIRベンチマークの利得により、FIRSTはロバストなランキング性能を維持しつつ、推論を50%高速化することが示された。
以上の結果から,LLMリランカーはクロスエンコーダに比べて強い蒸留信号を提供できることが示唆された。
論文 参考訳(メタデータ) (2024-06-21T21:27:50Z) - List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - Zero-Shot Listwise Document Reranking with a Large Language Model [58.64141622176841]
本稿では,タスク固有の学習データを用いることなく,言語モデル(LRL)を用いたリスワイズ・リランカを提案する。
3つのTRECウェブサーチデータセットの実験により、LRLは第1段検索結果の再ランク付け時にゼロショットポイントワイズ法より優れるだけでなく、最終段再ランカとしても機能することが示された。
論文 参考訳(メタデータ) (2023-05-03T14:45:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。