論文の概要: Whole-Pool Setwise Reranking with Long-Context Language Models
- arxiv url: http://arxiv.org/abs/2606.01782v1
- Date: Mon, 01 Jun 2026 07:03:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.478264
- Title: Whole-Pool Setwise Reranking with Long-Context Language Models
- Title(参考訳): 長期言語モデルを用いた全プールのセグメンテーション
- Authors: Hang Li, Chuting Yu, Teerapong Leelanupab, Bevan Koopman, Guido Zuccon,
- Abstract要約: 各コールが現在非ランクの候補パスをすべて考慮し、DualEndを導入する。
両端からランク付けすることで、DualEndは100人の候補者に50回のLCMコールを付けている。
- 参考スコア(独自算出の注目度): 33.70215608215242
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Previous LLM-based passage re-rankers are often expensive and slow because the input context constraints require the LLM to make many dependent model calls. We study how recent long-context LLMs change this problem: when the full set of retrieved candidate passages can be shown to the model at once, ranking no longer has to be reconstructed from many overlapping local comparisons. We propose Whole-Pool Setwise re-ranking, where each call considers all currently unranked candidate passages, and introduce DualEnd, which identifies both the most and least relevant passages in one call. By filling the ranking from both ends, DualEnd ranks 100 candidates with 50 serial LLM calls, compared with 99 calls for comparable one-passage-at-a-time whole-pool methods. Experiments with nine open-weight LLMs on two passage re-ranking benchmarks, measuring effectiveness, call count, token use, runtime, and output reliability shows that long context is not merely more prompt space, but an opportunity to make LLM re-rankers both effective and efficient.
- Abstract(参考訳): 従来のLLMベースのパス再ランカは、入力コンテキストの制約によって多くの依存モデル呼び出しを行う必要があるため、高価で遅いことが多い。
検索した候補パスの完全なセットを一度にモデルに示すことができれば、多くの重複する局所比較からランキングを再構築する必要がなくなる。
各コールが現在非ランクの候補パスをすべて考慮し、DualEndを導入し、1回の呼び出しで最も関連性の高いパスと最も関連性の高いパスの両方を識別する。
両端からランク付けすることで、DualEndは100人の候補者に50回のLCMコールを付けている。
9つのオープンウェイトLLMを2つのパス再評価ベンチマークで実験したところ、有効性、呼び出し数、トークン使用、実行時間、出力の信頼性は、長いコンテキストが単なる即時的な空間であるだけでなく、LLMの再ランカを効果的かつ効率的にする機会であることを示している。
関連論文リスト
- Dynamic Ranked List Truncation for Reranking Pipelines via LLM-generated Reference-Documents [15.552090744502477]
大規模言語モデル (LLM) は再分類に広く用いられている。
計算オーバーヘッドと大きなコンテキスト長は、LLMリランカにとって難しい問題である。
我々は、これらの生成された参照文書をRTTに使用し、効率的なリストワイドのランク付けを行う方法を提案する。
論文 参考訳(メタデータ) (2026-04-10T16:59:54Z) - Recursive Language Models [14.17788048231183]
本稿では,長いプロンプトを外部環境として扱う一般的な推論手法であるRecursive Language Models (RLMs)を提案する。
RLMはモデルウィンドウを超える2桁の処理に成功し、たとえ短いプロンプトであっても、ベースLLMの品質を劇的に上回っていることがわかった。
論文 参考訳(メタデータ) (2025-12-31T03:43:41Z) - Delayed Fusion: Integrating Large Language Models into First-Pass Decoding in End-to-end Speech Recognition [17.376550014426623]
本稿では,大規模言語モデル(LLM)を用いたエンドツーエンド自動音声認識(E2E-ASR)の効率的な復号化手法を提案する。
復号時に遅延を伴うASR仮説にLLMスコアを適用する「遅延融合」を提案する。
遅延核融合により、浅い核融合やN-best再コーディングに比べてデコード速度と精度が向上することを示した。
論文 参考訳(メタデータ) (2025-01-16T03:01:50Z) - Sliding Windows Are Not the End: Exploring Full Ranking with Long-Context Large Language Models [40.21540137079309]
LLM(Long-context Language Models)は、単一の推論内で全ての節の完全なランク付けを可能にする。
教師付き微調整環境において,LLMの完全ランク付けにより優れた性能が得られることを示す。
本稿では,リストワイドなラベル構築手法を提案する。
論文 参考訳(メタデータ) (2024-12-19T06:44:59Z) - Intermittent Semi-working Mask: A New Masking Paradigm for LLMs [13.271151693864114]
マルチターン対話は人間と大規模言語モデル(LLM)の鍵となる対話手法である
これらの問題に対処するために,ISM (Intermittent Semi-working Mask) と呼ばれる新しいマスキング手法を提案する。
論文 参考訳(メタデータ) (2024-08-01T13:22:01Z) - InfLLM: Training-Free Long-Context Extrapolation for LLMs with an Efficient Context Memory [93.20588235940453]
本稿では,トレーニング不要なメモリベースのInfLLMを提案する。
InfLLMは、リモートコンテキストを追加のメモリユニットに格納し、トークン関連ユニットを注目するために効率的なメカニズムを使用する。
シーケンス長が$1,024$Kにスケールしても、InfLLMは依然として、長距離依存関係を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-02-07T06:50:42Z) - Retrieval meets Long Context Large Language Models [59.431200671427064]
大規模言語モデル(LLM)のコンテキストウィンドウの拡張が最近人気を集めている。
Retrieval-augmentation対ロングコンテキストウィンドウ。
両方の方法を組み合わせることで、両方の世界を最大限に活用できますか?
我々の最良モデルである32Kコンテキストウィンドウ付きLlama2-70Bは、9つの長いコンテキストタスクの平均スコアにおいて、GPT-3.5-turbo-16kとDavinci003より優れています。
論文 参考訳(メタデータ) (2023-10-04T17:59:41Z) - LM-Infinite: Zero-Shot Extreme Length Generalization for Large Language Models [83.98062659664785]
大規模言語モデル(LLM)は通常、トランスフォーマーアーキテクチャの2次複雑さのために短いテキストセグメント(例:4Kトークン)でトレーニングする。
この研究は、この長大一般化失敗に寄与する3つの主要な要因を特定する。
本研究では,LLMの長期処理能力を高めるための簡易かつ効果的な手法であるLM-Infiniteを提案する。
論文 参考訳(メタデータ) (2023-08-30T16:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。