Fugu-MT 論文翻訳(概要): Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models

論文の概要: Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models

arxiv url: http://arxiv.org/abs/2406.14848v1
Date: Fri, 21 Jun 2024 03:33:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-24 14:52:36.130630
Title: Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models
Title（参考訳）: 大規模言語モデルを用いた効率的なリスニングのためのパッセージ埋め込みの活用
Authors: Qi Liu, Bo Wang, Nan Wang, Jiaxin Mao,
Abstract要約: 本稿では, PE-Rankを提案する。本稿では,これらの特別なトークンに復号空間を動的に制約し,復号処理を高速化する推論手法を提案する。複数のベンチマークの結果、PE-Rankは、競合するランキング効率を維持しながら、プリフィルとデコードの両方の効率を大幅に改善することを示した。
参考スコア（独自算出の注目度）: 17.420756201557957
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Recent studies have demonstrated the effectiveness of using large language language models (LLMs) in passage ranking. The listwise approaches, such as RankGPT, have become new state-of-the-art in this task. However, the efficiency of RankGPT models is limited by the maximum context length and relatively high latency of LLM inference. To address these issues, in this paper, we propose PE-Rank, leveraging the single passage embedding as a good context compression for efficient listwise passage reranking. By treating each passage as a special token, we can directly input passage embeddings into LLMs, thereby reducing input length. Additionally, we introduce an inference method that dynamically constrains the decoding space to these special tokens, accelerating the decoding process. For adapting the model to reranking, we employ listwise learning to rank loss for training. Evaluation results on multiple benchmarks demonstrate that PE-Rank significantly improves efficiency in both prefilling and decoding, while maintaining competitive ranking effectiveness. {The Code is available at \url{https://github.com/liuqi6777/pe_rank}.}
Abstract（参考訳）: 近年の研究では,大言語モデル (LLM) を通訳ランキングに使用することの有効性が実証されている。 RankGPTのようなリストワイズアプローチはこのタスクにおいて新しい最先端技術になっている。しかし、LangGPTモデルの効率は、LLM推論の最大文脈長と比較的高いレイテンシによって制限される。これらの問題に対処するために, PE-Rankを提案する。それぞれの通路を特別なトークンとして扱うことにより、通路埋め込みを直接LSMに入力し、入力長を削減できる。さらに、これらの特別なトークンに復号空間を動的に制約する推論手法を導入し、復号処理を高速化する。モデルを再ランク付けするためには、トレーニングの損失をランク付けするためにリストワイズ学習を採用します。複数のベンチマークで評価した結果、PE-Rankは、競合するランキング効率を維持しながら、プリフィルとデコードの両方の効率を大幅に向上することが示された。 The Code は \url{https://github.com/liuqi6777/pe_rank} で入手できる。 ※

関連論文リスト

CoRanking: Collaborative Ranking with Small and Large Ranking Agents [39.98101653077503]
大規模言語モデル(LLM)は、優れたリストワイドランキング性能を示している。 CoRankingは、小規模と大規模なランキングモデルを組み合わせて、効率的かつ効果的なランク付けを行う。
論文参考訳（メタデータ） (2025-03-30T13:00:52Z)
ListConRanker: A Contrastive Text Reranker with Listwise Encoding [27.017035527335402]
本稿では,Listwise-encoded Contrastive text reRanker (ListConRanker)を提案する。これは、エンコーディングプロセス中に他のパスと比較するのに役立ちます。これは、中国語のMassive Text Embedding Benchmarkの再評価ベンチマークで、最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (2025-01-13T07:51:46Z)
Sliding Windows Are Not the End: Exploring Full Ranking with Long-Context Large Language Models [40.21540137079309]
LLM(Long-context Language Models)は、単一の推論内で全ての節の完全なランク付けを可能にする。教師付き微調整環境において,LLMの完全ランク付けにより優れた性能が得られることを示す。本稿では,リストワイドなラベル構築手法を提案する。
論文参考訳（メタデータ） (2024-12-19T06:44:59Z)
Self-Calibrated Listwise Reranking with Large Language Models [137.6557607279876]
大規模言語モデル (LLM) はシーケンシャル・ツー・シーケンス・アプローチによってタスクのランク付けに使用されている。この階調のパラダイムは、より大きな候補集合を反復的に扱うためにスライディングウインドウ戦略を必要とする。そこで本稿では,LLMを用いた自己校正リストのランク付け手法を提案する。
論文参考訳（メタデータ） (2024-11-07T10:31:31Z)
FIRST: Faster Improved Listwise Reranking with Single Token Decoding [56.727761901751194]
まず、第1生成識別子の出力ロジットを活用して、候補のランク付け順序を直接取得する新しいリストワイズLLMリグレードアプローチであるFIRSTを紹介する。実験結果から、BEIRベンチマークの利得により、FIRSTはロバストなランキング性能を維持しつつ、推論を50%高速化することが示された。以上の結果から,LLMリランカーはクロスエンコーダに比べて強い蒸留信号を提供できることが示唆された。
論文参考訳（メタデータ） (2024-06-21T21:27:50Z)
VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections [35.133698935322634]
大規模言語モデル(LLM)は、最近、多くの言語処理タスクに対処するための強力なツールとして登場した。勾配勾配勾配を用いた効率的なモデル収束に必要な重要な成分を同定し,特徴付ける。この結果から, 微調整と事前学習の両方のための, 安価かつメモリ効率のよいアルゴリズムが得られた。
論文参考訳（メタデータ） (2024-05-28T09:23:14Z)
MoRA: High-Rank Updating for Parameter-Efficient Fine-Tuning [105.11844150736536]
低ランク適応は、大規模言語モデルのためのパラメータ効率の良い微調整法として人気がある。トレーニング可能なパラメータ数を同じ数に保ちながら、高階更新を実現するために2乗行列を用いるMoRAと呼ばれる新しい手法を提案する。本手法はメモリ集約型タスクではLoRAより優れ,他のタスクでは同等のパフォーマンスを実現している。
論文参考訳（メタデータ） (2024-05-20T15:48:32Z)
Rank-DistiLLM: Closing the Effectiveness Gap Between Cross-Encoders and LLMs for Passage Re-Ranking [79.35822270532948]
大規模言語モデル (LLM) から蒸留したクロスエンコーダは、手動でラベル付けされたデータに微調整されたクロスエンコーダよりも効果的であることが多い。このギャップを埋めるために、新しいデータセットである Rank-DistiLLM を作成します。 Rank-DistiLLMでトレーニングされたクロスエンコーダは、最大173倍高速で24倍のメモリ効率を実現している。
論文参考訳（メタデータ） (2024-05-13T16:51:53Z)
PRILoRA: Pruned and Rank-Increasing Low-Rank Adaptation [65.268245109828]
我々はPRILoRAを導入し、各層ごとに異なるランクを線形に割り当て、トレーニングプロセスを通してプルーニングを行う。 8つのGLUEベンチマークで広範な実験を行い,PRILoRAの有効性を検証する。
論文参考訳（メタデータ） (2024-01-20T20:25:17Z)
Instruction Distillation Makes Large Language Models Efficient Zero-shot Rankers [56.12593882838412]
本稿では,文書のランク付けのための新しい命令蒸留手法を提案する。まず、複雑な命令で効果的なペアワイズ手法を用いて文書をランク付けし、簡単な指示で教師の予測をポイントワイズ方式で抽出する。提案手法は,MonoT5のような既存の教師付きメソッドの性能を超越し,最先端のゼロショット手法と同等である。
論文参考訳（メタデータ） (2023-11-02T19:16:21Z)
A Setwise Approach for Effective and Highly Efficient Zero-shot Ranking with Large Language Models [35.17291316942284]
本稿では,Large Language Models (LLMs) に基づくゼロショット文書ランキング手法を提案する。我々のアプローチは、LLMベースのゼロショットランキング(ポイントワイズ、ペアワイズ、リストワイズ)の既存のプロンプトアプローチを補完する。
論文参考訳（メタデータ） (2023-10-14T05:20:02Z)
Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文参考訳（メタデータ） (2022-03-23T06:24:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。