Fugu-MT 論文翻訳(概要): Improving Zero-shot LLM Re-Ranker with Risk Minimization

論文の概要: Improving Zero-shot LLM Re-Ranker with Risk Minimization

arxiv url: http://arxiv.org/abs/2406.13331v1
Date: Wed, 19 Jun 2024 08:29:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-21 22:40:02.312119
Title: Improving Zero-shot LLM Re-Ranker with Risk Minimization
Title（参考訳）: リスク最小化によるゼロショットLDMリランカーの改善
Authors: Xiaowei Yuan, Zhao Yang, Yequan Wang, Jun Zhao, Kang Liu,
Abstract要約: Retrieval-Augmented Generation (RAG) システムでは、高度なLarge Language Models (LLMs) が、教師なしの方法で有効なQuery Likelihood Models (QLMs) として登場した。しかし、直接的にQLMを近似させる手法は、推定された分布が実際の文書固有の分布から分岐する可能性があるため、偏りがある。我々はベイズ決定理論を利用してこの推定バイアスを定量化し緩和する新しいフレームワーク、$mathrmUR3$を導入する。
参考スコア（独自算出の注目度）: 20.32406191251512
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the Retrieval-Augmented Generation (RAG) system, advanced Large Language Models (LLMs) have emerged as effective Query Likelihood Models (QLMs) in an unsupervised way, which re-rank documents based on the probability of generating the query given the content of a document. However, directly prompting LLMs to approximate QLMs inherently is biased, where the estimated distribution might diverge from the actual document-specific distribution. In this study, we introduce a novel framework, $\mathrm{UR^3}$, which leverages Bayesian decision theory to both quantify and mitigate this estimation bias. Specifically, $\mathrm{UR^3}$ reformulates the problem as maximizing the probability of document generation, thereby harmonizing the optimization of query and document generation probabilities under a unified risk minimization objective. Our empirical results indicate that $\mathrm{UR^3}$ significantly enhances re-ranking, particularly in improving the Top-1 accuracy. It benefits the QA tasks by achieving higher accuracy with fewer input documents.
Abstract（参考訳）: Retrieval-Augmented Generation (RAG)システムでは、高度なLarge Language Models (LLMs) が教師なしの方法でクエリ類似モデル (QLMs) として出現し、ドキュメントの内容からクエリを生成する確率に基づいてドキュメントを再ランクする。しかし、直接的にQLMを近似させる手法は、推定された分布が実際の文書固有の分布から分岐する可能性があるため、偏りがある。本研究では,この推定バイアスの定量化と緩和にベイズ決定理論を活用する新しい枠組みである$\mathrm{UR^3}$を導入する。具体的には、$\mathrm{UR^3}$は、ドキュメント生成の確率を最大化するものとして問題を再構成し、統一されたリスク最小化目標の下でクエリとドキュメント生成確率の最適化を調和させる。実験の結果,$\mathrm{UR^3}$は,特にTop-1精度の向上において,再ランクを著しく向上することが示された。少ない入力ドキュメントで高い精度を達成することで、QAタスクの恩恵を受ける。

関連論文リスト

ProRank: Prompt Warmup via Reinforcement Learning for Small Language Models Reranking [8.244386008877441]
本稿では,SLM ベースの文書更新のための新しい2段階トレーニング手法 ProRank を提案する。まず、強化学習GRPOを用いてSLMを操り、タスクプロンプトを理解するプロンプトウォームアップステージを提案する。そこで我々は,精巧なスコア学習段階を連続的に微調整し,付加層を導入することなく品質向上を図る。
論文参考訳（メタデータ） (2025-06-04T02:00:44Z)
Optimal Policy Minimum Bayesian Risk [25.434911234706952]
ベイズリスク復号(MBRD)に報酬・リスク・類似性信号を統合する新しい手法を提案する。 KL制御強化学習における最適ポリシの概念に基づいて、このような信号を活用するためのシンプルで明確に定義されたメカニズムを提供する。従来の推論時間法よりも、高い堅牢性、改善された精度、よく理解された振る舞いなど、いくつかの利点がある。
論文参考訳（メタデータ） (2025-05-22T19:43:37Z)
Likelihood-Ratio Regularized Quantile Regression: Adapting Conformal Prediction to High-Dimensional Covariate Shifts [35.16750653336608]
ピンボール損失を正規化の新たな選択と組み合わせた正準比正則化量子回帰アルゴリズムを提案する。 LR-QR法は,対象領域の所望レベルにおいて,最小限の誤差項までカバレッジを有することを示す。実験により、LR-QRアルゴリズムは、高次元予測タスクにおいて既存の手法よりも優れていることを示した。
論文参考訳（メタデータ） (2025-02-18T16:46:44Z)
Inference Scaling for Bridging Retrieval and Augmented Generation [47.091086803980765]
大規模言語モデル(LLM)の出力を操る一般的なアプローチとして、検索拡張世代(RAG)が登場している。このようなバイアスは、推論スケーリングから、検索されたコンテキストの置換順序からの推論呼び出しの集約まで緩和可能であることを示す。 ROUGE-L は MS MARCO で,EM は HotpotQA ベンチマークで 7 ポイント向上した。
論文参考訳（メタデータ） (2024-12-14T05:06:43Z)
Calibrating Verbalized Probabilities for Large Language Models [7.586709509332433]
単語化確率の校正は,ブラックボックス大言語モデルからの出力を確実に評価し,活用するための新しいアプローチを示す。近年の手法では,LLMの信頼性スコアにプラットスケーリングや温度スケーリングなどの手法を適用し,キャリブレーションの改善が示されている。
論文参考訳（メタデータ） (2024-10-09T09:20:24Z)
A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [48.96686419141881]
大規模言語モデル(LLM)のための最初の形式的確率的評価フレームワークを紹介する。すなわち,モデルの出力分布に関する確率保証の高い新しい指標を提案する。私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文参考訳（メタデータ） (2024-10-04T15:44:23Z)
Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文参考訳（メタデータ） (2024-06-05T16:35:30Z)
BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models [52.46248487458641]
予測モデルは、現実世界のタスクで不完全な情報を扱う必要があることが多い。現在の大規模言語モデル(LLM)は、そのような正確な推定には不十分である。本稿では,新しい確率的推論フレームワークBIRDを提案する。
論文参考訳（メタデータ） (2024-04-18T20:17:23Z)
Maximum Likelihood Estimation is All You Need for Well-Specified Covariate Shift [34.414261291690856]
現代の機械学習システムの鍵となる課題は、アウト・オブ・ディストリビューション(OOD)の一般化を達成することである。音源データを用いた古典的最大等化推定(MLE)が極小最適化を実現することを示す。 3つの具体例にインスタンス化することで、フレームワークの幅広い適用性を説明します。
論文参考訳（メタデータ） (2023-11-27T16:06:48Z)
Open-source Large Language Models are Strong Zero-shot Query Likelihood Models for Document Ranking [36.90911173089409]
大規模言語モデル(LLM)は、効果的なクエリ類似モデル(QLM)として登場した。本稿では,近年のLLMにおけるゼロショットランキングの有効性について検討する。 LLMをベースとしたQLMとハイブリッドゼロショットレトリバーを統合した,最先端のランキングシステムを提案する。
論文参考訳（メタデータ） (2023-10-20T02:54:42Z)
Minimum-Risk Recalibration of Classifiers [9.31067660373791]
平均二乗誤差分解の枠組みにおいて,最小リスク再校正の概念を導入する。校正分類器の転送には,スクラッチから再校正するのに比べて,ターゲットサンプルが著しく少ないことが示されている。
論文参考訳（メタデータ） (2023-05-18T11:27:02Z)
Probable Domain Generalization via Quantile Risk Minimization [90.15831047587302]
ドメインの一般化は、目に見えないテスト分布でうまく機能する予測子を求める。我々はDGのための新しい確率的フレームワークを提案し、高い確率でよく動作する予測器を学習することを目指している。
論文参考訳（メタデータ） (2022-07-20T14:41:09Z)
Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文参考訳（メタデータ） (2022-04-13T12:43:12Z)
A Multi-Document Coverage Reward for RELAXed Multi-Document Summarization [11.02198476454955]
本稿では,MDSの基準値と入力文書のカバレッジのバランスをとる報酬を付与したMDSベースラインの微調整を提案する。 Multi-NewsおよびWCEP MDSデータセットに対する実験結果から、ベースライン上での平均ROUGEスコアが+0.95pp、METEORスコアが+3.17ppと大幅に改善された。
論文参考訳（メタデータ） (2022-03-06T07:33:01Z)
Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文参考訳（メタデータ） (2021-06-05T09:16:28Z)
Distributionally Robust Bayesian Quadrature Optimization [60.383252534861136]
確率分布が未知な分布の不確実性の下でBQOについて検討する。標準的なBQOアプローチは、固定されたサンプル集合が与えられたときの真の期待目標のモンテカルロ推定を最大化する。この目的のために,新しい後方サンプリングに基づくアルゴリズム,すなわち分布的に堅牢なBQO(DRBQO)を提案する。
論文参考訳（メタデータ） (2020-01-19T12:00:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。