論文の概要: Bayesian Active Learning with Gaussian Processes Guided by LLM Relevance Scoring for Dense Passage Retrieval
- arxiv url: http://arxiv.org/abs/2604.17906v1
- Date: Mon, 20 Apr 2026 07:32:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.749042
- Title: Bayesian Active Learning with Gaussian Processes Guided by LLM Relevance Scoring for Dense Passage Retrieval
- Title(参考訳): LLMレバレンス・スコアリングによる高密度パス検索のためのガウス過程によるベイズ能動的学習
- Authors: Junyoung Kim, Anton Korikov, Jiazhou Liang, Justin Cui, Yifan Simon Liu, Qianfeng Wen, Mark Zhao, Scott Sanner,
- Abstract要約: BAGELは、グローバルな探索を導くために、埋め込み空間をまたいでスパース関連信号を伝播する新しいフレームワークである。
信頼度の高い地域の搾取と不確実な地域の探索とを戦略的にバランスさせることで、得点のための通路を反復的に選択する。
- 参考スコア(独自算出の注目度): 20.193565383791213
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: While Large Language Models (LLMs) exhibit exceptional zero-shot relevance modeling, their high computational cost necessitates framing passage retrieval as a budget-constrained global optimization problem. Existing approaches passively rely on first-stage dense retrievers, which leads to two limitations: (1) failing to retrieve relevant passages in semantically distinct clusters, and (2) failing to propagate relevance signals to the broader corpus. To address these limitations, we propose Bayesian Active Learning with Gaussian Processes guided by LLM relevance scoring (BAGEL), a novel framework that propagates sparse LLM relevance signals across the embedding space to guide global exploration. BAGEL models the multimodal relevance distribution across the entire embedding space with a query-specific Gaussian Process (GP) based on LLM relevance scores. Subsequently, it iteratively selects passages for scoring by strategically balancing the exploitation of high-confidence regions with the exploration of uncertain areas. Extensive experiments across four benchmark datasets and two LLM backbones demonstrate that BAGEL effectively explores and captures complex relevance distributions and outperforms LLM reranking methods under the same LLM budget on all four datasets.
- Abstract(参考訳): 大規模言語モデル(LLM)は例外的なゼロショット関連性モデルを示すが、その高い計算コストは、予算制約のあるグローバル最適化問題としてフレーミングパス検索を必要とする。
既存のアプローチは第1段階の高密度検索器に受動的に依存しており、(1)意味的に異なるクラスタ内の関連通路の検索に失敗したこと、(2)より広いコーパスへの関連シグナルの伝達に失敗したこと、の2つの制限が生じる。
これらの制約に対処するため,LLMレバレンススコア(BAGEL)によって導かれるガウス的プロセスを用いたベイズ的アクティブラーニング(Bayesian Active Learning)を提案する。
BAGELは、LLMレバレンススコアに基づいて、クエリ固有のガウスプロセス(GP)を用いて、埋め込み空間全体にわたるマルチモーダルなレバレンス分布をモデル化する。
その後、信頼度の高い地域の搾取と不確実な地域の探究とを戦略的にバランスさせて、得点のための通路を反復的に選択する。
4つのベンチマークデータセットと2つのLLMバックボーンにわたる大規模な実験により、BAGELは複雑な関連性分布を効果的に探索し、キャプチャし、4つのデータセットすべてで同じLLM予算の下でLLMのリグレードメソッドを上回ります。
関連論文リスト
- Memory-Based Advantage Shaping for LLM-Guided Reinforcement Learning [18.215893951726166]
スパースや遅延した報酬のある環境では、強化学習は高いサンプル複雑さを引き起こす。
この制限は、大規模言語モデル(LLM)をサブゴール発見や軌道誘導に使う動機となった。
LLMガイダンスとエージェント自身のロールアウトの成功の両方から,サブゴールとトラジェクトリを符号化したメモリグラフを構築することで,これらの課題に対処する。
論文 参考訳(メタデータ) (2026-02-20T01:44:35Z) - FineRS: Fine-grained Reasoning and Segmentation of Small Objects with Reinforcement Learning [62.11389260206383]
textscFineRSは、非常に小さなオブジェクトをセグメント化するための2段階のMLLMベースの強化学習フレームワークである。
textscFineRS-4kは,属性レベルの推論に基づくMLLMの評価と,微妙で小規模なターゲットに対する画素レベルのセグメンテーションのための新しいデータセットである。
論文 参考訳(メタデータ) (2025-10-24T10:14:17Z) - RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization [111.1749164063616]
大規模言語モデル(LLM)のための新しいハイブリッド政治最適化手法RL-PLUSを提案する。
RL-PLUSは、外部データと内部エクスプロイトを相乗化して、より強力な推論能力を達成し、ベースモデルのバウンダリを超える。
提案手法の優位性と一般化性を示すため,理論解析と広範な実験を行った。
論文 参考訳(メタデータ) (2025-07-31T23:55:29Z) - Iterative Self-Incentivization Empowers Large Language Models as Agentic Searchers [74.17516978246152]
大規模言語モデル(LLM)は、従来の手法を進化させるために情報検索に広く統合されている。
エージェント検索フレームワークであるEXSEARCHを提案する。
4つの知識集約ベンチマークの実験では、EXSEARCHはベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-26T15:27:55Z) - Assessing LLMs for Zero-shot Abstractive Summarization Through the Lens of Relevance Paraphrasing [37.400757839157116]
大言語モデル(LLM)は、与えられた記事に対する抽象的な要約のゼロショット生成において最先端のパフォーマンスを達成した。
本稿では,LLMのロバスト性を測定するためのシンプルな戦略であるrelevance paraphrasingを提案する。
論文 参考訳(メタデータ) (2024-06-06T12:08:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。