論文の概要: Learning from Emptiness: De-biasing Listwise Rerankers with Content-Agnostic Probability Calibration
- arxiv url: http://arxiv.org/abs/2604.10150v1
- Date: Sat, 11 Apr 2026 10:47:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.873802
- Title: Learning from Emptiness: De-biasing Listwise Rerankers with Content-Agnostic Probability Calibration
- Title(参考訳): 経験から学ぶ:コンテンツに依存しない確率の校正によるリスランカの非バイアス化
- Authors: Hang Lv, Hongchao Gu, Ruiqing Yang, Liangyue Li, Zulong Chen, Defu Lian, Hao Wang, Enhong Chen,
- Abstract要約: CapCalは、ランキング決定から位置バイアスを機械的に分離する、トレーニング不要のフレームワークである。
シングルパス効率を保ちながら、トレーニング不要の手法で優れた性能を発揮する。
- 参考スコア(独自算出の注目度): 76.08899010904652
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative listwise reranking leverages global context for superior retrieval but is plagued by intrinsic position bias, where models exhibit structural sensitivity to input order independent of relevance. Existing mitigations present a dilemma: inference-time aggregation incurs prohibitive latency, while training-based methods often fail to eradicate ingrained priors, particularly in compact models. To resolve this dilemma, we propose CapCal (Content-Agnostic Probability Calibration), a training-free framework that mechanically decouples positional bias from ranking decisions. By estimating the bias distribution via content-free placeholders, CapCal rectifies output logits through an entropy-adaptive contrastive mechanism. Evaluations across 10 benchmarks confirm that CapCal achieves superior performance among training-free methods while preserving single-pass efficiency. Notably, it unlocks the latent potential of lightweight models (e.g., 0.6B), delivering absolute NDCG gains exceeding 10 points and outperforming both permutation-based aggregation and data-augmentation baselines.
- Abstract(参考訳): 生成的リストワイド・リグレードは、グローバルコンテキストを優れた検索に活用するが、本質的な位置バイアスに悩まされ、モデルが関連性に依存しない入力順序に対する構造的感度を示す。
既存の緩和策はジレンマを呈している: 推論時アグリゲーションは禁忌の遅延を引き起こすが、トレーニングベースの手法は、特にコンパクトモデルにおいて、詳細な先行を根絶するのに失敗することが多い。
このジレンマを解決するために,ランキング決定から位置バイアスを機械的に分離するトレーニングフリーフレームワークであるCapCal(Content-Agnostic Probability Calibration)を提案する。
CapCalは、コンテンツフリープレースホルダーを介してバイアス分布を推定することにより、エントロピー適応コントラスト機構を通じて出力ロジットを補正する。
10ベンチマークで評価したところ、CapCalはシングルパス効率を保ちながら、トレーニング不要のメソッドで優れたパフォーマンスを実現している。
特に、軽量モデルの潜在可能性(例えば0.6B)を解放し、絶対的なNDCGゲインを10ポイント以上達成し、置換ベースのアグリゲーションとデータ拡張ベースラインの両方を上回っている。
関連論文リスト
- Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Reference-Free Rating of LLM Responses via Latent Information [53.463883683503106]
本研究では,判断モデルに対して,自由テキスト応答にQuattスケールのスコアを割り当てるよう依頼する一般的な実践について検討する。
次に、内部モデル信号からスカラー評価を導出する潜在裁判官を提案し、評価する。
ペアとシングルレーティングのベンチマークの幅広いスイートの中で、潜在メソッドは標準のプロンプトにマッチするか、超えている。
論文 参考訳(メタデータ) (2025-09-29T12:15:52Z) - Backpropagation-Free Test-Time Adaptation via Probabilistic Gaussian Alignment [16.352863226512984]
テスト時間適応(TTA)は、推論中にラベルのないテストデータを活用することにより、分散シフト下でのゼロショットロバスト性を高める。
ほとんどのメソッドは、スケーラビリティを制限し、リアルタイムデプロイメントを妨げるバックプロパゲーションや反復最適化に依存しています。
本稿では,Advanced Distribution-AwareとBack propagation-free Test-time Adapting法であるADAPTを提案する。
論文 参考訳(メタデータ) (2025-08-21T13:42:49Z) - Selective Learning: Towards Robust Calibration with Dynamic Regularization [79.92633587914659]
ディープラーニングにおけるミススキャリブレーションとは、予測された信頼とパフォーマンスの間には相違がある、という意味である。
トレーニング中に何を学ぶべきかを学ぶことを目的とした動的正規化(DReg)を導入し、信頼度調整のトレードオフを回避する。
論文 参考訳(メタデータ) (2024-02-13T11:25:20Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。