論文の概要: UniRank: Unified List-wise Reranking via Confidence-Ordered Denoising
- arxiv url: http://arxiv.org/abs/2605.10527v1
- Date: Mon, 11 May 2026 13:12:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.835467
- Title: UniRank: Unified List-wise Reranking via Confidence-Ordered Denoising
- Title(参考訳): UniRank: 信頼性を優先したデノベーションによるリストの統一化
- Authors: Pengyue Jia, Hailan Yang, Shuchang Liu, Xiaobei Wang, Wanyu Wang, Xiang Li, Yongqi Liu, Kaiqiao Zhan, Kun Gai, Xiangyu Zhao,
- Abstract要約: リストの並べ替えは、リクエスト固有の候補項目のプールを、ユーザの満足度を最大化する順序付きスレートに配置する。
提案するUniRankは、ARとNARのリランカを特殊ケースとして復元する、リスト単位のリグレードフレームワークである。
Amazon Books、MovieLens-1M、および工業用ショートビデオデータセットの実験は、UniRankが一貫して最先端のベースラインを上回っていることを示している。
- 参考スコア(独自算出の注目度): 33.296591996616975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: List-wise reranking arranges a request-specific pool of candidate items into an ordered slate that maximizes user satisfaction. Existing generative rerankers fall into two paradigms: Autoregressive (AR) rerankers construct the slate left to right and capture inter-item dependencies in the exposure list, but they suffer from error propagation because early mistakes affect subsequent slots. Non-autoregressive (NAR) rerankers predict all slots in parallel and avoid error propagation, but they weaken inter-item interaction modeling under a slot independence assumption. This raises a central question: is there a unified architecture that combines the strengths of both paradigms and delivers stronger reranking performance? We answer this question with UniRank, a unified list-wise reranking framework whose inference time variants recover AR and NAR rerankers as special cases. UniRank integrates bidirectional slate modeling into an iterative denoising process and fills the most confident slot at each step. To instantiate this framework for reranking, we introduce the Task Grounded Diffusion Interface (TGD), which performs denoising at the item level and restricts prediction to the request-specific candidate pool. TGD aggregates each item's semantic tokens into a single item embedding and scores each slot directly against the candidate pool. Experiments on Amazon Books, MovieLens-1M, and an industrial short video dataset show that UniRank consistently outperforms state-of-the-art baselines. Online A/B tests on a real-world industrial platform further validate its effectiveness, yielding significant improvements of +0.159% in user average app-time and +1.016% in share-rate.
- Abstract(参考訳): リストの並べ替えは、リクエスト固有の候補項目のプールを、ユーザの満足度を最大化する順序付きスレートに配置する。
既存の生成的リランカは2つのパラダイムに分類される: 自動回帰(AR)リランカは、露出リスト内のスレートを左から右に構築し、イテム間の依存関係をキャプチャするが、初期ミスが後続のスロットに影響を与えるためエラーの伝播に悩まされる。
非自己回帰(NAR)リランカは、全てのスロットを並列に予測し、エラーの伝播を避けるが、スロット独立仮定の下での相互作用モデリングを弱める。
両方のパラダイムの長所を結合し、より強力なパフォーマンスを提供する統一アーキテクチャが存在するか?
この疑問に答えるUniRankは、推論時間変異がARとNARリランカを特殊ケースとして回復するリストワイドリグレードフレームワークである。
UniRankは双方向のスレートモデリングを反復的認知プロセスに統合し、各ステップで最も自信のあるスロットを埋める。
このフレームワークを再配置するために、アイテムレベルでデノベーションを行い、リクエスト固有の候補プールに予測を制限するタスク接地拡散インタフェース(TGD)を導入する。
TGDは各項目のセマンティックトークンを単一のアイテム埋め込みに集約し、各スロットを候補プールに対して直接得点する。
Amazon Books、MovieLens-1M、および工業用ショートビデオデータセットの実験は、UniRankが一貫して最先端のベースラインを上回っていることを示している。
実世界の産業プラットフォーム上でのオンラインA/Bテストは、その効果をさらに検証し、ユーザ平均のアプリタイム+0.159%、シェアレート+1.016%を大幅に改善した。
関連論文リスト
- AdaPaD: Adaptive Parallel Deflation for PEFT with Self-Correcting Rank Discovery [10.176501817419371]
本稿では,AdaPaD(Adaptive Parallel Deflation)について述べる。
我々は、各成分の誤差がウォームアップ期間後に指数関数的に崩壊することを証明する。
AdaPaDは、GLUE上の適応ランクのLoRAベースラインとDeBERTaV3ベースとの整合パラメータ予算で競合する。
論文 参考訳(メタデータ) (2026-05-11T15:44:13Z) - ResRank: Unifying Retrieval and Listwise Reranking via End-to-End Joint Training with Residual Passage Compression [5.223477157195793]
中間のロスト」現象は、入力長が大きくなるにつれてランキング品質を低下させる。
推論レイテンシは、シーケンス長と超直線的にスケールし、産業展開において非現実的にリストワイズする。
ResRankは、両方の課題を根本的に解決する統合検索格付けフレームワークである。
論文 参考訳(メタデータ) (2026-04-24T03:11:51Z) - ARHN: Answer-Centric Relabeling of Hard Negatives with Open-Source LLMs for Dense Retrieval [12.84859278829763]
我々は,答え中心の関連信号を用いて強陰性サンプルを精査するためのARHN(Answer-centric Relabeling of Hard Negatives)を提案する。
BEIRベンチマークのARHNを3つの構成で評価した。
論文 参考訳(メタデータ) (2026-04-13T07:11:30Z) - CAIRO: Decoupling Order from Scale in Regression [13.755937210012883]
回帰を2つの異なる段階に分離する枠組みを提案する。
第1段階では,スケール不変ランキングの損失を最小限に抑えることで,スコアリング関数を学習する。
第2に,等速回帰による目標スケールの復元を行う。
論文 参考訳(メタデータ) (2026-02-16T03:50:05Z) - CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal [84.71254539482369]
検証可能な報酬を伴うグループ相対的強化学習(RLVR)は、しばしば、すでに失敗している最も情報に富むデータを浪費する。
エラーを監督するマルチモーダル推論のための,障害中心のポストトレーニングフレームワークであるCAREを提案する。
CAREは正確さを改善し、スムーズさをトレーニングすると同時に、障害からの学習信号のシェアを明示的に増やします。
論文 参考訳(メタデータ) (2025-12-22T16:34:21Z) - Gumbel Reranking: Differentiable End-to-End Reranker Optimization [61.16471123356738]
RAGシステムは関連する文書を識別するためにリランカーに依存している。
注釈付きクエリ-ドキュメントペアが不足しているため、これらのモデルの微調整は依然として難しい。
我々は,トレーニングと推論のギャップを最小限に抑えることを目的とした,リランカーのためのエンドツーエンドのトレーニングフレームワークであるGumbel Re rankを提案する。
論文 参考訳(メタデータ) (2025-02-16T13:23:39Z) - Towards Generalizable Trajectory Prediction Using Dual-Level Representation Learning And Adaptive Prompting [107.4034346788744]
既存の車両軌道予測モデルは、一般化可能性、予測の不確実性、複雑な相互作用を扱う。
本研究では,(1)自己拡張(SD)とマスドレコンストラクション(MR)による二重レベル表現学習,グローバルコンテキストと細部の詳細の収集,(2)レジスタベースのクエリと事前学習の強化,クラスタリングと抑圧の必要性の排除,(3)微調整中の適応型プロンプトチューニング,メインアーキテクチャの凍結,および少数のプロンプトの最適化といった,新たなトラジェクタ予測フレームワークであるPerceiverを提案する。
論文 参考訳(メタデータ) (2025-01-08T20:11:09Z) - Inference Scaling for Bridging Retrieval and Augmented Generation [47.091086803980765]
大規模言語モデル(LLM)の出力を操る一般的なアプローチとして、検索拡張世代(RAG)が登場している。
このようなバイアスは、推論スケーリングから、検索されたコンテキストの置換順序からの推論呼び出しの集約まで緩和可能であることを示す。
ROUGE-L は MS MARCO で,EM は HotpotQA ベンチマークで 7 ポイント向上した。
論文 参考訳(メタデータ) (2024-12-14T05:06:43Z) - List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - Constructing interval variables via faceted Rasch measurement and
multitask deep learning: a hate speech application [63.10266319378212]
本稿では,教師付き深層学習と多面的ラッシュアイテム応答理論(IRT)構築手法を組み合わせることで,連続区間スペクトル上の複素変数を測定する手法を提案する。
われわれは、YouTube、Twitter、Redditから5万件のソーシャルメディアコメントを収集し、1万1000人の米国拠点のAmazon Mechanical Turkの労働者によってラベル付けされたデータセット上で、この新しい手法を実証した。
論文 参考訳(メタデータ) (2020-09-22T02:15:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。