論文の概要: Towards Principled Learning for Re-ranking in Recommender Systems
- arxiv url: http://arxiv.org/abs/2504.04188v1
- Date: Sat, 05 Apr 2025 14:14:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:12:57.304916
- Title: Towards Principled Learning for Re-ranking in Recommender Systems
- Title(参考訳): Recommender システムにおける再ランク付けのための原則学習に向けて
- Authors: Qunwei Li, Linghui Li, Jianbin Lin, Wenliang Zhong,
- Abstract要約: 収束一貫性と逆整合性を含む2つの原理が提案されている。
これらの2つの原則は、ジェネリックリランカの学習に適用され、パフォーマンスが向上する。
- 参考スコア(独自算出の注目度): 10.881339468480467
- License:
- Abstract: As the final stage of recommender systems, re-ranking presents ordered item lists to users that best match their interests. It plays such a critical role and has become a trending research topic with much attention from both academia and industry. Recent advances of re-ranking are focused on attentive listwise modeling of interactions and mutual influences among items to be re-ranked. However, principles to guide the learning process of a re-ranker, and to measure the quality of the output of the re-ranker, have been always missing. In this paper, we study such principles to learn a good re-ranker. Two principles are proposed, including convergence consistency and adversarial consistency. These two principles can be applied in the learning of a generic re-ranker and improve its performance. We validate such a finding by various baseline methods over different datasets.
- Abstract(参考訳): 推薦システムの最終段階として、興味に最も合ったユーザーに注文されたアイテムリストを再ランク付けする。
そうした重要な役割を担い、学術と産業の両方から注目され、近年の研究トピックとなっている。
再ランクの最近の進歩は、再ランクされる項目間の相互作用と相互影響の注意深いリストワイドなモデリングに焦点を当てている。
しかし、リランカの学習プロセスの指導や、リランカの出力の質を計測する原則は、常に欠落している。
本稿では,このような原則を考察し,優れた再学習者について考察する。
収束一貫性と逆整合性を含む2つの原理が提案されている。
これらの2つの原則は、ジェネリックリランカの学習に適用され、パフォーマンスが向上する。
異なるデータセットに対して,様々なベースライン手法による検出を検証した。
関連論文リスト
- Revisiting Reciprocal Recommender Systems: Metrics, Formulation, and Method [60.364834418531366]
RRSの性能を包括的かつ正確に評価する5つの新しい評価指標を提案する。
因果的観点からRSを定式化し、二元的介入として勧告を定式化する。
提案手法では,結果の一致を最大化する手法を提案する。
論文 参考訳(メタデータ) (2024-08-19T07:21:02Z) - FIRST: Faster Improved Listwise Reranking with Single Token Decoding [56.727761901751194]
まず、第1生成識別子の出力ロジットを活用して、候補のランク付け順序を直接取得する新しいリストワイズLLMリグレードアプローチであるFIRSTを紹介する。
実験結果から、BEIRベンチマークの利得により、FIRSTはロバストなランキング性能を維持しつつ、推論を50%高速化することが示された。
以上の結果から,LLMリランカーはクロスエンコーダに比べて強い蒸留信号を提供できることが示唆された。
論文 参考訳(メタデータ) (2024-06-21T21:27:50Z) - Full Stage Learning to Rank: A Unified Framework for Multi-Stage Systems [40.199257203898846]
我々は,多段階システム,すなわちGPRP(Generalized Probability Ranking Principle)のための改良されたランキング原理を提案する。
GPRPは、システムパイプラインの各ステージにおける選択バイアスと、ユーザの基本的な関心の両方を強調している。
我々の中核的な考え方は、まず次の段階における選択バイアスを推定し、次に下流モジュールの選択バイアスに最もよく適合するランキングモデルを学ぶことである。
論文 参考訳(メタデータ) (2024-05-08T06:35:04Z) - Adapting Double Q-Learning for Continuous Reinforcement Learning [0.65268245109828]
本稿では,Double Q-Learningと同様のバイアス補正手法を提案する。
提案手法は,少数の MuJoCo 環境において,SOTA 近傍で有望な結果を示す。
論文 参考訳(メタデータ) (2023-09-25T19:09:54Z) - Improving Recommendation Relevance by simulating User Interest [77.34726150561087]
不活発な項目のランクを反復的に減らすことにより、リコメンデーション"レコメンデーション"が、簡単かつ透過的に維持可能であることを観察する。
この研究の背景にある基本的なアイデアは、オンラインレコメンデーションシステムの文脈で特許を取得している。
論文 参考訳(メタデータ) (2023-02-03T03:35:28Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - Learning to Rank For Push Notifications Using Pairwise Expected Regret [8.990318688557]
コンテンツ消費の新しいパラダイムは、ランキング手法に新しい課題をもたらす。
提案手法では,ペアの順序を間違えた場合に生じる期待される後悔によって,候補間のペアの損失を重み付けした新たなランキングの損失を導入する。
提案手法は,シミュレーション環境でも,大規模ソーシャルネットワーク上での生産実験においても,先行手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-19T16:12:25Z) - D2RLIR : an improved and diversified ranking function in interactive
recommendation systems based on deep reinforcement learning [0.3058685580689604]
本稿では,アクタ・クリティカルアーキテクチャを用いた深層強化学習に基づく推薦システムを提案する。
提案モデルでは,ユーザの嗜好に基づいて,多様かつ関連性の高いレコメンデーションリストを生成することができる。
論文 参考訳(メタデータ) (2021-10-28T13:11:29Z) - RocketQAv2: A Joint Training Method for Dense Passage Retrieval and
Passage Re-ranking [89.82301733609279]
本稿では,高密度経路検索と再ランク付けのための新しい共同学習手法を提案する。
主な貢献は、動的リストワイズ蒸留を導入し、レトリバーと再ランカの両方に統一されたリストワイズトレーニングアプローチを設計することである。
ダイナミック蒸留中は、レトリバーとリランカは、互いの関連情報に応じて適応的に改善することができる。
論文 参考訳(メタデータ) (2021-10-14T13:52:55Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。