論文の概要: Document Similarity Enhanced IPS Estimation for Unbiased Learning to Rank
- arxiv url: http://arxiv.org/abs/2507.07909v1
- Date: Thu, 10 Jul 2025 16:41:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-11 16:40:15.496742
- Title: Document Similarity Enhanced IPS Estimation for Unbiased Learning to Rank
- Title(参考訳): アンバイアスドラーニングにおけるIPS推定の文書類似性の向上
- Authors: Zeyan Liang, Graham McDonald, Iadh Ounis,
- Abstract要約: ランク付けモデルを学ぶことは、ユーザークリックのような歴史的なユーザーインタラクションから学ぶ。
ユーザは、ランクの低いドキュメントよりも高いドキュメントをクリックしがちだ。
本稿では,文書の類似性を考慮し,逆プロパプティシティ・スコアリング(IPS)の拡張を提案する。
- 参考スコア(独自算出の注目度): 9.475097876966592
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning to Rank (LTR) models learn from historical user interactions, such as user clicks. However, there is an inherent bias in the clicks of users due to position bias, i.e., users are more likely to click highly-ranked documents than low-ranked documents. To address this bias when training LTR models, many approaches from the literature re-weight the users' click data using Inverse Propensity Scoring (IPS). IPS re-weights the user's clicks proportionately to the position in the historical ranking that a document was placed when it was clicked since low-ranked documents are less likely to be seen by a user. In this paper, we argue that low-ranked documents that are similar to highly-ranked relevant documents are also likely to be relevant. Moreover, accounting for the similarity of low-ranked documents to highly ranked relevant documents when calculating IPS can more effectively mitigate the effects of position bias. Therefore, we propose an extension to IPS, called IPSsim, that takes into consideration the similarity of documents when estimating IPS. We evaluate our IPSsim estimator using two large publicly available LTR datasets under a number of simulated user click settings, and with different numbers of training clicks. Our experiments show that our IPSsim estimator is more effective than the existing IPS estimators for learning an unbiased LTR model, particularly in top-n settings when n >= 30. For example, when n = 50, our IPSsim estimator achieves a statistically significant ~3% improvement (p < 0.05) in terms of NDCG compared to the Doubly Robust estimator from the literature.
- Abstract(参考訳): ラーニング・トゥ・ランク(Learning to Rank、LTR)モデルは、ユーザークリックのような歴史的なユーザーインタラクションから学習する。
しかし、位置バイアスによるユーザクリックには固有のバイアスがあり、低ランクのドキュメントよりも高いランクのドキュメントをクリックしやすい。
LTRモデルのトレーニングにおいて、このバイアスに対処するため、文献からの多くのアプローチが、逆プロペンシティ・スコアリング(IPS)を使用してユーザーのクリックデータを再重み付けした。
IPSは、ユーザーが低ランクの文書を見る可能性が低いため、その文書がクリックされたときに置かれた歴史的ランキングにおける位置に比例して、ユーザのクリックを再重み付けする。
本稿では,高位関連文書と類似した低位文書も関連性が高い可能性が指摘される。
さらに、IPSを計算する際に、低いランクの文書と高いランクの関連文書との類似性を考慮すれば、位置バイアスの効果をより効果的に軽減することができる。
そこで本研究では、IPSを推定する際の文書の類似性を考慮し、IPSsimと呼ばれるIPSの拡張を提案する。
我々は、多数のユーザクリック設定をシミュレートし、異なる数のトレーニングクリックで2つの大きな公開LTRデータセットを用いて、IPSsim推定器の評価を行った。
実験の結果, IPSsim 推定器は既存の IPS 推定器よりも, n >= 30 のとき, 特にトップn 設定で非バイアスの LTR モデルを学ぶのに有効であることがわかった。
例えば、n = 50 のとき、私たちのIPSsim 推定器は NDCG に関して統計学的に有意な ~3% の改善 (p < 0.05) を達成する。
関連論文リスト
- Unbiased Learning to Rank with Query-Level Click Propensity Estimation: Beyond Pointwise Observation and Relevance [74.43264459255121]
現実のシナリオでは、ユーザーは複数の関連するオプションを調べた後、1つまたは2つの結果だけをクリックします。
本稿では,ユーザが異なる検索結果リストをクリックする確率を捉えるために,クエリレベルのクリック確率モデルを提案する。
本手法では,2次元逆重み付け機構を導入し,相対飽和度と位置偏差に対処する。
論文 参考訳(メタデータ) (2025-02-17T03:55:51Z) - Can Large Language Models Understand Preferences in Personalized Recommendation? [32.2250928311146]
PerRecBenchを導入し、ユーザ評価バイアスとアイテムの品質から評価を分解する。
評価予測に長けているLCMベースのレコメンデーション手法では,ユーザの評価バイアスや項目品質を排除した場合,ユーザの好ましくない項目や好ましくない項目を識別できないことがわかった。
その結果、ポイントワイドランキングよりもペアワイズとリストワイズランキングの方が優れていること、PerRecBenchの従来の回帰指標との相関が低いこと、ユーザプロファイルの重要性、事前学習データ分布の役割が明らかになった。
論文 参考訳(メタデータ) (2025-01-23T05:24:18Z) - Off-Policy Evaluation of Ranking Policies under Diverse User Behavior [25.226825574282937]
Inverse Propensity Scoring (IPS) は、大きなアクション空間下での高分散のため、ランキング設定において極めて不正確なものとなる。
この研究は、ユーザの振る舞いが多様であり、ユーザコンテキストによって異なるという、はるかに一般的な定式化を探求する。
結果,Adaptive IPS (AIPS) と呼ばれる推定器は,複雑なユーザ動作下では非バイアス化可能であることを示す。
論文 参考訳(メタデータ) (2023-06-26T22:31:15Z) - Evaluating and Improving Factuality in Multimodal Abstractive
Summarization [91.46015013816083]
そこで我々は,CLIPBERTScoreを提案する。
ゼロショットにおけるこの2つの指標の単純な組み合わせは、文書要約のための既存の事実度指標よりも高い相関性が得られることを示す。
本分析は,CLIPBERTScoreとそのコンポーネントの信頼性と高い相関性を示す。
論文 参考訳(メタデータ) (2022-11-04T16:50:40Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - Doubly-Robust Estimation for Unbiased Learning-to-Rank from
Position-Biased Click Feedback [13.579420996461439]
IPS推定の代わりにランク毎の待遇を期待する新しいDR推定器を提案する。
我々の結果は、最適な性能で収束するためには、桁違いに少ないデータポイントを必要とすることを示唆している。
論文 参考訳(メタデータ) (2022-03-31T15:38:25Z) - Control Variates for Slate Off-Policy Evaluation [112.35528337130118]
多次元動作を伴うバッチ化されたコンテキスト帯域データから政治外評価の問題について検討する。
我々は, PIと自己正規化PIの双方に対して, リスク改善を保証した新しい推定器を得る。
論文 参考訳(メタデータ) (2021-06-15T06:59:53Z) - Accelerated Convergence for Counterfactual Learning to Rank [65.63997193915257]
IPS重み付き勾配を持つSGD手法の収束速度は、IPS重みによる大きなばらつきに悩まされることを示す。
本稿では,従来のIPS重み付け勾配降下法よりも優れた収束性を有する新しい学習アルゴリズムであるCounterSampleを提案する。
我々は、CounterSampleがより早く収束し、理論的な結果と経験的な結果とを補完することを証明する。
論文 参考訳(メタデータ) (2020-05-21T12:53:36Z) - Non-Clicks Mean Irrelevant? Propensity Ratio Scoring As a Correction [40.98264176722163]
Propensity Ratio Scoring (PRS)は、クリックと非クリックの両方の処理を提供する。
実験により,PRSがより効果的なクリックデータの利用を保証し,GMail検索による実世界の大規模データと合成データの両方の性能を向上させることを確認した。
論文 参考訳(メタデータ) (2020-05-18T06:31:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。