論文の概要: A Causal Information-Flow Framework for Unbiased Learning-to-Rank
- arxiv url: http://arxiv.org/abs/2601.05590v1
- Date: Fri, 09 Jan 2026 07:19:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.891217
- Title: A Causal Information-Flow Framework for Unbiased Learning-to-Rank
- Title(参考訳): 非偏在学習のための因果的情報フローフレームワーク
- Authors: Haoming Gong, Qingyao Ai, Zhihao Tao, Yongfeng Zhang,
- Abstract要約: Web検索とレコメンデーションシステムでは、ユーザクリックがランキングモデルのトレーニングに広く使用されている。
本稿では,Unbiased Learning-to-Rankを拡張する因果学習に基づく新たなランキングフレームワークを提案する。
本手法は測定されたバイアスリークを一貫して低減し,ランキング性能を向上させる。
- 参考スコア(独自算出の注目度): 52.54102347581931
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In web search and recommendation systems, user clicks are widely used to train ranking models. However, click data is heavily biased, i.e., users tend to click higher-ranked items (position bias), choose only what was shown to them (selection bias), and trust top results more (trust bias). Without explicitly modeling these biases, the true relevance of ranked items cannot be correctly learned from clicks. Existing Unbiased Learning-to-Rank (ULTR) methods mainly correct position bias and rely on propensity estimation, but they cannot measure remaining bias, provide risk guarantees, or jointly handle multiple bias sources. To overcome these challenges, this paper introduces a novel causal learning-based ranking framework that extends ULTR by combining Structural Causal Models (SCMs) with information-theoretic tools. SCMs specify how clicks are generated and help identify the true relevance signal from click data, while conditional mutual information, measures how much bias leaks into the learned relevance estimates. We use this leakage measure to define a rigorous notion of disentanglement and include it as a regularizer during model training to reduce bias. In addition, we incorporate a causal inference estimator, i.e., doubly robust estimator, to ensure more reliable risk estimation. Experiments on standard Learning-to-Rank benchmarks show that our method consistently reduces measured bias leakage and improves ranking performance, especially in realistic scenarios where multiple biases-such as position and trust bias-interact strongly.
- Abstract(参考訳): Web検索とレコメンデーションシステムでは、ユーザクリックがランキングモデルのトレーニングに広く使用されている。
しかし、クリックデータは大きなバイアス、すなわち、より高いランクの項目をクリックし(配置バイアス)、表示された項目だけを選択し(選択バイアス)、信頼のトップ結果をより多く(信頼バイアス)する傾向がある。
これらのバイアスを明示的にモデル化しない限り、ランク付けされた項目の真の関連性はクリックから正しく学習することはできない。
既存のUnbiased Learning-to-Rank(ULTR)手法は、主に位置バイアスを補正し、確率推定に依存するが、残ったバイアスを測定したり、リスク保証を提供したり、複数のバイアス源を共同で扱うことはできない。
これらの課題を克服するために,構造因果モデル(SCM)と情報理論ツールを組み合わせてULTRを拡張した,因果学習に基づく新たなランキングフレームワークを提案する。
SCMは、クリックがどのように生成され、クリックデータから真の関連信号を特定するのに役立つ。
この漏えい対策は、乱れという厳密な概念を定義し、モデルトレーニング中に正則化子として含め、バイアスを減らすために使用します。
さらに、より信頼性の高いリスク推定を行うために、因果推定推定器、すなわち二重頑健推定器を組み込んだ。
標準的なLearning-to-Rankベンチマークの実験では,評価されたバイアスのリークを一貫して低減し,ランキング性能を向上させることが示されている。
関連論文リスト
- LLMs for estimating positional bias in logged interaction data [44.839172857330674]
大規模言語モデル(LLM)を用いた位置バイアス推定手法を提案する。
実験の結果, LLM-as-a-judge法で推定した確率は, スコアバケット間で安定であることがわかった。
IPSでトレーニングされたリランカーは、標準のNDCG@10で生産モデルと一致し、重み付けされたNDCG@10を約2%改善した。
論文 参考訳(メタデータ) (2025-09-03T20:26:06Z) - Addressing Personalized Bias for Unbiased Learning to Rank [56.663619153713434]
Unbiased Learning to rank (ULTR)は、バイアスのあるユーザの行動ログからバイアスのないランキングモデルを学ぶことを目的としている。
そこで本研究では,学習からランクへの目標値を求めるために,新しいユーザ認識逆確率スコア推定器を提案する。
論文 参考訳(メタデータ) (2025-08-28T14:01:31Z) - Correcting for Position Bias in Learning to Rank: A Control Function Approach [9.986244291715762]
本稿では,2段階プロセスにおける位置バイアスを考慮した制御関数に基づく新しい手法を提案する。
従来の位置偏差補正法とは異なり、この手法はクリックや確率モデルに関する知識を必要としない。
提案手法は位置バイアスの補正における最先端手法よりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2025-06-08T04:10:14Z) - An Offline Metric for the Debiasedness of Click Models [52.25681483524383]
クリックモデルは、ユーザークリックから情報を抽出する一般的な方法である。
最近の研究は、コミュニティにおける現在の評価プラクティスが、良いパフォーマンスのクリックモデルが下流のタスクにうまく一般化することを保証できないことを示している。
クリックモデリングにおける偏りの概念を導入し,その測定基準を導出する。
論文 参考訳(メタデータ) (2023-04-19T10:59:34Z) - Whole Page Unbiased Learning to Rank [59.52040055543542]
アンバイアスド・ラーニング・トゥ・ランク(ULTR)アルゴリズムは、バイアスド・クリックデータを用いたアンバイアスド・ランキングモデルを学ぶために提案される。
本稿では,BALというアルゴリズムをランク付けするバイアス非依存学習を提案する。
実世界のデータセットによる実験結果から,BALの有効性が検証された。
論文 参考訳(メタデータ) (2022-10-19T16:53:08Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - AutoDebias: Learning to Debias for Recommendation [43.84313723394282]
今回提案するtextitAotoDebiasは、他の(小さな)均一なデータセットを利用してデバイアスパラメータを最適化する。
我々は、AutoDebiasの一般化を導き、適切なデバイアス戦略を得る能力を証明する。
論文 参考訳(メタデータ) (2021-05-10T08:03:48Z) - Handling Position Bias for Unbiased Learning to Rank in Hotels Search [0.951828574518325]
本稿では,Tripadvisor Hotelsサーチにおけるオンラインテスト環境における位置バイアスを適切に扱うことの重要性について検討する。
本稿では,ユーザの行動データを完全に活用する位置バイアスを経験的に効果的に処理する方法を提案する。
オンラインA/Bテストの結果,この手法が検索ランキングモデルの改善につながることが示された。
論文 参考訳(メタデータ) (2020-02-28T03:48:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。