論文の概要: Scalar is Not Enough: Vectorization-based Unbiased Learning to Rank
- arxiv url: http://arxiv.org/abs/2206.01702v1
- Date: Fri, 3 Jun 2022 17:23:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-06 14:07:41.350183
- Title: Scalar is Not Enough: Vectorization-based Unbiased Learning to Rank
- Title(参考訳): Scalarは不十分: ベクタライゼーションに基づくアンバイアスドラーニングのランク付け
- Authors: Mouxiang Chen, Chenghao Liu, Zemin Liu, Jianling Sun
- Abstract要約: ランク付けのバイアスのない学習は、バイアスのあるユーザのクリックログからバイアスのないランク付けモデルをトレーニングすることを目的としている。
現在のULTR法のほとんどは、クリック確率を2つのスカラー関数に分解できると仮定する試験仮説(EH)に基づいている。
ベクトルベースのEHを提案し、クリック確率を2つのベクトル関数のドット積として定式化する。
- 参考スコア(独自算出の注目度): 29.934700345584726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unbiased learning to rank (ULTR) aims to train an unbiased ranking model from
biased user click logs. Most of the current ULTR methods are based on the
examination hypothesis (EH), which assumes that the click probability can be
factorized into two scalar functions, one related to ranking features and the
other related to bias factors. Unfortunately, the interactions among features,
bias factors and clicks are complicated in practice, and usually cannot be
factorized in this independent way. Fitting click data with EH could lead to
model misspecification and bring the approximation error.
In this paper, we propose a vector-based EH and formulate the click
probability as a dot product of two vector functions. This solution is complete
due to its universality in fitting arbitrary click functions. Based on it, we
propose a novel model named Vectorization to adaptively learn the relevance
embeddings and sort documents by projecting embeddings onto a base vector.
Extensive experiments show that our method significantly outperforms the
state-of-the-art ULTR methods on complex real clicks as well as simple
simulated clicks.
- Abstract(参考訳): Unbiased Learning to rank (ULTR)は、バイアスのあるユーザクリックログからバイアスのないランキングモデルをトレーニングすることを目的としている。
現在のULTR法の多くは、クリック確率を2つのスカラー関数に分解できると仮定する試験仮説(EH)に基づいている。
残念ながら、機能、バイアス要因、クリック間の相互作用は実際には複雑であり、通常はこの独立した方法では分解できない。
クリックデータをehに適合させることで、モデルの誤特定と近似誤差をもたらす可能性がある。
本稿では,ベクトルベースのEHを提案し,クリック確率を2つのベクトル関数のドット積として定式化する。
この解は任意のクリック関数に適合する普遍性のため完備である。
そこで本研究では,ベースベクトルへの埋め込みを投影することで文書の埋め込みとソートを適応的に学習するベクトル化という新しいモデルを提案する。
大規模な実験により,本手法は複雑な実クリックや単純なシミュレートされたクリックにおいて,最先端のULTR法よりも優れていた。
関連論文リスト
- Contextual Dual Learning Algorithm with Listwise Distillation for Unbiased Learning to Rank [26.69630281310365]
Unbiased Learning to Rank (ULTR)は、バイアスのないユーザのフィードバック(例えばクリック)を活用して、バイアスのないランキングモデルを最適化することを目的としている。
位置バイアスと文脈バイアスの両方に対処するため,CDLA-LD(Contextual Dual Learning Algorithm)を提案する。
論文 参考訳(メタデータ) (2024-08-19T09:13:52Z) - Investigating the Robustness of Counterfactual Learning to Rank Models: A Reproducibility Study [61.64685376882383]
ランク付け学習(CLTR: Counterfactual Learning to rank)は、IRコミュニティにおいて、ログ化された大量のユーザインタラクションデータを活用してランキングモデルをトレーニングする能力において、大きな注目を集めている。
本稿では,複雑かつ多様な状況における既存のCLTRモデルのロバスト性について検討する。
その結果, DLAモデルとIPS-DCMは, PS-PBMやPSSよりも, オフラインの確率推定による堅牢性が高いことがわかった。
論文 参考訳(メタデータ) (2024-04-04T10:54:38Z) - Unified Off-Policy Learning to Rank: a Reinforcement Learning
Perspective [61.4025671743675]
メソッドをランク付けするオフポリシー学習は、ユーザがクリックデータを生成する方法に関して、強い仮定をすることが多い。
オフライン強化学習は,複雑なデバイアス手法や事前知識を使わずに,様々なクリックモデルに適応できることを示す。
様々な大規模データセットの結果から、CUOLRはアルゴリズムのランク付けに最先端のオフポリシー学習を一貫して上回っていることが示される。
論文 参考訳(メタデータ) (2023-06-13T03:46:22Z) - FE-TCM: Filter-Enhanced Transformer Click Model for Web Search [10.91456636784484]
特徴抽出のバックボーンネットワークとしてTransformerを使用し、フィルタ層を革新的に追加し、Web検索のための新しいフィルタ拡張トランスフォーマークリックモデル(FE-TCM)を提案する。
FE-TCMは、クリック予測のために既存のクリックモデルより優れている。
論文 参考訳(メタデータ) (2023-01-19T02:51:47Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - Low-variance estimation in the Plackett-Luce model via quasi-Monte Carlo
sampling [58.14878401145309]
PLモデルにおいて,より標本効率の高い予測値を生成するための新しい手法を開発した。
Amazon MusicのリアルなレコメンデーションデータとYahooの学習からランクへの挑戦を理論的にも実証的にも使用しています。
論文 参考訳(メタデータ) (2022-05-12T11:15:47Z) - Active Learning++: Incorporating Annotator's Rationale using Local Model
Explanation [84.10721065676913]
アノテーションは、与えられたクエリの重要性に基づいて入力特徴をランク付けすることで、ラベルを選択するための根拠を提供することができる。
すべての委員会モデルを等しく重み付けして次の事例を選択する代わりに、アノテータのランクにより高い一致で委員会モデルにより高い重みを割り当てます。
このアプローチは、LIMEのような局所的な説明を生成するためにモデルに依存しない手法を用いて、任意の種類のMLモデルに適用できる。
論文 参考訳(メタデータ) (2020-09-06T08:07:33Z) - Analysis of Multivariate Scoring Functions for Automatic Unbiased
Learning to Rank [14.827143632277274]
ユーザのバイアスモデル(すなわち、確率モデル)とアンバイアスなランク付けを共同で学習するAutoULTRアルゴリズムは、性能が優れ、実際のデプロイコストが低いため、多くの注目を集めている。
近年の文脈認識型学習 to ランクモデルの進歩により,複数の文書をまとめて読み上げ,それらのランキングスコアを予測する多変量スコア関数が,人間関連ラベルを用いたランキングタスクにおいて,一変量ランキング関数よりも強力であることが示されている。
2つの大規模ベンチマークデータセットの合成クリック実験により、置換不変な多変量スコアリング機能を持つAutoULTRモデルの性能が著しく向上したことが示された。
論文 参考訳(メタデータ) (2020-08-20T16:31:59Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。