論文の概要: Eliminating Search Intent Bias in Learning to Rank
- arxiv url: http://arxiv.org/abs/2002.03203v2
- Date: Tue, 11 Feb 2020 23:11:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 22:37:58.650127
- Title: Eliminating Search Intent Bias in Learning to Rank
- Title(参考訳): ランク付け学習における検索インテントバイアスの除去
- Authors: Yingcheng Sun and Richard Kolacinski and Kenneth Loparo
- Abstract要約: ユーザ検索意図の違いがクリック行動にどのように影響するかを調べた結果,ユーザ検索意図と文書関連性との間にはバイアスがあることが判明した。
本稿では,既存のほとんどのクリックモデルに適用可能な探索意図バイアス仮説を提案する。
- 参考スコア(独自算出の注目度): 0.32228025627337864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Click-through data has proven to be a valuable resource for improving
search-ranking quality. Search engines can easily collect click data, but
biases introduced in the data can make it difficult to use the data
effectively. In order to measure the effects of biases, many click models have
been proposed in the literature. However, none of the models can explain the
observation that users with different search intent (e.g., informational,
navigational, etc.) have different click behaviors. In this paper, we study how
differences in user search intent can influence click activities and determined
that there exists a bias between user search intent and the relevance of the
document relevance. Based on this observation, we propose a search intent bias
hypothesis that can be applied to most existing click models to improve their
ability to learn unbiased relevance. Experimental results demonstrate that
after adopting the search intent hypothesis, click models can better interpret
user clicks and substantially improve retrieval performance.
- Abstract(参考訳): クリックスルーデータは、検索品質を向上させるための貴重なリソースであることが証明されている。
検索エンジンは簡単にクリックデータを収集できるが、データに現れるバイアスはデータの有効利用を困難にする。
バイアスの影響を測定するために,多くのクリックモデルが文献に提案されている。
しかし、どのモデルも異なる検索意図を持つユーザ(例えば、情報、ナビゲーションなど)が異なるクリック動作を持つという観察を説明できない。
本稿では,ユーザ検索意図の違いがクリック行動にどのように影響するかを調査し,ユーザ検索意図と文書との関連性の間にバイアスが存在することを確かめる。
そこで本研究では,既存のクリックモデルの多くに適用可能な検索意図バイアス仮説を提案する。
実験の結果,検索意図仮説を採用すると,クリックモデルがユーザのクリックをよりよく解釈し,検索性能が大幅に向上することが示された。
関連論文リスト
- Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Spuriosity Rankings: Sorting Data to Measure and Mitigate Biases [62.54519787811138]
本稿では,突発的手がかりに依存したモデルバイアスを簡易かつ効果的に測定・緩和する手法を提案する。
我々は,解釈可能なネットワークの深部神経的特徴をベースとして,それらのクラス内の画像のランク付けを行う。
以上の結果から,素早い特徴依存によるモデルバイアスは,モデルがどのようにトレーニングされたかよりも,モデルがトレーニングされていることの影響がはるかに大きいことが示唆された。
論文 参考訳(メタデータ) (2022-12-05T23:15:43Z) - Whole Page Unbiased Learning to Rank [62.08395647774527]
アンバイアスド・ラーニング・トゥ・ランク(ULTR)アルゴリズムは、バイアスド・クリックデータを用いたアンバイアスド・ランキングモデルを学ぶために提案される。
本稿では,BALというアルゴリズムをランク付けするバイアス非依存学習を提案する。
実世界のデータセットによる実験結果から,BALの有効性が検証された。
論文 参考訳(メタデータ) (2022-10-19T16:53:08Z) - Measurement and applications of position bias in a marketplace search
engine [0.0]
検索エンジンはユーザー行動に意図的に影響を与え、検索結果のリストを選別してランク付けする。
本稿では、ランキングの影響を理解するため、Thumbtackでの取り組みについて述べる。
ランキングバイアスがラベルだけでなく,モデル機能にどのように影響するか,という新たな議論も含んでいます。
論文 参考訳(メタデータ) (2022-06-23T14:09:58Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - Scalar is Not Enough: Vectorization-based Unbiased Learning to Rank [29.934700345584726]
ランク付けのバイアスのない学習は、バイアスのあるユーザのクリックログからバイアスのないランク付けモデルをトレーニングすることを目的としている。
現在のULTR法のほとんどは、クリック確率を2つのスカラー関数に分解できると仮定する試験仮説(EH)に基づいている。
ベクトルベースのEHを提案し、クリック確率を2つのベクトル関数のドット積として定式化する。
論文 参考訳(メタデータ) (2022-06-03T17:23:25Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z) - Query Abandonment Prediction with Recurrent Neural Models of Mouse
Cursor Movements [10.088906689243768]
マウスのカーソル運動は,良し悪しの放棄を識別する価値のある,低コストな行動信号となる。
検索結果は、クリックせずにクエリに対するユーザの満足度を判断し、最終的に検索エンジンのパフォーマンスをよりよく理解するのに役立ちます。
論文 参考訳(メタデータ) (2021-01-22T11:57:04Z) - Handling Position Bias for Unbiased Learning to Rank in Hotels Search [0.951828574518325]
本稿では,Tripadvisor Hotelsサーチにおけるオンラインテスト環境における位置バイアスを適切に扱うことの重要性について検討する。
本稿では,ユーザの行動データを完全に活用する位置バイアスを経験的に効果的に処理する方法を提案する。
オンラインA/Bテストの結果,この手法が検索ランキングモデルの改善につながることが示された。
論文 参考訳(メタデータ) (2020-02-28T03:48:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。