論文の概要: DPR: An Algorithm Mitigate Bias Accumulation in Recommendation feedback
loops
- arxiv url: http://arxiv.org/abs/2311.05864v1
- Date: Fri, 10 Nov 2023 04:36:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-13 15:55:20.478288
- Title: DPR: An Algorithm Mitigate Bias Accumulation in Recommendation feedback
loops
- Title(参考訳): dpr:レコメンデーションフィードバックループにおけるバイアスの蓄積を軽減するアルゴリズム
- Authors: Hangtong Xu and Yuanbo Xu and Yongjian Yang and Fuzhen Zhuang and Hui
Xiong
- Abstract要約: フィードバックループと未知の露出メカニズムが推奨品質とユーザエクスペリエンスに与える影響について検討した。
本研究では,動的再重み付けを用いてクロスエフェクトを緩和する非バイアスアルゴリズムである動的パーソナライズランキング(textbfDPR)を提案する。
提案手法は,フィードバックループと未知の露出機構の負の効果を緩和するものである。
- 参考スコア(独自算出の注目度): 41.21024436158042
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommendation models trained on the user feedback collected from deployed
recommendation systems are commonly biased. User feedback is considerably
affected by the exposure mechanism, as users only provide feedback on the items
exposed to them and passively ignore the unexposed items, thus producing
numerous false negative samples. Inevitably, biases caused by such user
feedback are inherited by new models and amplified via feedback loops.
Moreover, the presence of false negative samples makes negative sampling
difficult and introduces spurious information in the user preference modeling
process of the model. Recent work has investigated the negative impact of
feedback loops and unknown exposure mechanisms on recommendation quality and
user experience, essentially treating them as independent factors and ignoring
their cross-effects. To address these issues, we deeply analyze the data
exposure mechanism from the perspective of data iteration and feedback loops
with the Missing Not At Random (\textbf{MNAR}) assumption, theoretically
demonstrating the existence of an available stabilization factor in the
transformation of the exposure mechanism under the feedback loops. We further
propose Dynamic Personalized Ranking (\textbf{DPR}), an unbiased algorithm that
uses dynamic re-weighting to mitigate the cross-effects of exposure mechanisms
and feedback loops without additional information. Furthermore, we design a
plugin named Universal Anti-False Negative (\textbf{UFN}) to mitigate the
negative impact of the false negative problem. We demonstrate theoretically
that our approach mitigates the negative effects of feedback loops and unknown
exposure mechanisms. Experimental results on real-world datasets demonstrate
that models using DPR can better handle bias accumulation and the universality
of UFN in mainstream loss methods.
- Abstract(参考訳): デプロイされたレコメンデーションシステムから収集されたユーザフィードバックに基づいてトレーニングされたレコメンデーションモデルは、一般的にバイアスを受けます。
ユーザからのフィードバックは、露出したアイテムに対してのみフィードバックを提供し、未公開アイテムを受動的に無視することで、多数の偽陰性サンプルを生成するため、露出メカニズムに大きく影響を受ける。
必然的に、そのようなユーザフィードバックによるバイアスは、新しいモデルによって継承され、フィードバックループを介して増幅される。
さらに,偽陰性サンプルの存在は負サンプリングを困難にし,モデルのユーザ嗜好モデリングプロセスにスプリアス情報を導入する。
最近の研究は、フィードバックループと未知の露出メカニズムが推奨品質とユーザエクスペリエンスに負の影響を調査し、基本的にそれらを独立した要因として扱い、相互効果を無視している。
これらの問題に対処するために,データ反復とフィードバックループの観点からデータ露光機構を深く分析し,フィードバックループ下での露光機構の変換における利用可能な安定化因子の存在を理論的に証明した。
さらに、動的再重み付けを用いて、追加情報なしで露出機構とフィードバックループの相互効果を緩和する非バイアスアルゴリズムである動的パーソナライズランキング(\textbf{DPR})を提案する。
さらに、偽陰性問題の負の影響を軽減するために、Universal Anti-False Negative (\textbf{UFN}) というプラグインを設計する。
提案手法は,フィードバックループと未知の露出機構の負の効果を緩和するものである。
実世界のデータセットによる実験結果から、DPRを用いたモデルでは、主流損失法におけるバイアス蓄積とUFNの普遍性をよりうまく扱えることが示された。
関連論文リスト
- Negative Sampling in Recommendation: A Survey and Future Directions [43.11318243903388]
ネガティブサンプリングは、ユーザの行動に固有の真のネガティブな側面を明らかにすることに熟練している。
我々は、既存のネガティブサンプリング戦略に関する広範な文献レビューを行い、推奨する。
多様なレコメンデーションシナリオにおいて、最適化されたネガティブサンプリング戦略の洞察について詳述する。
論文 参考訳(メタデータ) (2024-09-11T12:48:52Z) - Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation [67.88747330066049]
きめ細かいフィードバックは、画像の品質と迅速な調整におけるニュアンスドの区別を捉えます。
粗いフィードバックに対する優位性を示すことは、自動ではないことを示す。
きめ細かいフィードバックを抽出し活用する上で重要な課題を特定します。
論文 参考訳(メタデータ) (2024-06-24T17:19:34Z) - Source Echo Chamber: Exploring the Escalation of Source Bias in User, Data, and Recommender System Feedback Loop [65.23044868332693]
本稿では,ソースバイアスがレコメンデーションシステムの領域に与える影響について検討する。
ソースバイアスの頻度を示し、ソースバイアスを増幅した潜在的デジタルエコーチャンバーを明らかにする。
我々は,HGCとAIGCの両方に対してモデル不均一性を維持するブラックボックスデバイアス法を導入する。
論文 参考訳(メタデータ) (2024-05-28T09:34:50Z) - BHEISR: Nudging from Bias to Balance -- Promoting Belief Harmony by
Eliminating Ideological Segregation in Knowledge-based Recommendations [5.795636579831129]
主な目的は,フィルタバブルによる有害な影響を最小限に抑えつつ,ユーザの信念バランスを打つことである。
BHEISRモデルは、民主的かつ透明な原則を支持しながら、ナッジ理論から原則を取り入れている。
論文 参考訳(メタデータ) (2023-07-06T06:12:37Z) - Generating Negative Samples for Sequential Recommendation [83.60655196391855]
逐次レコメンデーション(SR)のための負のサンプル(イテム)を生成することを提案する。
アイテムに対する現在のSRモデルの学習されたユーザの好みに基づいて、各タイムステップで負の項目をサンプリングする。
4つの公開データセットの実験は、SRに高品質な負のサンプルを提供することの重要性を検証する。
論文 参考訳(メタデータ) (2022-08-07T05:44:13Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - Asymptotically Unbiased Estimation for Delayed Feedback Modeling via
Label Correction [14.462884375151045]
遅延したフィードバックは、オンライン広告の変換率予測に不可欠である。
これまでの遅延したフィードバックモデリング手法は、正確なラベルを待ち、新鮮なフィードバックを消費する間のトレードオフのバランスをとる。
提案手法は, 即効性, 偽陰性, 実陰性, 遅延正サンプルの重み付けをそれぞれ補正することを目的として, 非バイアス推定を用いた遅延フィードバックモデリング(DEFUSE)を提案する。
論文 参考訳(メタデータ) (2022-02-14T03:31:09Z) - Existence conditions for hidden feedback loops in online recommender
systems [0.0]
ユーザの関心事における不確実性とノイズがフィードバックループの存在にどのように影響するかを検討する。
ユーザ興味をリセットする非ゼロ確率は、フィードバックループを制限し、効果の大きさを推定するのに十分である。
論文 参考訳(メタデータ) (2021-09-11T13:30:08Z) - Probabilistic and Variational Recommendation Denoising [56.879165033014026]
暗黙のフィードバックから学ぶことは、推奨システムの適用において最も一般的なケースの1つである。
本稿では,暗黙のフィードバックに対する確率的・変動的推薦を提案する。
提案したDPIとDVAEを4つの最先端レコメンデーションモデルに適用し、3つのデータセットで実験を行う。
論文 参考訳(メタデータ) (2021-05-20T08:59:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。