論文の概要: BLOB : A Probabilistic Model for Recommendation that Combines Organic
and Bandit Signals
- arxiv url: http://arxiv.org/abs/2008.12504v1
- Date: Fri, 28 Aug 2020 06:57:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 01:30:17.622015
- Title: BLOB : A Probabilistic Model for Recommendation that Combines Organic
and Bandit Signals
- Title(参考訳): BLOB : 有機信号と帯域信号を組み合わせた勧告の確率モデル
- Authors: Otmane Sakhi, Stephen Bonner, David Rohde, Flavian Vasile
- Abstract要約: 提案手法は,推薦品質の評価を改善するために,「オルガニック」信号と「バンディット」信号を組み合わせた確率論的手法を提案する。
提案手法は,両手法が最先端の有機的推薦アルゴリズムの価値を上回るか,あるいは一致しているかを,広範囲にわたるシミュレーション研究を用いて検討する。
- 参考スコア(独自算出の注目度): 12.83118601099289
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A common task for recommender systems is to build a pro le of the interests
of a user from items in their browsing history and later to recommend items to
the user from the same catalog. The users' behavior consists of two parts: the
sequence of items that they viewed without intervention (the organic part) and
the sequences of items recommended to them and their outcome (the bandit part).
In this paper, we propose Bayesian Latent Organic Bandit model (BLOB), a
probabilistic approach to combine the 'or-ganic' and 'bandit' signals in order
to improve the estimation of recommendation quality. The bandit signal is
valuable as it gives direct feedback of recommendation performance, but the
signal quality is very uneven, as it is highly concentrated on the
recommendations deemed optimal by the past version of the recom-mender system.
In contrast, the organic signal is typically strong and covers most items, but
is not always relevant to the recommendation task. In order to leverage the
organic signal to e ciently learn the bandit signal in a Bayesian model we
identify three fundamental types of distances, namely action-history,
action-action and history-history distances. We implement a scalable
approximation of the full model using variational auto-encoders and the local
re-paramerization trick. We show using extensive simulation studies that our
method out-performs or matches the value of both state-of-the-art organic-based
recommendation algorithms, and of bandit-based methods (both value and
policy-based) both in organic and bandit-rich environments.
- Abstract(参考訳): 推薦システムのための一般的なタスクは、閲覧履歴の項目からユーザの関心事のプロレを作り、その後、同じカタログからユーザに推奨することである。
ユーザの行動は、介入なしに見た項目のシーケンス(有機的部分)と、推奨した項目のシーケンス(包括的部分)と結果(包括的部分)の2つの部分から構成される。
本稿では,推奨品質の評価を改善するために,<or-ganic>信号と<bandit>信号を組み合わせた確率論的手法であるBayesian Latent Organic Bandit Model (BLOB)を提案する。
バンディット信号はレコメンデーション性能の直接のフィードバックを与えるので価値があるが、過去のrecom-menderシステムで最適と考えられるレコメンデーションに非常に集中しており、信号品質は非常に不均一である。
対照的に、有機信号は通常強く、ほとんどの項目をカバーするが、推奨タスクには必ずしも関係がない。
有機信号を利用してベイズモデルでバンディット信号を選択的に学習するために、アクション・ヒストリー、アクション・アクション、ヒストリー・ヒストリーの3つの基本的な距離を同定する。
我々は,変分オートエンコーダと局所再並列化トリックを用いて,フルモデルのスケーラブルな近似を実装した。
提案手法は, 最先端の有機的推薦アルゴリズムと, 有機的およびバンディットに富む環境において, バンディットに基づく手法(価値とポリシーの両方)の両手法の両立あるいは適合性を示す。
関連論文リスト
- The Nah Bandit: Modeling User Non-compliance in Recommendation Systems [2.421459418045937]
Expert with Clustering(EWC)は、推奨オプションと推奨されないオプションの両方からのフィードバックを取り入れた階層的なアプローチで、ユーザの好み学習を加速する。
EWCは教師付き学習と伝統的な文脈的バンディットアプローチの両方を上回ります。
この研究は、より効果的なレコメンデーションシステムのための堅牢なフレームワークを提供する、Nah Banditにおける将来の研究の基礎を築いた。
論文 参考訳(メタデータ) (2024-08-15T03:01:02Z) - Managing multi-facet bias in collaborative filtering recommender systems [0.0]
アイテムグループ間のバイアスドレコメンデーションは、システムに対するユーザの不満を引き起こすとともに、アイテムプロバイダの利益を脅かす可能性がある。
本研究の目的は,最先端の協調フィルタリング推薦アルゴリズムの出力における地理的起源と人気に関する新たなタイプの交叉バイアスを管理することである。
2つの実世界の映画と書籍のデータセットに関する大規模な実験は、アイテムの生産大陸に富んだものであり、提案アルゴリズムが精度と上記のバイアスの両タイプの間に合理的なバランスをとっていることを示している。
論文 参考訳(メタデータ) (2023-02-21T10:06:01Z) - Incentive-Aware Recommender Systems in Two-Sided Markets [49.692453629365204]
最適性能を達成しつつエージェントのインセンティブと整合する新しいレコメンデータシステムを提案する。
我々のフレームワークは、このインセンティブを意識したシステムを、両側市場におけるマルチエージェントバンディット問題としてモデル化する。
どちらのアルゴリズムも、エージェントが過剰な露出から保護する、ポストフェアネス基準を満たす。
論文 参考訳(メタデータ) (2022-11-23T22:20:12Z) - Defending Substitution-Based Profile Pollution Attacks on Sequential
Recommenders [8.828396559882954]
本稿では,ある脆弱な要素を選択し,それを逆数要素に置換することで,入力シーケンスを修飾する置換型逆数攻撃アルゴリズムを提案する。
また、ディリクレ近傍サンプリングと呼ばれる効率的な対角防御手法を設計する。
特に,選択した項目を1ホットエンコーディングで表現し,エンコーディングの勾配上昇を行い,トレーニング中の項目埋め込みの最悪の場合の線形結合を探索する。
論文 参考訳(メタデータ) (2022-07-19T00:19:13Z) - Breaking Feedback Loops in Recommender Systems with Causal Inference [99.22185950608838]
近年の研究では、フィードバックループが推奨品質を損なう可能性があり、ユーザの振る舞いを均質化している。
本稿では、因果推論を用いてフィードバックループを確実に破壊するアルゴリズムCAFLを提案する。
従来の補正手法と比較して,CAFLは推奨品質を向上することを示す。
論文 参考訳(メタデータ) (2022-07-04T17:58:39Z) - Recommendation Systems with Distribution-Free Reliability Guarantees [83.80644194980042]
我々は、主に良いアイテムを含むことを厳格に保証されたアイテムのセットを返す方法を示す。
本手法は, 擬似発見率の厳密な有限サンプル制御によるランキングモデルを提供する。
我々はYahoo!のランキングとMSMarcoデータセットの学習方法を評価する。
論文 参考訳(メタデータ) (2022-07-04T17:49:25Z) - Recommending with Recommendations [1.1602089225841632]
レコメンデーションシステムは、しばしば予測を行う際に敏感なユーザー情報を引き出す。
既存のサービスからのレコメンデーションに基づいて、サービスのレコメンデーションエンジンを基盤にすることで、この障害に対処する方法を示します。
我々の設定では、ユーザの(潜在的に敏感な)情報は高次元の潜在空間に属します。
論文 参考訳(メタデータ) (2021-12-02T04:30:15Z) - PipAttack: Poisoning Federated Recommender Systems forManipulating Item
Promotion [58.870444954499014]
一般的な実践は、分散化された連邦学習パラダイムの下でレコメンデーターシステムをサブスクライブすることである。
本稿では,対象項目の促進のために,フェデレートされたレコメンデータシステムをバックドア化するための体系的アプローチを提案する。
論文 参考訳(メタデータ) (2021-10-21T06:48:35Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z) - Sequential Recommendation with Self-Attentive Multi-Adversarial Network [101.25533520688654]
逐次レコメンデーションにおける文脈情報の影響を明示的にモデル化するためのMFGAN(Multi-Factor Generative Adversarial Network)を提案する。
当社のフレームワークは,複数種類の因子情報を組み込むことが柔軟であり,各因子が推奨決定にどのように貢献するかを時間とともに追跡することができる。
論文 参考訳(メタデータ) (2020-05-21T12:28:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。