Fugu-MT 論文翻訳(概要): BLOB : A Probabilistic Model for Recommendation that Combines Organic and Bandit Signals

論文の概要: BLOB : A Probabilistic Model for Recommendation that Combines Organic and Bandit Signals

arxiv url: http://arxiv.org/abs/2008.12504v1
Date: Fri, 28 Aug 2020 06:57:10 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-24 01:30:17.622015
Title: BLOB : A Probabilistic Model for Recommendation that Combines Organic and Bandit Signals
Title（参考訳）: BLOB : 有機信号と帯域信号を組み合わせた勧告の確率モデル
Authors: Otmane Sakhi, Stephen Bonner, David Rohde, Flavian Vasile
Abstract要約: 提案手法は,推薦品質の評価を改善するために,「オルガニック」信号と「バンディット」信号を組み合わせた確率論的手法を提案する。提案手法は,両手法が最先端の有機的推薦アルゴリズムの価値を上回るか,あるいは一致しているかを,広範囲にわたるシミュレーション研究を用いて検討する。
参考スコア（独自算出の注目度）: 12.83118601099289
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A common task for recommender systems is to build a pro le of the interests of a user from items in their browsing history and later to recommend items to the user from the same catalog. The users' behavior consists of two parts: the sequence of items that they viewed without intervention (the organic part) and the sequences of items recommended to them and their outcome (the bandit part). In this paper, we propose Bayesian Latent Organic Bandit model (BLOB), a probabilistic approach to combine the 'or-ganic' and 'bandit' signals in order to improve the estimation of recommendation quality. The bandit signal is valuable as it gives direct feedback of recommendation performance, but the signal quality is very uneven, as it is highly concentrated on the recommendations deemed optimal by the past version of the recom-mender system. In contrast, the organic signal is typically strong and covers most items, but is not always relevant to the recommendation task. In order to leverage the organic signal to e ciently learn the bandit signal in a Bayesian model we identify three fundamental types of distances, namely action-history, action-action and history-history distances. We implement a scalable approximation of the full model using variational auto-encoders and the local re-paramerization trick. We show using extensive simulation studies that our method out-performs or matches the value of both state-of-the-art organic-based recommendation algorithms, and of bandit-based methods (both value and policy-based) both in organic and bandit-rich environments.
Abstract（参考訳）: 推薦システムのための一般的なタスクは、閲覧履歴の項目からユーザの関心事のプロレを作り、その後、同じカタログからユーザに推奨することである。ユーザの行動は、介入なしに見た項目のシーケンス(有機的部分)と、推奨した項目のシーケンス(包括的部分)と結果(包括的部分)の2つの部分から構成される。本稿では,推奨品質の評価を改善するために,<or-ganic>信号と<bandit>信号を組み合わせた確率論的手法であるBayesian Latent Organic Bandit Model (BLOB)を提案する。バンディット信号はレコメンデーション性能の直接のフィードバックを与えるので価値があるが、過去のrecom-menderシステムで最適と考えられるレコメンデーションに非常に集中しており、信号品質は非常に不均一である。対照的に、有機信号は通常強く、ほとんどの項目をカバーするが、推奨タスクには必ずしも関係がない。有機信号を利用してベイズモデルでバンディット信号を選択的に学習するために、アクション・ヒストリー、アクション・アクション、ヒストリー・ヒストリーの3つの基本的な距離を同定する。我々は,変分オートエンコーダと局所再並列化トリックを用いて,フルモデルのスケーラブルな近似を実装した。提案手法は, 最先端の有機的推薦アルゴリズムと, 有機的およびバンディットに富む環境において, バンディットに基づく手法(価値とポリシーの両方)の両手法の両立あるいは適合性を示す。

関連論文リスト

AgentRecBench: Benchmarking LLM Agent-based Personalized Recommender Systems [17.329692234349768]
エージェントレコメンデータシステムはLarge Language Models (LLM)を利用している LLMの高度な推論とロールプレイング能力は、自律的で適応的な意思決定を可能にする。この分野では、これらの手法を評価するための標準化された評価プロトコルが欠けている。
論文参考訳（メタデータ） (2025-05-26T07:45:11Z)
CoCoB: Adaptive Collaborative Combinatorial Bandits for Online Recommendation [3.789330380841338]
本稿では,CoCoBの適応的組合せ帯域幅アルゴリズムを提案する。 CoCoBは革新的な二面バンディットアーキテクチャを採用し、ユーザーとアイテムの両方にバンディットの原則を適用している。 3つの実世界のデータセットの実験では、CoCoBの有効性が示され、最先端の手法よりも平均2.4%のF1スコアが向上した。
論文参考訳（メタデータ） (2025-05-05T05:41:16Z)
The Nah Bandit: Modeling User Non-compliance in Recommendation Systems [2.421459418045937]
Expert with Clustering(EWC)は、推奨オプションと推奨されないオプションの両方からのフィードバックを取り入れた階層的なアプローチで、ユーザの好み学習を加速する。 EWCは教師付き学習と伝統的な文脈的バンディットアプローチの両方を上回ります。この研究は、より効果的なレコメンデーションシステムのための堅牢なフレームワークを提供する、Nah Banditにおける将来の研究の基礎を築いた。
論文参考訳（メタデータ） (2024-08-15T03:01:02Z)
Managing multi-facet bias in collaborative filtering recommender systems [0.0]
アイテムグループ間のバイアスドレコメンデーションは、システムに対するユーザの不満を引き起こすとともに、アイテムプロバイダの利益を脅かす可能性がある。本研究の目的は,最先端の協調フィルタリング推薦アルゴリズムの出力における地理的起源と人気に関する新たなタイプの交叉バイアスを管理することである。 2つの実世界の映画と書籍のデータセットに関する大規模な実験は、アイテムの生産大陸に富んだものであり、提案アルゴリズムが精度と上記のバイアスの両タイプの間に合理的なバランスをとっていることを示している。
論文参考訳（メタデータ） (2023-02-21T10:06:01Z)
Incentive-Aware Recommender Systems in Two-Sided Markets [49.692453629365204]
最適性能を達成しつつエージェントのインセンティブと整合する新しいレコメンデータシステムを提案する。我々のフレームワークは、このインセンティブを意識したシステムを、両側市場におけるマルチエージェントバンディット問題としてモデル化する。どちらのアルゴリズムも、エージェントが過剰な露出から保護する、ポストフェアネス基準を満たす。
論文参考訳（メタデータ） (2022-11-23T22:20:12Z)
Defending Substitution-Based Profile Pollution Attacks on Sequential Recommenders [8.828396559882954]
本稿では,ある脆弱な要素を選択し,それを逆数要素に置換することで,入力シーケンスを修飾する置換型逆数攻撃アルゴリズムを提案する。また、ディリクレ近傍サンプリングと呼ばれる効率的な対角防御手法を設計する。特に,選択した項目を1ホットエンコーディングで表現し,エンコーディングの勾配上昇を行い,トレーニング中の項目埋め込みの最悪の場合の線形結合を探索する。
論文参考訳（メタデータ） (2022-07-19T00:19:13Z)
Breaking Feedback Loops in Recommender Systems with Causal Inference [99.22185950608838]
近年の研究では、フィードバックループが推奨品質を損なう可能性があり、ユーザの振る舞いを均質化している。本稿では、因果推論を用いてフィードバックループを確実に破壊するアルゴリズムCAFLを提案する。従来の補正手法と比較して,CAFLは推奨品質を向上することを示す。
論文参考訳（メタデータ） (2022-07-04T17:58:39Z)
Recommendation Systems with Distribution-Free Reliability Guarantees [83.80644194980042]
我々は、主に良いアイテムを含むことを厳格に保証されたアイテムのセットを返す方法を示す。本手法は, 擬似発見率の厳密な有限サンプル制御によるランキングモデルを提供する。我々はYahoo!のランキングとMSMarcoデータセットの学習方法を評価する。
論文参考訳（メタデータ） (2022-07-04T17:49:25Z)
Recommending with Recommendations [1.1602089225841632]
レコメンデーションシステムは、しばしば予測を行う際に敏感なユーザー情報を引き出す。既存のサービスからのレコメンデーションに基づいて、サービスのレコメンデーションエンジンを基盤にすることで、この障害に対処する方法を示します。我々の設定では、ユーザの(潜在的に敏感な)情報は高次元の潜在空間に属します。
論文参考訳（メタデータ） (2021-12-02T04:30:15Z)
PipAttack: Poisoning Federated Recommender Systems forManipulating Item Promotion [58.870444954499014]
一般的な実践は、分散化された連邦学習パラダイムの下でレコメンデーターシステムをサブスクライブすることである。本稿では,対象項目の促進のために,フェデレートされたレコメンデータシステムをバックドア化するための体系的アプローチを提案する。
論文参考訳（メタデータ） (2021-10-21T06:48:35Z)
Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文参考訳（メタデータ） (2020-06-10T11:18:57Z)
Sequential Recommendation with Self-Attentive Multi-Adversarial Network [101.25533520688654]
逐次レコメンデーションにおける文脈情報の影響を明示的にモデル化するためのMFGAN(Multi-Factor Generative Adversarial Network)を提案する。当社のフレームワークは,複数種類の因子情報を組み込むことが柔軟であり,各因子が推奨決定にどのように貢献するかを時間とともに追跡することができる。
論文参考訳（メタデータ） (2020-05-21T12:28:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。