論文の概要: Fatigue-aware Bandits for Dependent Click Models
- arxiv url: http://arxiv.org/abs/2008.09733v1
- Date: Sat, 22 Aug 2020 02:18:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 07:55:45.185420
- Title: Fatigue-aware Bandits for Dependent Click Models
- Title(参考訳): 依存クリックモデルのための疲労認識帯域
- Authors: Junyu Cao, Wei Sun, Zuo-Jun (Max) Shen, Markus Ettl
- Abstract要約: プラットフォームがユーザの疲労を考慮に入れたコンテンツを推薦するポリシーを学習するオンライン学習環境を考える。
各コンテンツについて、ユーザにとっての魅力は、その本質的な関連性と、類似コンテンツがいくつ表示されたかを測定する割引係数に依存する。
利用者のフィードバックに基づき、プラットフォームはコンテンツ疲労による割引効果だけでなく、基盤となるコンテンツの関連性も学習する。
- 参考スコア(独自算出の注目度): 11.887684896043883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As recommender systems send a massive amount of content to keep users
engaged, users may experience fatigue which is contributed by 1) an
overexposure to irrelevant content, 2) boredom from seeing too many similar
recommendations. To address this problem, we consider an online learning
setting where a platform learns a policy to recommend content that takes user
fatigue into account. We propose an extension of the Dependent Click Model
(DCM) to describe users' behavior. We stipulate that for each piece of content,
its attractiveness to a user depends on its intrinsic relevance and a discount
factor which measures how many similar contents have been shown. Users view the
recommended content sequentially and click on the ones that they find
attractive. Users may leave the platform at any time, and the probability of
exiting is higher when they do not like the content. Based on user's feedback,
the platform learns the relevance of the underlying content as well as the
discounting effect due to content fatigue. We refer to this learning task as
"fatigue-aware DCM Bandit" problem. We consider two learning scenarios
depending on whether the discounting effect is known. For each scenario, we
propose a learning algorithm which simultaneously explores and exploits, and
characterize its regret bound.
- Abstract(参考訳): レコメンダシステムは、ユーザのエンゲージメントを維持するために大量のコンテンツを送信します。
1)無関係な内容に対する過剰な露出
2)類似した推奨が多すぎることはほとんどない。
この問題に対処するために、プラットフォームがユーザの疲労を考慮したコンテンツを推奨するポリシーを学習するオンライン学習環境を検討する。
本稿では,ユーザの行動を記述するために,依存クリックモデル(dcm)の拡張を提案する。
各コンテンツについて、ユーザにとっての魅力は、その本質的な関連性と、類似コンテンツ数を測定する割引要因に依存すると規定する。
ユーザーは推奨コンテンツを順次表示し、魅力的なコンテンツをクリックする。
ユーザーはいつでもプラットフォームを離れることができ、コンテンツが気に入らない場合は離脱する確率が高い。
利用者のフィードバックに基づき、プラットフォームはコンテンツ疲労による割引効果だけでなく、基盤となるコンテンツの関連性も学習する。
本稿では,この学習課題を「Fatigue-aware DCM Bandit」問題と呼ぶ。
割引効果が知られているかどうかに応じて,2つの学習シナリオを考察する。
それぞれのシナリオについて,同時に探索し,悪用し,その後悔を特徴付ける学習アルゴリズムを提案する。
関連論文リスト
- Can Probabilistic Feedback Drive User Impacts in Online Platforms? [26.052963782865294]
コンテンツレコメンデーションシステムのネガティブなユーザへの影響に関する一般的な説明は、プラットフォームの目的とユーザ福祉の相違である。
本研究は,ユーザに対する意図しない影響の潜在的な原因は,プラットフォーム目標の不一致だけではないことを示す。
これらのユーザーへの影響の源泉は、異なるコンテンツが観測可能なユーザー反応(フィードバック情報)を異なるレートで生成する可能性があることである。
論文 参考訳(メタデータ) (2024-01-10T18:12:31Z) - User Attitudes to Content Moderation in Web Search [49.1574468325115]
我々は、Web検索における誤解を招く可能性のあるコンテンツや攻撃的なコンテンツに適用される様々なモデレーションプラクティスに対するサポートレベルについて検討する。
最も支持されている実践は、誤解を招く可能性のあるコンテンツや不快なコンテンツについてユーザーに知らせることであり、最も支持されていないものは、検索結果を完全に削除することである。
より保守的なユーザーやウェブ検索結果に対する信頼度が低いユーザーは、ウェブ検索におけるコンテンツモデレーションに反する傾向にある。
論文 参考訳(メタデータ) (2023-10-05T10:57:15Z) - Online Learning in a Creator Economy [91.55437924091844]
われわれはクリエーター経済を、ユーザー、プラットフォーム、コンテンツクリエーターの3人組ゲームとして研究している。
私たちは、リターンベースの契約とフィーチャーベースの契約の2つのファミリーを分析します。
滑らかな仮定の下では、リターンベースの契約とレコメンデーションポリシーの協調最適化が後悔をもたらすことを示す。
論文 参考訳(メタデータ) (2023-05-19T01:58:13Z) - How Bad is Top-$K$ Recommendation under Competing Content Creators? [43.2268992294178]
我々は,アナーキー価格のレンズによるユーザ福祉保証について検討する。
創造者競争によるユーザ福祉損失のごく一部は、ユーザ決定におけるKドルとランダム性に応じて、常に小さな一定値で上限づけられていることが示される。
論文 参考訳(メタデータ) (2023-02-03T19:37:35Z) - Reward Shaping for User Satisfaction in a REINFORCE Recommender [24.65853598093849]
本稿では,ユーザの満足度を満足するアクションを学習するためのポリシーネットワークと満足度計算ネットワークを提案する。
命令ネットワークの役割は、どのアクションがユーザに満足しているかを学習することであり、ポリシーネットワークは、REINFORCE上に構築され、どの項目を推奨するかを決定する。
論文 参考訳(メタデータ) (2022-09-30T01:29:12Z) - Can you recommend content to creatives instead of final consumers? A
RecSys based on user's preferred visual styles [69.69160476215895]
このレポートは、ACM RecSys '22で発表された論文"Learning Users' Preferred Visual Styles in an Image Marketplace"の拡張である。
ユーザが作業するプロジェクトのセマンティクスに対して視覚スタイルの好みを学習するRecSysを設計する。
論文 参考訳(メタデータ) (2022-08-23T12:11:28Z) - Modeling Content Creator Incentives on Algorithm-Curated Platforms [76.53541575455978]
本研究では,アルゴリズムの選択が露出ゲームにおける(ナッシュ)平衡の存在と性格にどのように影響するかを検討する。
本研究では、露出ゲームにおける平衡を数値的に見つけるためのツールを提案し、MovieLensとLastFMデータセットの監査結果を示す。
論文 参考訳(メタデータ) (2022-06-27T08:16:59Z) - An Empirical Investigation of Personalization Factors on TikTok [77.34726150561087]
TikTokのアルゴリズムがプラットフォームの成功とコンテンツの配布に重要であるにもかかわらず、アルゴリズムの実証的な分析はほとんど行われていない。
我々は,私たちが開発したカスタムアルゴリズムを用いたソック・パペット・監査手法を用いて,TikTokへのアクセスに使用される言語と位置情報の効果を検証,分析した。
その結果,フォローフェールが最も強い影響を受けており,ライクフェールやビデオ視聴率が高いことが判明した。
論文 参考訳(メタデータ) (2022-01-28T17:40:00Z) - CLUE: Contextualised Unified Explainable Learning of User Engagement in
Video Lectures [6.25256391074865]
本稿では,オンライン授業ビデオから抽出した特徴から学習する統合モデルCLUEを提案する。
我々のモデルは、言語、文脈情報、配信されたコンテンツのテキスト感情の複雑さをモデル化するために、様々なマルチモーダル機能を利用する。
論文 参考訳(メタデータ) (2022-01-14T19:51:06Z) - Dynamic Slate Recommendation with Gated Recurrent Units and Thompson
Sampling [6.312395952874578]
我々は,インターネットプラットフォームのユーザに対して,アイテムリストとしてslatesという,関連するコンテンツを推薦する問題を考える。
本稿では,インターネットプラットフォームとユーザ間のインタラクションの時系列に作用する変分ベイズ型リカレントニューラルネットレコメンデータシステムを提案する。
我々は,探索的レコメンデーション戦略が,同程度以上の欲望に対して有効であることを実験的に示す。
論文 参考訳(メタデータ) (2021-04-30T15:16:35Z) - Partial Bandit and Semi-Bandit: Making the Most Out of Scarce Users'
Feedback [62.997667081978825]
本稿では,ユーザのフィードバックを考慮し,3つの戦略を用いて評価する手法を提案する。
ユーザからのフィードバックが制限されているにも関わらず(全体の20%以下)、我々の手法は最先端のアプローチと同じような結果が得られる。
論文 参考訳(メタデータ) (2020-09-16T07:32:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。