論文の概要: Fatigue-aware Bandits for Dependent Click Models
- arxiv url: http://arxiv.org/abs/2008.09733v1
- Date: Sat, 22 Aug 2020 02:18:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 07:55:45.185420
- Title: Fatigue-aware Bandits for Dependent Click Models
- Title(参考訳): 依存クリックモデルのための疲労認識帯域
- Authors: Junyu Cao, Wei Sun, Zuo-Jun (Max) Shen, Markus Ettl
- Abstract要約: プラットフォームがユーザの疲労を考慮に入れたコンテンツを推薦するポリシーを学習するオンライン学習環境を考える。
各コンテンツについて、ユーザにとっての魅力は、その本質的な関連性と、類似コンテンツがいくつ表示されたかを測定する割引係数に依存する。
利用者のフィードバックに基づき、プラットフォームはコンテンツ疲労による割引効果だけでなく、基盤となるコンテンツの関連性も学習する。
- 参考スコア(独自算出の注目度): 11.887684896043883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As recommender systems send a massive amount of content to keep users
engaged, users may experience fatigue which is contributed by 1) an
overexposure to irrelevant content, 2) boredom from seeing too many similar
recommendations. To address this problem, we consider an online learning
setting where a platform learns a policy to recommend content that takes user
fatigue into account. We propose an extension of the Dependent Click Model
(DCM) to describe users' behavior. We stipulate that for each piece of content,
its attractiveness to a user depends on its intrinsic relevance and a discount
factor which measures how many similar contents have been shown. Users view the
recommended content sequentially and click on the ones that they find
attractive. Users may leave the platform at any time, and the probability of
exiting is higher when they do not like the content. Based on user's feedback,
the platform learns the relevance of the underlying content as well as the
discounting effect due to content fatigue. We refer to this learning task as
"fatigue-aware DCM Bandit" problem. We consider two learning scenarios
depending on whether the discounting effect is known. For each scenario, we
propose a learning algorithm which simultaneously explores and exploits, and
characterize its regret bound.
- Abstract(参考訳): レコメンダシステムは、ユーザのエンゲージメントを維持するために大量のコンテンツを送信します。
1)無関係な内容に対する過剰な露出
2)類似した推奨が多すぎることはほとんどない。
この問題に対処するために、プラットフォームがユーザの疲労を考慮したコンテンツを推奨するポリシーを学習するオンライン学習環境を検討する。
本稿では,ユーザの行動を記述するために,依存クリックモデル(dcm)の拡張を提案する。
各コンテンツについて、ユーザにとっての魅力は、その本質的な関連性と、類似コンテンツ数を測定する割引要因に依存すると規定する。
ユーザーは推奨コンテンツを順次表示し、魅力的なコンテンツをクリックする。
ユーザーはいつでもプラットフォームを離れることができ、コンテンツが気に入らない場合は離脱する確率が高い。
利用者のフィードバックに基づき、プラットフォームはコンテンツ疲労による割引効果だけでなく、基盤となるコンテンツの関連性も学習する。
本稿では,この学習課題を「Fatigue-aware DCM Bandit」問題と呼ぶ。
割引効果が知られているかどうかに応じて,2つの学習シナリオを考察する。
それぞれのシナリオについて,同時に探索し,悪用し,その後悔を特徴付ける学習アルゴリズムを提案する。
関連論文リスト
- Unveiling User Satisfaction and Creator Productivity Trade-Offs in Recommendation Platforms [68.51708490104687]
調査力の低い純粋に関連性の高い政策は、短期的ユーザの満足度を高めるが、コンテンツプールの長期的豊かさを損なうことを示す。
調査の結果,プラットフォーム上でのユーザの即時満足度と全体のコンテンツ生産との間には,根本的なトレードオフがあることが判明した。
論文 参考訳(メタデータ) (2024-10-31T07:19:22Z) - Uncovering the Interaction Equation: Quantifying the Effect of User Interactions on Social Media Homepage Recommendations [0.5030361857850012]
これまでのユーザーインタラクションが、YouTube、Reddit、X(旧Twitter)の3大プラットフォームにわたるユーザーのホームページフィードに提示されたコンテンツにどのように影響するかを調査する。
我々は、ホームページコンテンツに対する特定のユーザーインタラクションの影響を明らかにすることのできるデータを収集するために、慎重に設計された一連の実験を使用する。
本研究は,各プラットフォームが使用するコンテンツキュレーションアルゴリズムの動作,ユーザインタラクションに対する反応,および特定のトピックの優先順位付けの証拠を明らかにする。
論文 参考訳(メタデータ) (2024-07-09T20:47:34Z) - System-2 Recommenders: Disentangling Utility and Engagement in Recommendation Systems via Temporal Point-Processes [80.97898201876592]
本稿では,過去のコンテンツインタラクションが,自己興奮型ホークスプロセスに基づくユーザの到着率に影響を及ぼす生成モデルを提案する。
そこで本研究では,システム1とシステム2のアンタングルを解消し,ユーザ利用によるコンテンツ最適化を可能にすることを解析的に示す。
論文 参考訳(メタデータ) (2024-05-29T18:19:37Z) - Measuring Strategization in Recommendation: Users Adapt Their Behavior to Shape Future Content [66.71102704873185]
実験と調査を行うことで,ユーザストラテジゼーションの試行を行う。
参加者の居住時間や「いいね!」の使用など,結果指標間での戦略化の強い証拠を見出す。
この結果から,プラットフォームはアルゴリズムがユーザの行動に与える影響を無視できないことが示唆された。
論文 参考訳(メタデータ) (2024-05-09T07:36:08Z) - User Welfare Optimization in Recommender Systems with Competing Content Creators [65.25721571688369]
本研究では,コンテンツ制作者間での競争ゲーム環境下で,システム側ユーザ福祉の最適化を行う。
本稿では,推奨コンテンツの満足度に基づいて,各ユーザの重みの列を動的に計算する,プラットフォームのためのアルゴリズムソリューションを提案する。
これらの重みはレコメンデーションポリシーやポストレコメンデーション報酬を調整するメカニズムの設計に利用され、それによってクリエイターのコンテンツ制作戦略に影響を与える。
論文 参考訳(メタデータ) (2024-04-28T21:09:52Z) - Incentivizing High-Quality Content in Online Recommender Systems [80.19930280144123]
プロデューサー間のゲームについて検討し、均衡で作成されたコンテンツを分析する。
HedgeやEXP3のような標準的なオンライン学習アルゴリズムは、残念なことにプロデューサに低品質コンテンツを作る動機を与えています。
論文 参考訳(メタデータ) (2023-06-13T00:55:10Z) - How Bad is Top-$K$ Recommendation under Competing Content Creators? [43.2268992294178]
我々は,アナーキー価格のレンズによるユーザ福祉保証について検討する。
創造者競争によるユーザ福祉損失のごく一部は、ユーザ決定におけるKドルとランダム性に応じて、常に小さな一定値で上限づけられていることが示される。
論文 参考訳(メタデータ) (2023-02-03T19:37:35Z) - Reward Shaping for User Satisfaction in a REINFORCE Recommender [24.65853598093849]
本稿では,ユーザの満足度を満足するアクションを学習するためのポリシーネットワークと満足度計算ネットワークを提案する。
命令ネットワークの役割は、どのアクションがユーザに満足しているかを学習することであり、ポリシーネットワークは、REINFORCE上に構築され、どの項目を推奨するかを決定する。
論文 参考訳(メタデータ) (2022-09-30T01:29:12Z) - An Empirical Investigation of Personalization Factors on TikTok [77.34726150561087]
TikTokのアルゴリズムがプラットフォームの成功とコンテンツの配布に重要であるにもかかわらず、アルゴリズムの実証的な分析はほとんど行われていない。
我々は,私たちが開発したカスタムアルゴリズムを用いたソック・パペット・監査手法を用いて,TikTokへのアクセスに使用される言語と位置情報の効果を検証,分析した。
その結果,フォローフェールが最も強い影響を受けており,ライクフェールやビデオ視聴率が高いことが判明した。
論文 参考訳(メタデータ) (2022-01-28T17:40:00Z) - CLUE: Contextualised Unified Explainable Learning of User Engagement in
Video Lectures [6.25256391074865]
本稿では,オンライン授業ビデオから抽出した特徴から学習する統合モデルCLUEを提案する。
我々のモデルは、言語、文脈情報、配信されたコンテンツのテキスト感情の複雑さをモデル化するために、様々なマルチモーダル機能を利用する。
論文 参考訳(メタデータ) (2022-01-14T19:51:06Z) - Dynamic Slate Recommendation with Gated Recurrent Units and Thompson
Sampling [6.312395952874578]
我々は,インターネットプラットフォームのユーザに対して,アイテムリストとしてslatesという,関連するコンテンツを推薦する問題を考える。
本稿では,インターネットプラットフォームとユーザ間のインタラクションの時系列に作用する変分ベイズ型リカレントニューラルネットレコメンデータシステムを提案する。
我々は,探索的レコメンデーション戦略が,同程度以上の欲望に対して有効であることを実験的に示す。
論文 参考訳(メタデータ) (2021-04-30T15:16:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。