論文の概要: Reinforcement Learning for Strategic Recommendations
- arxiv url: http://arxiv.org/abs/2009.07346v1
- Date: Tue, 15 Sep 2020 20:45:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 05:48:03.457593
- Title: Reinforcement Learning for Strategic Recommendations
- Title(参考訳): 戦略的勧告のための強化学習
- Authors: Georgios Theocharous, Yash Chandak, Philip S. Thomas, Frits de Nijs
- Abstract要約: ストラテジックレコメンデーション(SR)とは、知的エージェントがユーザのシーケンシャルな行動や活動を観察し、いつ、どのように相互作用するかを決めて、ユーザとビジネスの両方の長期的な目的を最適化する問題を指す。
Adobeリサーチでは、関心点の推薦、チュートリアルレコメンデーション、マルチメディア編集ソフトウェアにおける次のステップガイダンス、ライフタイムバリューの最適化のための広告レコメンデーションなど、さまざまなユースケースでこのようなシステムを実装してきました。
ユーザのシーケンシャルな振る舞いをモデル化したり、いつ介入するかを決め、ユーザに迷惑をかけずにレコメンデーションを提示したり、オフラインでポリシーを評価するなど、これらのシステム構築には多くの研究課題がある。
- 参考スコア(独自算出の注目度): 32.73903761398027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Strategic recommendations (SR) refer to the problem where an intelligent
agent observes the sequential behaviors and activities of users and decides
when and how to interact with them to optimize some long-term objectives, both
for the user and the business. These systems are in their infancy in the
industry and in need of practical solutions to some fundamental research
challenges. At Adobe research, we have been implementing such systems for
various use-cases, including points of interest recommendations, tutorial
recommendations, next step guidance in multi-media editing software, and ad
recommendation for optimizing lifetime value. There are many research
challenges when building these systems, such as modeling the sequential
behavior of users, deciding when to intervene and offer recommendations without
annoying the user, evaluating policies offline with high confidence, safe
deployment, non-stationarity, building systems from passive data that do not
contain past recommendations, resource constraint optimization in multi-user
systems, scaling to large and dynamic actions spaces, and handling and
incorporating human cognitive biases. In this paper we cover various use-cases
and research challenges we solved to make these systems practical.
- Abstract(参考訳): ストラテジックレコメンデーション(SR)とは、知的エージェントがユーザのシーケンシャルな行動や活動を観察し、いつ、どのように相互作用するかを決めて、ユーザとビジネスの両方の長期的な目的を最適化する問題を指す。
これらのシステムは、業界の初期段階にあり、いくつかの基本的な研究課題に対する実用的な解決策を必要としています。
adobe researchでは、関心点推奨、チュートリアル推奨、マルチメディア編集ソフトウェアにおける次のステップガイダンス、ライフタイム価値を最適化するための広告推奨など、様々なユースケース向けにこのようなシステムを実装しています。
There are many research challenges when building these systems, such as modeling the sequential behavior of users, deciding when to intervene and offer recommendations without annoying the user, evaluating policies offline with high confidence, safe deployment, non-stationarity, building systems from passive data that do not contain past recommendations, resource constraint optimization in multi-user systems, scaling to large and dynamic actions spaces, and handling and incorporating human cognitive biases.
本稿では,これらのシステムを実用化するために解決した様々なユースケースと研究課題について述べる。
関連論文リスト
- All Roads Lead to Rome: Unveiling the Trajectory of Recommender Systems Across the LLM Era [63.649070507815715]
我々は、リコメンデータシステムをより広い視野に統合し、将来の研究のためのより包括的なソリューションの道を開くことを目指しています。
我々は、リストワイズレコメンデーションと会話レコメンデーションを通じて、現代のレコメンデーションシステムの2つの進化経路を特定する。
本稿では,ユーザの獲得コストを削減しつつ,推薦情報の有効性を高めることを指摘する。
論文 参考訳(メタデータ) (2024-07-14T05:02:21Z) - A Survey on Intent-aware Recommender Systems [8.761638205244427]
推薦システムは、ある時点にサービスを利用するというユーザの意図を考慮に入れることを目的としている。
本稿では,次世代のIntent-Aware Recommender Systemsを構築するための既存のアプローチを調査し,分類する。
論文 参考訳(メタデータ) (2024-06-24T06:46:32Z) - EASRec: Elastic Architecture Search for Efficient Long-term Sequential
Recommender Systems [82.76483989905961]
現在のSRS(Sequential Recommender Systems)は、計算とリソースの非効率に悩まされている。
我々は、効率的な長期シーケンスレコメンダシステム(EASRec)のための弾性アーキテクチャー探索を開発する。
EASRecは、入力データバッチから履歴情報を活用するデータ認識ゲートを導入し、レコメンデーションネットワークの性能を改善する。
論文 参考訳(メタデータ) (2024-02-01T07:22:52Z) - Embedding in Recommender Systems: A Survey [67.67966158305603]
重要な側面は、ユーザやアイテムIDといった高次元の離散的な特徴を低次元連続ベクトルに包含する技法である。
埋め込み技術の適用は複雑なエンティティ関係を捉え、かなりの研究を刺激している。
この調査では、協調フィルタリング、自己教師付き学習、グラフベースのテクニックなどの埋め込み手法を取り上げている。
論文 参考訳(メタデータ) (2023-10-28T06:31:06Z) - Modeling Recommender Ecosystems: Research Challenges at the Intersection
of Mechanism Design, Reinforcement Learning and Generative Models [17.546954143602818]
システム内のすべてのアクターのインセンティブと行動のモデリングは、システムがこれらのアクターにもたらす価値を最大化し、全体のエコシステム「健康」を改善するために厳密に必要である、と我々は主張する。
本稿では、これらの要素を包含する概念的枠組みを提案し、これらの異なる分野の交差点に現れる多くの研究課題を明確にする。
論文 参考訳(メタデータ) (2023-09-08T03:20:58Z) - Fisher-Weighted Merge of Contrastive Learning Models in Sequential
Recommendation [0.0]
我々は、まず、フィッシャー・マージング法をシークエンシャル・レコメンデーションに適用し、それに関連する実践的な課題に対処し、解決する。
提案手法の有効性を実証し, シーケンシャルラーニングおよびレコメンデーションシステムにおける最先端化の可能性を明らかにする。
論文 参考訳(メタデータ) (2023-07-05T05:58:56Z) - A Review on Pushing the Limits of Baseline Recommendation Systems with
the integration of Opinion Mining & Information Retrieval Techniques [0.0]
Recommendation Systemsでは、利用者の期待にタイムリーかつ関連性がありながら、コミュニティ内のトレンドアイテムを識別することができる。
より優れた品質のレコメンデーションを達成するために、ディープラーニングの手法が提案されている。
研究者たちは、最も効果的なレコメンデーションを提供するために、標準レコメンデーションシステムの能力を拡大しようと試みている。
論文 参考訳(メタデータ) (2022-05-03T22:13:33Z) - Knowledge-Enhanced Hierarchical Graph Transformer Network for
Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。
KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。
KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-10-08T09:44:00Z) - User Tampering in Reinforcement Learning Recommender Systems [2.28438857884398]
我々は、強化学習(RL)ベースのレコメンデーションアルゴリズム -- 'ユーザ改ざん' -- で発生する、ユニークな安全性上の懸念を強調します。
ユーザタンパリング(英: user tampering)とは、RLベースのレコメンデータシステムが、長期的なユーザエンゲージメントを最大化するためのポリシーの一環として、その提案を通じてメディアユーザの意見を操作できる状況である。
論文 参考訳(メタデータ) (2021-09-09T07:53:23Z) - Generative Inverse Deep Reinforcement Learning for Online Recommendation [62.09946317831129]
オンラインレコメンデーションのための新しい逆強化学習手法InvRecを提案する。
InvRecは、オンラインレコメンデーションのために、ユーザの行動から報酬関数を自動的に抽出する。
論文 参考訳(メタデータ) (2020-11-04T12:12:25Z) - Optimizing Interactive Systems via Data-Driven Objectives [70.3578528542663]
本稿では,観察されたユーザインタラクションから直接目的を推測する手法を提案する。
これらの推論は、事前の知識によらず、様々な種類のユーザー行動にまたがって行われる。
本稿では,これらの推定対象を最適化するために利用する新しいアルゴリズムであるInteractive System(ISO)を紹介する。
論文 参考訳(メタデータ) (2020-06-19T20:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。