Fugu-MT 論文翻訳(概要): Reinforcement Learning for Strategic Recommendations

論文の概要: Reinforcement Learning for Strategic Recommendations

arxiv url: http://arxiv.org/abs/2009.07346v1
Date: Tue, 15 Sep 2020 20:45:48 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-18 05:48:03.457593
Title: Reinforcement Learning for Strategic Recommendations
Title（参考訳）: 戦略的勧告のための強化学習
Authors: Georgios Theocharous, Yash Chandak, Philip S. Thomas, Frits de Nijs
Abstract要約: ストラテジックレコメンデーション(SR)とは、知的エージェントがユーザのシーケンシャルな行動や活動を観察し、いつ、どのように相互作用するかを決めて、ユーザとビジネスの両方の長期的な目的を最適化する問題を指す。 Adobeリサーチでは、関心点の推薦、チュートリアルレコメンデーション、マルチメディア編集ソフトウェアにおける次のステップガイダンス、ライフタイムバリューの最適化のための広告レコメンデーションなど、さまざまなユースケースでこのようなシステムを実装してきました。ユーザのシーケンシャルな振る舞いをモデル化したり、いつ介入するかを決め、ユーザに迷惑をかけずにレコメンデーションを提示したり、オフラインでポリシーを評価するなど、これらのシステム構築には多くの研究課題がある。
参考スコア（独自算出の注目度）: 32.73903761398027
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Strategic recommendations (SR) refer to the problem where an intelligent agent observes the sequential behaviors and activities of users and decides when and how to interact with them to optimize some long-term objectives, both for the user and the business. These systems are in their infancy in the industry and in need of practical solutions to some fundamental research challenges. At Adobe research, we have been implementing such systems for various use-cases, including points of interest recommendations, tutorial recommendations, next step guidance in multi-media editing software, and ad recommendation for optimizing lifetime value. There are many research challenges when building these systems, such as modeling the sequential behavior of users, deciding when to intervene and offer recommendations without annoying the user, evaluating policies offline with high confidence, safe deployment, non-stationarity, building systems from passive data that do not contain past recommendations, resource constraint optimization in multi-user systems, scaling to large and dynamic actions spaces, and handling and incorporating human cognitive biases. In this paper we cover various use-cases and research challenges we solved to make these systems practical.
Abstract（参考訳）: ストラテジックレコメンデーション(SR)とは、知的エージェントがユーザのシーケンシャルな行動や活動を観察し、いつ、どのように相互作用するかを決めて、ユーザとビジネスの両方の長期的な目的を最適化する問題を指す。これらのシステムは、業界の初期段階にあり、いくつかの基本的な研究課題に対する実用的な解決策を必要としています。 adobe researchでは、関心点推奨、チュートリアル推奨、マルチメディア編集ソフトウェアにおける次のステップガイダンス、ライフタイム価値を最適化するための広告推奨など、様々なユースケース向けにこのようなシステムを実装しています。 There are many research challenges when building these systems, such as modeling the sequential behavior of users, deciding when to intervene and offer recommendations without annoying the user, evaluating policies offline with high confidence, safe deployment, non-stationarity, building systems from passive data that do not contain past recommendations, resource constraint optimization in multi-user systems, scaling to large and dynamic actions spaces, and handling and incorporating human cognitive biases. 本稿では,これらのシステムを実用化するために解決した様々なユースケースと研究課題について述べる。

関連論文リスト

Towards a Real-World Aligned Benchmark for Unlearning in Recommender Systems [49.766845975588275]
推薦システムにおける非学習のためのより現実的なベンチマークの開発を導くために,設計デシダータと研究質問のセットを提案する。我々は、現実世界の削除要求の逐次的で時間に敏感な性質を反映した、未学習のセットアップについて論じる。本稿では,提案したdesiderataをベースとした次世代レコメンデーションセッティングの予備実験を行い,アンラーニングが逐次レコメンデーションモデルにも有効であることを確認した。
論文参考訳（メタデータ） (2025-08-23T16:05:40Z)
Does Multimodality Improve Recommender Systems as Expected? A Critical Analysis and Future Directions [52.21847626165085]
マルチモーダルレコメンデーションシステムは、多種多様なデータ型を統合することで、パフォーマンスを向上させる可能性が高まっている。しかし、この統合の実際の利点ははっきりしないままであり、いつ、どのように本当にレコメンデーションを強化するのかという疑問が持ち上がっている。 4次元にわたるマルチモーダルレコメンデーションを体系的に評価するための構造化評価フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-07T13:21:00Z)
A Study on Enhancing User Engagement by Employing Gamified Recommender Systems [7.330085696471743]
ゲーミフィケーションは、個人がシステム上でより多くの活動を行う動機となる。この研究は、様々なドメインアプリケーションにおけるユーザエンゲージメントを高めるためのゲーミフィケーションレコメンデーションシステムについて、包括的なレビューを提供する。
論文参考訳（メタデータ） (2025-08-02T08:49:45Z)
Continual Recommender Systems [47.467562063027195]
マシンラーニングに関する現在のチュートリアルでは、レコメンデーション固有の要求には対処していない。まず、背景と問題設定をレビューし、続いて既存のアプローチの概要を概観する。次に、実践的なデプロイメント環境に継続的学習を適用するための最近の取り組みを強調します。
論文参考訳（メタデータ） (2025-07-05T02:20:15Z)
Thought-Augmented Planning for LLM-Powered Interactive Recommender Agent [56.61028117645315]
本稿では,蒸留した思考パターンを通じて複雑なユーザ意図に対処する,思考増強型対話型推薦エージェントシステム(TAIRA)を提案する。具体的には、ユーザニーズを分解し、サブタスクを計画することでレコメンデーションタスクを編成するマネージャエージェントを備えたLLM方式のマルチエージェントシステムとして設計されている。複数のデータセットにまたがる包括的な実験により、IRAは既存の手法に比べて大幅に性能が向上した。
論文参考訳（メタデータ） (2025-06-30T03:15:50Z)
Towards Agentic Recommender Systems in the Era of Multimodal Large Language Models [75.4890331763196]
大規模言語モデル(LLM)の最近のブレークスルーは、エージェントAIシステムの出現につながっている。 LLMベースのAgentic RS(LLM-ARS)は、よりインタラクティブで、コンテキストを認識し、プロアクティブなレコメンデーションを提供する。
論文参考訳（メタデータ） (2025-03-20T22:37:15Z)
Generative Large Recommendation Models: Emerging Trends in LLMs for Recommendation [85.52251362906418]
このチュートリアルでは、大規模言語モデル(LLM)を統合するための2つの主要なアプローチを探求する。これは、最近の進歩、課題、潜在的研究の方向性を含む、生成的な大規模なレコメンデーションモデルの包括的な概要を提供する。主なトピックは、データ品質、スケーリング法則、ユーザの行動マイニング、トレーニングと推論の効率性である。
論文参考訳（メタデータ） (2025-02-19T14:48:25Z)
A Survey on Recommendation Unlearning: Fundamentals, Taxonomy, Evaluation, and Open Questions [16.00188808166725]
推薦システムは、ユーザの行動と意思決定を形作ることに、ますます影響力を増している。レコメンデータシステムにおける機械学習モデルの普及は、ユーザのプライバシとセキュリティに関する重要な懸念を引き起こしている。従来の機械学習手法は、協調的な相互作用やモデルパラメータによって引き起こされるユニークな課題のために、アンラーニングを推奨するのに不適である。
論文参考訳（メタデータ） (2024-12-17T11:58:55Z)
All Roads Lead to Rome: Unveiling the Trajectory of Recommender Systems Across the LLM Era [63.649070507815715]
我々は、リコメンデータシステムをより広い視野に統合し、将来の研究のためのより包括的なソリューションの道を開くことを目指しています。我々は、リストワイズレコメンデーションと会話レコメンデーションを通じて、現代のレコメンデーションシステムの2つの進化経路を特定する。本稿では,ユーザの獲得コストを削減しつつ,推薦情報の有効性を高めることを指摘する。
論文参考訳（メタデータ） (2024-07-14T05:02:21Z)
A Survey on Intent-aware Recommender Systems [8.761638205244427]
推薦システムは、ある時点にサービスを利用するというユーザの意図を考慮に入れることを目的としている。本稿では,次世代のIntent-Aware Recommender Systemsを構築するための既存のアプローチを調査し,分類する。
論文参考訳（メタデータ） (2024-06-24T06:46:32Z)
EASRec: Elastic Architecture Search for Efficient Long-term Sequential Recommender Systems [82.76483989905961]
現在のSRS(Sequential Recommender Systems)は、計算とリソースの非効率に悩まされている。我々は、効率的な長期シーケンスレコメンダシステム(EASRec)のための弾性アーキテクチャー探索を開発する。 EASRecは、入力データバッチから履歴情報を活用するデータ認識ゲートを導入し、レコメンデーションネットワークの性能を改善する。
論文参考訳（メタデータ） (2024-02-01T07:22:52Z)
Embedding in Recommender Systems: A Survey [67.67966158305603]
重要な側面は、ユーザやアイテムIDといった高次元の離散的な特徴を低次元連続ベクトルに包含する技法である。埋め込み技術の適用は複雑なエンティティ関係を捉え、かなりの研究を刺激している。この調査では、協調フィルタリング、自己教師付き学習、グラフベースのテクニックなどの埋め込み手法を取り上げている。
論文参考訳（メタデータ） (2023-10-28T06:31:06Z)
Modeling Recommender Ecosystems: Research Challenges at the Intersection of Mechanism Design, Reinforcement Learning and Generative Models [17.546954143602818]
システム内のすべてのアクターのインセンティブと行動のモデリングは、システムがこれらのアクターにもたらす価値を最大化し、全体のエコシステム「健康」を改善するために厳密に必要である、と我々は主張する。本稿では、これらの要素を包含する概念的枠組みを提案し、これらの異なる分野の交差点に現れる多くの研究課題を明確にする。
論文参考訳（メタデータ） (2023-09-08T03:20:58Z)
Fisher-Weighted Merge of Contrastive Learning Models in Sequential Recommendation [0.0]
我々は、まず、フィッシャー・マージング法をシークエンシャル・レコメンデーションに適用し、それに関連する実践的な課題に対処し、解決する。提案手法の有効性を実証し, シーケンシャルラーニングおよびレコメンデーションシステムにおける最先端化の可能性を明らかにする。
論文参考訳（メタデータ） (2023-07-05T05:58:56Z)
A Review on Pushing the Limits of Baseline Recommendation Systems with the integration of Opinion Mining & Information Retrieval Techniques [0.0]
Recommendation Systemsでは、利用者の期待にタイムリーかつ関連性がありながら、コミュニティ内のトレンドアイテムを識別することができる。より優れた品質のレコメンデーションを達成するために、ディープラーニングの手法が提案されている。研究者たちは、最も効果的なレコメンデーションを提供するために、標準レコメンデーションシステムの能力を拡大しようと試みている。
論文参考訳（メタデータ） (2022-05-03T22:13:33Z)
Knowledge-Enhanced Hierarchical Graph Transformer Network for Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。 KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。 KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2021-10-08T09:44:00Z)
User Tampering in Reinforcement Learning Recommender Systems [2.28438857884398]
我々は、強化学習(RL)ベースのレコメンデーションアルゴリズム -- 'ユーザ改ざん' -- で発生する、ユニークな安全性上の懸念を強調します。ユーザタンパリング(英: user tampering)とは、RLベースのレコメンデータシステムが、長期的なユーザエンゲージメントを最大化するためのポリシーの一環として、その提案を通じてメディアユーザの意見を操作できる状況である。
論文参考訳（メタデータ） (2021-09-09T07:53:23Z)
Generative Inverse Deep Reinforcement Learning for Online Recommendation [62.09946317831129]
オンラインレコメンデーションのための新しい逆強化学習手法InvRecを提案する。 InvRecは、オンラインレコメンデーションのために、ユーザの行動から報酬関数を自動的に抽出する。
論文参考訳（メタデータ） (2020-11-04T12:12:25Z)
Optimizing Interactive Systems via Data-Driven Objectives [70.3578528542663]
本稿では,観察されたユーザインタラクションから直接目的を推測する手法を提案する。これらの推論は、事前の知識によらず、様々な種類のユーザー行動にまたがって行われる。本稿では,これらの推定対象を最適化するために利用する新しいアルゴリズムであるInteractive System(ISO)を紹介する。
論文参考訳（メタデータ） (2020-06-19T20:49:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。