論文の概要: Personalized Reward Learning with Interaction-Grounded Learning (IGL)
- arxiv url: http://arxiv.org/abs/2211.15823v1
- Date: Mon, 28 Nov 2022 23:18:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 15:27:28.835347
- Title: Personalized Reward Learning with Interaction-Grounded Learning (IGL)
- Title(参考訳): 対話型学習(IGL)を用いた個人化リワード学習
- Authors: Jessica Maghakian, Paul Mineiro, Kishan Panaganti, Mark Rucker,
Akanksha Saran, Cheng Tan
- Abstract要約: 現代のレコメンデータシステムは、通常、すべてのユーザーに対して暗黙のフィードバック信号の固定的な組み合わせを最適化する。
本稿では,多様なユーザ・コミュニケーション・モダリティの学習表現の課題に対処するために,近年のインタラクション・グラウンドド・ラーニング・パラダイムを適用することを提案する。
- 参考スコア(独自算出の注目度): 7.898208662809734
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In an era of countless content offerings, recommender systems alleviate
information overload by providing users with personalized content suggestions.
Due to the scarcity of explicit user feedback, modern recommender systems
typically optimize for the same fixed combination of implicit feedback signals
across all users. However, this approach disregards a growing body of work
highlighting that (i) implicit signals can be used by users in diverse ways,
signaling anything from satisfaction to active dislike, and (ii) different
users communicate preferences in different ways. We propose applying the recent
Interaction Grounded Learning (IGL) paradigm to address the challenge of
learning representations of diverse user communication modalities. Rather than
taking a fixed, human-designed reward function, IGL is able to learn
personalized reward functions for different users and then optimize directly
for the latent user satisfaction. We demonstrate the success of IGL with
experiments using simulations as well as with real-world production traces.
- Abstract(参考訳): 数え切れないほどのコンテンツ提供の時代に、レコメンダシステムはユーザーにパーソナライズされたコンテンツ提案を提供することで、情報の過負荷を軽減する。
明示的なユーザフィードバックが不足しているため、現代のレコメンデータシステムは一般的に、すべてのユーザに対する暗黙的なフィードバック信号の固定的な組み合わせを最適化する。
しかし、このアプローチは、それを強調している仕事の体を無視している。
(i)暗黙の信号は、ユーザの満足感からアクティブな嫌悪まで、様々な方法で使用することができる。
(ii)異なるユーザーが異なる方法で好みを伝える。
多様なユーザ・コミュニケーション・モダリティの学習表現の課題に対処するために,近年のインタラクション・グラウンドド・ラーニング(IGL)パラダイムを適用することを提案する。
固定された人間設計の報酬関数を取るのではなく、IGLは異なるユーザーに対してパーソナライズされた報酬関数を学習し、潜在ユーザの満足度を直接最適化することができる。
シミュレーションおよび実世界の生産トレースを用いた実験により,IGLの成功例を示す。
関連論文リスト
- Async Learned User Embeddings for Ads Delivery Optimization [24.104745716074262]
推薦システムでは、高品質なユーザ埋め込みは微妙な好みを捉え、正確な類似性計算を可能にし、時間とともに変化する好みに適応して関連性を維持することができる。
本稿では,Transformerのような大規模機能学習モジュールを用いて,シーケンスベースのマルチモーダルユーザアクティビティから,毎日数十億のユーザに対する高忠実度ユーザ埋め込みを非同期に学習することを提案する。
論文 参考訳(メタデータ) (2024-06-09T19:35:20Z) - Explainable Active Learning for Preference Elicitation [0.0]
我々は、最小限のユーザ労力で情報取得を最大化することを目的として、この問題を解決するためにアクティブラーニング(AL)を採用している。
ALは、大きなラベルのない集合から情報的データを選択して、それらをラベル付けするオラクルを問い合わせる。
ベースとなる機械学習(ML)モデルを更新するために、ユーザからのフィードバック(提示された項目に関するシステムの説明のために)を情報的なサンプルから収集する。
論文 参考訳(メタデータ) (2023-09-01T09:22:33Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - RESUS: Warm-Up Cold Users via Meta-Learning Residual User Preferences in
CTR Prediction [14.807495564177252]
コールドユーザーに対するCTR(Click-Through Rate)予測は、レコメンデーションシステムにおいて難しい課題である。
本稿では,グローバルな嗜好知識の学習を,個々のユーザの残留嗜好の学習から切り離す,RESUSという新しい,効率的なアプローチを提案する。
本手法は, コールドユーザに対するCTR予測精度の向上に有効であり, 各種最先端手法と比較して有効である。
論文 参考訳(メタデータ) (2022-10-28T11:57:58Z) - Intent Contrastive Learning for Sequential Recommendation [86.54439927038968]
ユーザの意図を表現するために潜伏変数を導入し,クラスタリングにより潜伏変数の分布関数を学習する。
我々は,学習意図を対照的なSSLによってSRモデルに活用し,シーケンスのビューとそれに対応するインテントとの一致を最大化することを提案する。
4つの実世界のデータセットで実施された実験は、提案した学習パラダイムの優位性を示している。
論文 参考訳(メタデータ) (2022-02-05T09:24:13Z) - Learning from a Learning User for Optimal Recommendations [43.2268992294178]
我々は「学習ユーザ」を捕捉し、効率的なシステム側学習ソリューションを設計するためのモデルを定式化する。
ユーザ学習の収束率が悪化するにつれて,RAESの後悔は良好に悪化することを示す。
本研究は,リコメンデーション問題におけるフィードバックループのモデル化に関する新たな視点を提供する。
論文 参考訳(メタデータ) (2022-02-03T22:45:12Z) - Hyper Meta-Path Contrastive Learning for Multi-Behavior Recommendation [61.114580368455236]
マルチビヘイビア情報によるユーザ購入予測は、現在のレコメンデーションシステムでは難しい問題である。
本稿では,ハイパーメタパスやハイパーメタグラフを構築するためのハイパーメタパスの概念を提案する。
最近のグラフコントラスト学習の成功により、異なる振る舞い間の依存関係を理解するために固定されたスキームを割り当てるのではなく、ユーザ行動パターンの埋め込みを適応的に学習する。
論文 参考訳(メタデータ) (2021-09-07T04:28:09Z) - Optimizing Interactive Systems via Data-Driven Objectives [70.3578528542663]
本稿では,観察されたユーザインタラクションから直接目的を推測する手法を提案する。
これらの推論は、事前の知識によらず、様々な種類のユーザー行動にまたがって行われる。
本稿では,これらの推定対象を最適化するために利用する新しいアルゴリズムであるInteractive System(ISO)を紹介する。
論文 参考訳(メタデータ) (2020-06-19T20:49:14Z) - Empowering Active Learning to Jointly Optimize System and User Demands [70.66168547821019]
我々は,アクティブラーニングシステムとユーザを協調的に(効率的に学習)するための,新しいアクティブラーニング手法を提案する。
本手法は,特定のユーザに対して,エクササイズの適切性を予測するために,学習を迅速かつ迅速に行う必要があるため,特に,この手法のメリットを生かした教育アプリケーションで研究する。
複数の学習戦略とユーザタイプを実際のユーザからのデータで評価し,代替手法がエンドユーザに適さない多くのエクササイズをもたらす場合,共同アプローチが両方の目標を満足できることを確認した。
論文 参考訳(メタデータ) (2020-05-09T16:02:52Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。