論文の概要: Modeling Online Behavior in Recommender Systems: The Importance of
Temporal Context
- arxiv url: http://arxiv.org/abs/2009.08978v3
- Date: Sun, 5 Sep 2021 16:06:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 20:44:02.793764
- Title: Modeling Online Behavior in Recommender Systems: The Importance of
Temporal Context
- Title(参考訳): 推薦システムにおけるオンライン行動のモデル化 : 時間的文脈の重要性
- Authors: Milena Filipovic, Blagoj Mitrevski, Diego Antognini, Emma Lejal
Glaude, Boi Faltings, Claudiu Musat
- Abstract要約: 推薦システムの性能を評価するときの時間的文脈の省略が、いかに誤った自信をもたらすかを示す。
既存のモデルに時間的文脈をさらに埋め込むためのトレーニング手順を提案する。
その結果、時間的目標を含めれば、リコール@20を最大20%改善できることがわかった。
- 参考スコア(独自算出の注目度): 30.894950420437926
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommender systems research tends to evaluate model performance offline and
on randomly sampled targets, yet the same systems are later used to predict
user behavior sequentially from a fixed point in time. Simulating online
recommender system performance is notoriously difficult and the discrepancy
between online and offline behaviors is typically not accounted for in offline
evaluations. This disparity permits weaknesses to go unnoticed until the model
is deployed in a production setting. In this paper, we first demonstrate how
omitting temporal context when evaluating recommender system performance leads
to false confidence. To overcome this, we postulate that offline evaluation
protocols can only model real-life use-cases if they account for temporal
context. Next, we propose a training procedure to further embed the temporal
context in existing models. We use a multi-objective approach to introduce
temporal context into traditionally time-unaware recommender systems and
confirm its advantage via the proposed evaluation protocol. Finally, we
validate that the Pareto Fronts obtained with the added objective dominate
those produced by state-of-the-art models that are only optimized for accuracy
on three real-world publicly available datasets. The results show that
including our temporal objective can improve recall@20 by up to 20%.
- Abstract(参考訳): レコメンダシステムの研究は、オフラインおよびランダムにサンプリングされたターゲットでモデルパフォーマンスを評価する傾向があるが、同じシステムは、後に不定点からユーザの振る舞いを逐次予測するために使用される。
オンラインレコメンダシステムのパフォーマンスのシミュレーションは非常に難しく、オンラインとオフラインの動作の相違は、通常オフライン評価では考慮されない。
この格差により、モデルが運用環境にデプロイされるまでは、弱点に気付きません。
本稿では,まず,レコメンダシステムの性能評価における時間的文脈の省略が誤った自信をもたらすことを示す。
これを克服するために,オフライン評価プロトコルは,時間的文脈を考慮した場合にのみ実際のユースケースをモデル化できると仮定する。
次に,既存のモデルに時間的コンテキストを埋め込むためのトレーニング手順を提案する。
提案手法は,従来の時間認識型レコメンデータシステムに時間的コンテキストを導入し,その利点を評価プロトコルを用いて確認する。
最後に、この追加目的によって得られたPareto Frontsが、実世界の3つの公開データセットの精度にのみ最適化された最先端のモデルによって生成されたものを支配していることを検証する。
その結果、時間的目標を含めるとrecall@20を最大20%改善できることがわかった。
関連論文リスト
- Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.18002641195442]
既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。
負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文 参考訳(メタデータ) (2024-05-31T14:21:04Z) - Sequential Recommendation on Temporal Proximities with Contrastive
Learning and Self-Attention [3.7182810519704095]
逐次リコメンデータシステムは、過去のインタラクションからユーザの好みを識別し、後続の項目を最適に予測する。
最近のモデルでは、類似の時間枠中に暗黙的に発生するユーザの行動の類似性を無視することが多い。
本稿では,時間的近接性を考慮したコントラスト学習と自己認識手法を含む,TemProxRecという逐次レコメンデーションモデルを提案する。
論文 参考訳(メタデータ) (2024-02-15T08:33:16Z) - Measuring the Stability of Process Outcome Predictions in Online
Settings [4.599862571197789]
本稿では,オンライン予測プロセス監視のためのモデルの安定性を評価するための評価フレームワークを提案する。
このフレームワークは、4つのパフォーマンスメタ尺度を導入している。性能低下の頻度、その大きさ、回復率、パフォーマンスのボラティリティである。
その結果,これらのメタ尺度は,異なるリスクテイクシナリオに対する予測モデルの比較と選択を容易にすることが示された。
論文 参考訳(メタデータ) (2023-10-13T10:37:46Z) - A Bayesian Approach to Robust Inverse Reinforcement Learning [54.24816623644148]
我々は、オフラインモデルに基づく逆強化学習(IRL)に対するベイズ的アプローチを考える。
提案フレームワークは,専門家の報酬関数と環境力学の主観的モデルとを同時推定することにより,既存のオフラインモデルベースIRLアプローチとは異なる。
本分析は, 専門家が環境の高精度なモデルを持つと考えられる場合, 評価政策が堅牢な性能を示すという新たな知見を提示する。
論文 参考訳(メタデータ) (2023-09-15T17:37:09Z) - OpenSTL: A Comprehensive Benchmark of Spatio-Temporal Predictive
Learning [67.07363529640784]
提案するOpenSTLは,一般的なアプローチを再帰的モデルと再帰的モデルに分類する。
我々は, 合成移動物体軌道, 人間の動き, 運転シーン, 交通流, 天気予報など, さまざまな領域にわたるデータセットの標準評価を行う。
リカレントフリーモデルは、リカレントモデルよりも効率と性能のバランスが良いことがわかった。
論文 参考訳(メタデータ) (2023-06-20T03:02:14Z) - Exploring validation metrics for offline model-based optimisation with
diffusion models [50.404829846182764]
モデルベース最適化(MBO)では、マシンラーニングを使用して、(基底真理)オラクルと呼ばれるブラックボックス関数に対する報酬の尺度を最大化する候補を設計することに興味があります。
モデル検証中に基底オラクルに対する近似をトレーニングし、その代わりに使用することができるが、その評価は近似的であり、敵の例に対して脆弱である。
本手法は,外挿量を測定するために提案した評価フレームワークにカプセル化されている。
論文 参考訳(メタデータ) (2022-11-19T16:57:37Z) - WSLRec: Weakly Supervised Learning for Neural Sequential Recommendation
Models [24.455665093145818]
我々は、WSLRecと呼ばれる新しいモデルに依存しないトレーニング手法を提案し、3段階のフレームワーク(事前学習、トップ$k$マイニング、本質的、微調整)を採用する。
WSLRec は、BR や ItemCF のようなモデルフリーメソッドから、余分な弱い監督のモデルを事前訓練することで、不完全性の問題を解決すると同時に、最上位の$k のマイニングを活用して、微調整のための弱い監督の信頼性の高いユーザ・イテム関連を検査することで、不正確な問題を解消する。
論文 参考訳(メタデータ) (2022-02-28T08:55:12Z) - Towards Streaming Egocentric Action Anticipation [23.9991007631236]
エゴセントリックなアクション予測は、カメラ装着者が過去のビデオ観察に基づいて実行するであろう未来のアクションを予測するタスクである。
現在の評価スキームは、予測をオフラインにできるので、計算資源は制限されないと仮定している。
本稿では,パフォーマンス評価のためのモデルランタイムを明示的に検討した,ストリーミングのエゴセントリックなアクション予測評価プロトコルを提案する。
論文 参考訳(メタデータ) (2021-10-11T16:22:56Z) - COMBO: Conservative Offline Model-Based Policy Optimization [120.55713363569845]
ディープニューラルネットワークのような複雑なモデルによる不確実性推定は困難であり、信頼性が低い。
我々は,サポート外状態動作の値関数を正規化するモデルベースオフラインRLアルゴリズムCOMBOを開発した。
従来のオフラインモデルフリーメソッドやモデルベースメソッドと比べて、comboは一貫してパフォーマンスが良いことが分かりました。
論文 参考訳(メタデータ) (2021-02-16T18:50:32Z) - Do Offline Metrics Predict Online Performance in Recommender Systems? [79.48653445643865]
6つのシミュレーション環境におけるレコメンデータの評価により,オフラインメトリクスがオンラインのパフォーマンスを予測する程度について検討した。
オフラインメトリクスは、様々な環境におけるオンラインのパフォーマンスと相関している。
本研究は,探索戦略の追加による影響について検討し,その有効性はレコメンデーションアルゴリズムに大きく依存していることを示す。
論文 参考訳(メタデータ) (2020-11-07T01:41:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。