Fugu-MT 論文翻訳(概要): Modeling Online Behavior in Recommender Systems: The Importance of Temporal Context

論文の概要: Modeling Online Behavior in Recommender Systems: The Importance of Temporal Context

arxiv url: http://arxiv.org/abs/2009.08978v3
Date: Sun, 5 Sep 2021 16:06:40 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-16 20:44:02.793764
Title: Modeling Online Behavior in Recommender Systems: The Importance of Temporal Context
Title（参考訳）: 推薦システムにおけるオンライン行動のモデル化 : 時間的文脈の重要性
Authors: Milena Filipovic, Blagoj Mitrevski, Diego Antognini, Emma Lejal Glaude, Boi Faltings, Claudiu Musat
Abstract要約: 推薦システムの性能を評価するときの時間的文脈の省略が、いかに誤った自信をもたらすかを示す。既存のモデルに時間的文脈をさらに埋め込むためのトレーニング手順を提案する。その結果、時間的目標を含めれば、リコール@20を最大20%改善できることがわかった。
参考スコア（独自算出の注目度）: 30.894950420437926
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recommender systems research tends to evaluate model performance offline and on randomly sampled targets, yet the same systems are later used to predict user behavior sequentially from a fixed point in time. Simulating online recommender system performance is notoriously difficult and the discrepancy between online and offline behaviors is typically not accounted for in offline evaluations. This disparity permits weaknesses to go unnoticed until the model is deployed in a production setting. In this paper, we first demonstrate how omitting temporal context when evaluating recommender system performance leads to false confidence. To overcome this, we postulate that offline evaluation protocols can only model real-life use-cases if they account for temporal context. Next, we propose a training procedure to further embed the temporal context in existing models. We use a multi-objective approach to introduce temporal context into traditionally time-unaware recommender systems and confirm its advantage via the proposed evaluation protocol. Finally, we validate that the Pareto Fronts obtained with the added objective dominate those produced by state-of-the-art models that are only optimized for accuracy on three real-world publicly available datasets. The results show that including our temporal objective can improve recall@20 by up to 20%.
Abstract（参考訳）: レコメンダシステムの研究は、オフラインおよびランダムにサンプリングされたターゲットでモデルパフォーマンスを評価する傾向があるが、同じシステムは、後に不定点からユーザの振る舞いを逐次予測するために使用される。オンラインレコメンダシステムのパフォーマンスのシミュレーションは非常に難しく、オンラインとオフラインの動作の相違は、通常オフライン評価では考慮されない。この格差により、モデルが運用環境にデプロイされるまでは、弱点に気付きません。本稿では,まず,レコメンダシステムの性能評価における時間的文脈の省略が誤った自信をもたらすことを示す。これを克服するために,オフライン評価プロトコルは,時間的文脈を考慮した場合にのみ実際のユースケースをモデル化できると仮定する。次に,既存のモデルに時間的コンテキストを埋め込むためのトレーニング手順を提案する。提案手法は,従来の時間認識型レコメンデータシステムに時間的コンテキストを導入し,その利点を評価プロトコルを用いて確認する。最後に、この追加目的によって得られたPareto Frontsが、実世界の3つの公開データセットの精度にのみ最適化された最先端のモデルによって生成されたものを支配していることを検証する。その結果、時間的目標を含めるとrecall@20を最大20%改善できることがわかった。

関連論文リスト

Tempora: Characterising the Time-Contingent Utility of Online Test-Time Adaptation [16.841308606553685]
テスト時間適応(TTA)は、ドメインシフトの下で劣化するマシンラーニング(ML)モデルに対して、魅力的な治療法を提供する。従来の評価では、正確さとレイテンシのトレードオフを見越して、無制限の処理時間を前提としていた。時間的圧力下でのTTA評価のためのフレームワークであるTemporaを紹介する。
論文参考訳（メタデータ） (2026-02-05T19:10:53Z)
STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。 MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文参考訳（メタデータ） (2025-08-26T08:47:58Z)
Measuring the stability and plasticity of recommender systems [0.4551615447454769]
本稿では,レコメンデーションモデルが再訓練されたときにどのように振る舞うかを研究する方法論を提案する。その考え方は、過去のパターンを保持する能力に応じてアルゴリズムをプロファイリングすることだ。予備的な結果は,アルゴリズムの手法によって安定性と可塑性のプロファイルが異なることを示している。
論文参考訳（メタデータ） (2025-08-05T22:15:43Z)
Towards Robust Offline Evaluation: A Causal and Information Theoretic Framework for Debiasing Ranking Systems [6.540293515339111]
検索レベルシステムのオフライン評価は、高性能なモデルの開発に不可欠である。本稿では,検索グレードシステムのオフライン評価を行うための新しいフレームワークを提案する。本研究は,(1)オフライン評価バイアスに対処するための因果関係の定式化,(2)システムに依存しない脱バイアスフレームワーク,(3)有効性の実証的検証を含む。
論文参考訳（メタデータ） (2025-04-04T23:52:57Z)
Generative Regression Based Watch Time Prediction for Short-Video Recommendation [36.95095097454143]
短いビデオレコメンデーションシステムでは、時計の時間予測が重要なタスクとして現れている。最近の研究は、連続時計時間推定を正規回帰タスクに変換することによって、これらの問題に対処しようとしている。本稿では,WTPをシーケンス生成タスクとして再構成する新しい生成回帰(GR)フレームワークを提案する。
論文参考訳（メタデータ） (2024-12-28T16:48:55Z)
Recurrent Neural Goodness-of-Fit Test for Time Series [8.22915954499148]
時系列データは、金融や医療など、さまざまな分野において重要である。従来の評価基準は、時間的依存関係と潜在的な特徴の高次元性のために不足している。 Recurrent Neural (RENAL) Goodness-of-Fit testは,生成時系列モデルを評価するための新しい,統計的に厳密なフレームワークである。
論文参考訳（メタデータ） (2024-10-17T19:32:25Z)
Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.18002641195442]
既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文参考訳（メタデータ） (2024-05-31T14:21:04Z)
Sequential Recommendation on Temporal Proximities with Contrastive Learning and Self-Attention [3.7182810519704095]
逐次リコメンデータシステムは、過去のインタラクションからユーザの好みを識別し、後続の項目を最適に予測する。最近のモデルでは、類似の時間枠中に暗黙的に発生するユーザの行動の類似性を無視することが多い。本稿では,時間的近接性を考慮したコントラスト学習と自己認識手法を含む,TemProxRecという逐次レコメンデーションモデルを提案する。
論文参考訳（メタデータ） (2024-02-15T08:33:16Z)
A Bayesian Approach to Robust Inverse Reinforcement Learning [54.24816623644148]
我々は、オフラインモデルに基づく逆強化学習(IRL)に対するベイズ的アプローチを考える。提案フレームワークは,専門家の報酬関数と環境力学の主観的モデルとを同時推定することにより,既存のオフラインモデルベースIRLアプローチとは異なる。本分析は, 専門家が環境の高精度なモデルを持つと考えられる場合, 評価政策が堅牢な性能を示すという新たな知見を提示する。
論文参考訳（メタデータ） (2023-09-15T17:37:09Z)
OpenSTL: A Comprehensive Benchmark of Spatio-Temporal Predictive Learning [67.07363529640784]
提案するOpenSTLは,一般的なアプローチを再帰的モデルと再帰的モデルに分類する。我々は, 合成移動物体軌道, 人間の動き, 運転シーン, 交通流, 天気予報など, さまざまな領域にわたるデータセットの標準評価を行う。リカレントフリーモデルは、リカレントモデルよりも効率と性能のバランスが良いことがわかった。
論文参考訳（メタデータ） (2023-06-20T03:02:14Z)
Exploring validation metrics for offline model-based optimisation with diffusion models [50.404829846182764]
モデルベース最適化(MBO)では、マシンラーニングを使用して、(基底真理)オラクルと呼ばれるブラックボックス関数に対する報酬の尺度を最大化する候補を設計することに興味があります。モデル検証中に基底オラクルに対する近似をトレーニングし、その代わりに使用することができるが、その評価は近似的であり、敵の例に対して脆弱である。本手法は,外挿量を測定するために提案した評価フレームワークにカプセル化されている。
論文参考訳（メタデータ） (2022-11-19T16:57:37Z)
WSLRec: Weakly Supervised Learning for Neural Sequential Recommendation Models [24.455665093145818]
我々は、WSLRecと呼ばれる新しいモデルに依存しないトレーニング手法を提案し、3段階のフレームワーク(事前学習、トップ$k$マイニング、本質的、微調整)を採用する。 WSLRec は、BR や ItemCF のようなモデルフリーメソッドから、余分な弱い監督のモデルを事前訓練することで、不完全性の問題を解決すると同時に、最上位の$k のマイニングを活用して、微調整のための弱い監督の信頼性の高いユーザ・イテム関連を検査することで、不正確な問題を解消する。
論文参考訳（メタデータ） (2022-02-28T08:55:12Z)
Towards Streaming Egocentric Action Anticipation [23.9991007631236]
エゴセントリックなアクション予測は、カメラ装着者が過去のビデオ観察に基づいて実行するであろう未来のアクションを予測するタスクである。現在の評価スキームは、予測をオフラインにできるので、計算資源は制限されないと仮定している。本稿では,パフォーマンス評価のためのモデルランタイムを明示的に検討した,ストリーミングのエゴセントリックなアクション予測評価プロトコルを提案する。
論文参考訳（メタデータ） (2021-10-11T16:22:56Z)
COMBO: Conservative Offline Model-Based Policy Optimization [120.55713363569845]
ディープニューラルネットワークのような複雑なモデルによる不確実性推定は困難であり、信頼性が低い。我々は,サポート外状態動作の値関数を正規化するモデルベースオフラインRLアルゴリズムCOMBOを開発した。従来のオフラインモデルフリーメソッドやモデルベースメソッドと比べて、comboは一貫してパフォーマンスが良いことが分かりました。
論文参考訳（メタデータ） (2021-02-16T18:50:32Z)
Do Offline Metrics Predict Online Performance in Recommender Systems? [79.48653445643865]
6つのシミュレーション環境におけるレコメンデータの評価により,オフラインメトリクスがオンラインのパフォーマンスを予測する程度について検討した。オフラインメトリクスは、様々な環境におけるオンラインのパフォーマンスと相関している。本研究は,探索戦略の追加による影響について検討し,その有効性はレコメンデーションアルゴリズムに大きく依存していることを示す。
論文参考訳（メタデータ） (2020-11-07T01:41:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。