論文の概要: Measuring the stability and plasticity of recommender systems
- arxiv url: http://arxiv.org/abs/2508.03941v1
- Date: Tue, 05 Aug 2025 22:15:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.462151
- Title: Measuring the stability and plasticity of recommender systems
- Title(参考訳): レコメンデーションシステムの安定性と塑性の測定
- Authors: Maria João Lavoura, Robert Jungnickel, João Vinagre,
- Abstract要約: 本稿では,レコメンデーションモデルが再訓練されたときにどのように振る舞うかを研究する方法論を提案する。
その考え方は、過去のパターンを保持する能力に応じてアルゴリズムをプロファイリングすることだ。
予備的な結果は,アルゴリズムの手法によって安定性と可塑性のプロファイルが異なることを示している。
- 参考スコア(独自算出の注目度): 0.4551615447454769
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The typical offline protocol to evaluate recommendation algorithms is to collect a dataset of user-item interactions and then use a part of this dataset to train a model, and the remaining data to measure how closely the model recommendations match the observed user interactions. This protocol is straightforward, useful and practical, but it only captures performance of a particular model trained at some point in the past. We know, however, that online systems evolve over time. In general, it is a good idea that models reflect such changes, so models are frequently retrained with recent data. But if this is the case, to what extent can we trust previous evaluations? How will a model perform when a different pattern (re)emerges? In this paper we propose a methodology to study how recommendation models behave when they are retrained. The idea is to profile algorithms according to their ability to, on the one hand, retain past patterns -- stability -- and, on the other hand, (quickly) adapt to changes -- plasticity. We devise an offline evaluation protocol that provides detail on the long-term behavior of models, and that is agnostic to datasets, algorithms and metrics. To illustrate the potential of this framework, we present preliminary results of three different types of algorithms on the GoodReads dataset that suggest different stability and plasticity profiles depending on the algorithmic technique, and a possible trade-off between stability and plasticity.Although additional experiments will be necessary to confirm these observations, they already illustrate the usefulness of the proposed framework to gain insights on the long term dynamics of recommendation models.
- Abstract(参考訳): レコメンデーションアルゴリズムを評価する典型的なオフラインプロトコルは、ユーザとイテムのインタラクションのデータセットを収集し、このデータセットの一部を使用してモデルをトレーニングし、残りのデータを使用して、モデルレコメンデーションが観察されたユーザインタラクションにどの程度近いかを測定することである。
このプロトコルは単純で有用で実用的ですが、過去にトレーニングされた特定のモデルのパフォーマンスのみをキャプチャします。
しかし、オンラインシステムは時間とともに進化していく。
一般に、モデルがそのような変化を反映していることは良い考えなので、モデルは最近のデータで頻繁に再訓練される。
しかし、もしそうなら、これまでの評価をどの程度信頼できますか?
異なるパターン(re)がエマージされた場合、モデルはどのように機能しますか?
本稿では,リトレーニング時にレコメンデーションモデルがどのように振る舞うかを研究する手法を提案する。
アルゴリズムのプロファイリングは,一方では過去のパターン – 安定性 – を維持し,一方では(少なくとも)変化に適応する – 可塑性 – を維持する能力に応じて,アルゴリズムをプロファイリングする,という考え方だ。
我々は、モデルの長期的な振る舞いの詳細を提供するオフライン評価プロトコルを考案し、データセット、アルゴリズム、メトリクスに依存しない。
このフレームワークの可能性を説明するため,GoodReadsデータセット上で,アルゴリズム技術による安定性と可塑性プロファイルの相違,安定性と可塑性のトレードオフを示唆する3種類のアルゴリズムの予備的な結果を示す。
関連論文リスト
- Discrete-event Tensor Factorization: Learning a Smooth Embedding for Continuous Domains [0.0]
本稿では、因子化スタイルのレコメンデーションモデルにおいて、時間がどのように符号化されるかを分析する。
機能として絶対時間を含めることで、私たちのモデルはさまざまなユーザの好みを学習し、時間とともにアイテムの知覚を変化させることができます。
論文 参考訳(メタデータ) (2025-08-06T08:54:57Z) - Slow Thinking for Sequential Recommendation [88.46598279655575]
本稿では,STREAM-Recという新しいスローシンキングレコメンデーションモデルを提案する。
弊社のアプローチは、過去のユーザの振る舞いを分析し、多段階の熟考的推論プロセスを生成し、パーソナライズされたレコメンデーションを提供する。
具体的には,(1)レコメンデーションシステムにおける適切な推論パターンを特定すること,(2)従来のレコメンデーションシステムの推論能力を効果的に刺激する方法を検討すること,の2つの課題に焦点を当てる。
論文 参考訳(メタデータ) (2025-04-13T15:53:30Z) - Has Your Pretrained Model Improved? A Multi-head Posterior Based
Approach [25.927323251675386]
我々は、世界的知識の源として各エンティティに関連するメタ機能を活用し、モデルからエンティティ表現を採用する。
本稿では,これらの表現とメタ機能との整合性を,事前学習モデルの評価指標として用いることを提案する。
提案手法の有効性は,関係データセットを用いたモデル,大規模言語モデル,画像モデルなど,様々な領域で実証されている。
論文 参考訳(メタデータ) (2024-01-02T17:08:26Z) - Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - Dataless Knowledge Fusion by Merging Weights of Language Models [47.432215933099016]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文 参考訳(メタデータ) (2022-12-19T20:46:43Z) - How do I update my model? On the resilience of Predictive Process
Monitoring models to change [15.29342790344802]
予測プロセスモニタリング技術は通常、過去のプロセス実行に基づいて予測モデルを構築し、それを新しい進行中のケースの将来を予測するために使用します。
これにより、予測的プロセスモニタリングは、実際の環境で動作するプロセスの変動に対処するには厳格すぎる。
予測モデルの定期的な再検討や漸進的な構築を可能にする3つの戦略の活用を評価した。
論文 参考訳(メタデータ) (2021-09-08T08:50:56Z) - Contrastive Self-supervised Sequential Recommendation with Robust
Augmentation [101.25762166231904]
Sequential Recommendation Describes a set of technique to model dynamic user behavior to order to predict future interaction in sequence user data。
データスパーシリティやノイズの多いデータなど、古くて新しい問題はまだ残っている。
逐次レコメンデーション(CoSeRec)のためのコントラスト型自己監督学習を提案する。
論文 参考訳(メタデータ) (2021-08-14T07:15:25Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z) - Modeling Online Behavior in Recommender Systems: The Importance of
Temporal Context [30.894950420437926]
推薦システムの性能を評価するときの時間的文脈の省略が、いかに誤った自信をもたらすかを示す。
既存のモデルに時間的文脈をさらに埋め込むためのトレーニング手順を提案する。
その結果、時間的目標を含めれば、リコール@20を最大20%改善できることがわかった。
論文 参考訳(メタデータ) (2020-09-19T19:36:43Z) - S^3-Rec: Self-Supervised Learning for Sequential Recommendation with
Mutual Information Maximization [104.87483578308526]
本稿では,シーケンスレコメンデーションのための自己改善学習のためのモデルS3-Recを提案する。
そこで本稿では,属性,項目,サブシーケンス,シーケンス間の相関関係を学習するために,4つの補助的自己教師対象を考案する。
6つの実世界のデータセットで実施された大規模な実験は、既存の最先端手法よりも提案手法が優れていることを示す。
論文 参考訳(メタデータ) (2020-08-18T11:44:10Z) - Amortized Bayesian model comparison with evidential deep learning [0.12314765641075436]
本稿では,専門的なディープラーニングアーキテクチャを用いたベイズモデルの比較手法を提案する。
提案手法は純粋にシミュレーションベースであり,観測された各データセットに対して,すべての代替モデルを明示的に適合させるステップを回避している。
提案手法は,本研究で検討した事例に対して,精度,キャリブレーション,効率の点で優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2020-04-22T15:15:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。