論文の概要: On the Consistency of Average Embeddings for Item Recommendation
- arxiv url: http://arxiv.org/abs/2308.12767v2
- Date: Wed, 30 Aug 2023 15:52:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-31 16:14:04.479799
- Title: On the Consistency of Average Embeddings for Item Recommendation
- Title(参考訳): アイテムレコメンデーションにおける平均埋め込みの整合性について
- Authors: Walid Bendada and Guillaume Salha-Galvan and Romain Hennequin and
Thomas Bouab\c{c}a and Tristan Cazenave
- Abstract要約: 推奨システムにおける一般的なプラクティスは、ユーザやより高いレベルの概念を表現するために、アイテムの埋め込みを平均化することである。
そこで本研究では,建設に使用されるアイテムに対して,平均埋込量の一貫性を測定するための予測精度スコアを提案する。
- 参考スコア(独自算出の注目度): 10.77549382103745
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A prevalent practice in recommender systems consists in averaging item
embeddings to represent users or higher-level concepts in the same embedding
space. This paper investigates the relevance of such a practice. For this
purpose, we propose an expected precision score, designed to measure the
consistency of an average embedding relative to the items used for its
construction. We subsequently analyze the mathematical expression of this score
in a theoretical setting with specific assumptions, as well as its empirical
behavior on real-world data from music streaming services. Our results
emphasize that real-world averages are less consistent for recommendation,
which paves the way for future research to better align real-world embeddings
with assumptions from our theoretical setting.
- Abstract(参考訳): レコメンダシステムにおける一般的なプラクティスは、ユーザや高レベルの概念を同じ埋め込み空間で表現するための平均的なアイテム埋め込みである。
本稿では,そのような実践の関連性について考察する。
そこで本研究では,建設に使用されるアイテムに対する平均埋込量の一貫性を測定するための,予測精度スコアを提案する。
その後,音楽ストリーミングサービスにおける実世界のデータに対する経験的行動とともに,理論的な設定でこのスコアの数学的表現を解析した。
我々の研究結果は、現実世界の平均値が推奨値と一致していないことを強調し、将来の研究が現実の埋め込みと理論的な前提との整合性を高める道を開いた。
関連論文リスト
- Pessimistic Evaluation [58.736490198613154]
情報アクセスシステムの評価は,情報アクセスの伝統に沿わない実用的価値を前提としている。
我々は,最悪のケースユーティリティに着目した情報アクセスシステムの悲観的評価を提唱する。
論文 参考訳(メタデータ) (2024-10-17T15:40:09Z) - A practical generalization metric for deep networks benchmarking [4.111474233685893]
本稿では,異なるディープネットワークをベンチマークする実用的な一般化基準を提案し,理論的推定の検証のための新しいテストベッドを提案する。
その結果,分類作業におけるディープネットワークの一般化能力は,分類精度と未確認データの多様性の両方に依存していることがわかった。
利用可能な一般化推定のほとんどは,提案した実測値を用いて得られた実測値と相関しない点に注意が必要である。
論文 参考訳(メタデータ) (2024-09-02T23:38:25Z) - PredBench: Benchmarking Spatio-Temporal Prediction across Diverse Disciplines [86.36060279469304]
予測時間ネットワークの総合評価に適したベンチマークであるPredBenchを紹介する。
このベンチマークでは、広く採用されている12のメソッドと、複数のアプリケーションドメインにまたがる多様なデータセットを統合する。
その多次元評価フレームワークは、総合的なメトリクスセットで分析を広げる。
論文 参考訳(メタデータ) (2024-07-11T11:51:36Z) - Top-K Pairwise Ranking: Bridging the Gap Among Ranking-Based Measures for Multi-Label Classification [120.37051160567277]
本稿では,Top-K Pairwise Ranking(TKPR)という新しい尺度を提案する。
一連の分析により、TKPRは既存のランキングベースの尺度と互換性があることが示されている。
一方,データ依存縮約法という新しい手法に基づいて,提案手法の急激な一般化を確立する。
論文 参考訳(メタデータ) (2024-07-09T09:36:37Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Selective Mixup Fine-Tuning for Optimizing Non-Decomposable Objectives [17.10165955576643]
現在の最先端の実証技術は、実用的で非分解不能な性能目標に対して、準最適性能を提供する。
本稿では,SelMixを提案する。SelMixは,事前学習モデルに対して,選択型ミキサアップに基づく安価な微調整技術である。
提案したSelMixファインタニングにより,ベンチマーク間での様々な非分解性目標の性能が大幅に向上することがわかった。
論文 参考訳(メタデータ) (2024-03-27T06:55:23Z) - Distributional Off-Policy Evaluation for Slate Recommendations [19.22972996548473]
本研究では,スレートの非政治的性能分布を推定する手法を提案する。
本研究では,実世界のデータから構築したスレートレコメンデーションシミュレータ上で,人工データおよび人工データに対する本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-08-27T17:58:32Z) - CausPref: Causal Preference Learning for Out-of-Distribution
Recommendation [36.22965012642248]
現在のレコメンデータシステムは、現実的なシナリオにおけるユーザやアイテムの配布シフトに対して、依然として脆弱である。
本稿では,推奨特化DAG学習者を因果選好に基づく推薦フレームワークCausPrefに組み込むことを提案する。
当社のアプローチは、アウト・オブ・ディストリビューション・セッティングのタイプにおいて、ベンチマークモデルを大幅に上回っている。
論文 参考訳(メタデータ) (2022-02-08T16:42:03Z) - Set-valued classification -- overview via a unified framework [15.109906768606644]
マルチクラスのデータセットは極めて曖昧で、単一出力の予測では十分なパフォーマンスが得られない。
予測者がラベル候補のセットを予測できるようにすることで、セット値分類は、この曖昧さに対処する自然な方法を提供する。
無限サンプルの最適集合値分類戦略を提供し,データ駆動アルゴリズムを構築するための一般的なプラグイン原理を考察する。
論文 参考訳(メタデータ) (2021-02-24T14:54:07Z) - Combining Task Predictors via Enhancing Joint Predictability [53.46348489300652]
そこで本研究では,目標予測能力に基づいて参照の関連性を測定し,その関連性を高めるための新しい予測器組合せアルゴリズムを提案する。
提案アルゴリズムはベイズフレームワークを用いて,すべての参照の関連性について共同で評価する。
視覚属性ランキングとマルチクラス分類シナリオから得られた実世界の7つのデータセットの実験に基づいて,本アルゴリズムが性能向上に寄与し,既存の予測器の組み合わせアプローチの適用範囲を広くすることを示した。
論文 参考訳(メタデータ) (2020-07-15T21:58:39Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。