論文の概要: URecJPQ: Memory-efficient Multimodal Recommendation Models through RecJPQ in Large-Scale Scenarios
- arxiv url: http://arxiv.org/abs/2606.23291v1
- Date: Mon, 22 Jun 2026 13:05:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:52:25.415134
- Title: URecJPQ: Memory-efficient Multimodal Recommendation Models through RecJPQ in Large-Scale Scenarios
- Title(参考訳): URecJPQ:大規模シナリオにおけるRecJPQによるメモリ効率のよいマルチモーダルレコメンデーションモデル
- Authors: Giuseppe Spillo, Zixuan Yi, Aleksandr Petrov, Cataldo Musto, Craig Macdonald, Iadh Ounis,
- Abstract要約: 本稿では,大規模かつマルチモーダルなトップkレコメンデーションタスクに特化して設計された共同製品量子化手法URecJPQを紹介する。
中心となる考え方は、各ユーザ/イテムを、完全に学習された独自の埋め込みではなく、共有学習されたサブ埋め込みの結合として表現することである。
広く使われている3つのデータセットの実験では、URecJPQがマルチモーダルなレコメンデーション設定に効果的に適用できることが示されている。
- 参考スコア(独自算出の注目度): 52.726756906540636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training state-of-the-art recommendation models on large-scale industrial datasets can be a challenging task due to the high number of users and items which are typically represented through ID embeddings. Such embeddings typically require a large amount of memory resources, which are not always available. This problem is further exacerbated in multimodal recommendation, in which multimodal item features generally improve recommendation performance, but require more resources to encode. In this paper, we introduce URecJPQ, a Joint Product Quantization method specifically designed for large-scale and multimodal top-k recommendation tasks, in which the vast number of users and items, combined with the available modalities, further increases the memory demands for the computation. The core idea is to represent each user/item not as a fully learned, unique embedding, but rather as a concatenation of shared learned sub-embeddings, thereby significantly reducing the total number of trainable parameters. Our experiments on three widely-used datasets across different domains (movies, baby and sports products) show that URecJPQ can be effectively applied to multimodal recommendation settings. In large scale scenarios, we observe a substantial reduction in checkpoint sizes and the number of trainable parameters (ranging from 86% to 98%, and 98% to 99%, respectively), with only a marginal decrease in accuracy (8.5% on recall and 16% on NDCG, on average), and, in some cases, even performance improvements (up to 85%), as in the baby products domain. Our codebase is available at https://anonymous.4open.science/r/large_mmrecjpq-839B/README.md.
- Abstract(参考訳): 大規模産業データセット上で最先端のレコメンデーションモデルをトレーニングすることは、ID埋め込みを通じて一般的に表現される多数のユーザやアイテムのために、難しい作業になる可能性がある。
このような埋め込みは一般的に大量のメモリリソースを必要とするが、必ずしも利用できない。
この問題は、マルチモーダルな項目の特徴が一般的にレコメンデーション性能を改善するが、エンコードするためにより多くのリソースを必要とする、マルチモーダルなレコメンデーションにおいてさらに悪化している。
本稿では,大規模かつマルチモーダルなトップkレコメンデーションタスクに特化して設計された共同製品量子化手法であるURecJPQを紹介する。
中心となる考え方は、各ユーザ/イテムを、完全に学習されたユニークな埋め込みではなく、共有された学習サブ埋め込みの結合として表現し、トレーニング可能なパラメータの総数を著しく削減することである。
異なるドメイン(移動,ベビー,スポーツ製品)で広く利用されている3つのデータセットについて実験したところ,URecJPQはマルチモーダルなレコメンデーション設定に効果的に適用できることがわかった。
大規模シナリオでは,チェックポイントサイズとトレーニング可能なパラメータ(それぞれ86%から98%,98%から99%)の大幅な削減が観察され,精度は限界的に低下した(リコールでは8.5%,NDCGでは16%)。
私たちのコードベースはhttps://anonymous.4open.science/r/large_mmrecjpq-839B/README.mdで公開されています。
関連論文リスト
- Exemplar Masking for Multimodal Incremental Learning [47.18796033633918]
マルチモーダル・インクリメンタルな学習は、新しい知識を同時に学習しながら、複数のモーダルからの情報を消化する必要がある。
本稿では,従来の知識を効果的に再生するための模擬マスキングフレームワークを提案する。
我々は,従来のマスキングフレームワークが,同じメモリバッファ下での破滅的な忘れ込みに対して,より効率的で堅牢であることを示す。
論文 参考訳(メタデータ) (2024-12-12T18:40:20Z) - Mastering Collaborative Multi-modal Data Selection: A Focus on Informativeness, Uniqueness, and Representativeness [63.484378941471114]
我々は、効果的なデータ選択のために、インフォーマル性、ユニーク性、代表性という3つの重要な原則を活用するコラボレーティブフレームワーク、DataTailorを提案する。
様々なベンチマークの実験により、DataTailorはデータの15%でフルデータの微調整のパフォーマンスの101.3%を達成している。
論文 参考訳(メタデータ) (2024-12-09T08:36:10Z) - Train Once, Deploy Anywhere: Matryoshka Representation Learning for Multimodal Recommendation [27.243116376164906]
マルチモーダルレコメンデーションのための大規模Matryoshka表現学習(fMRLRec)という軽量フレームワークを導入する。
当社のfMRLRecは,複数次元にわたる効率的なレコメンデーションのための情報表現を学習し,各項目の特徴を異なる粒度で捉えている。
複数のベンチマークデータセットに対するfMRLRecの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-09-25T05:12:07Z) - Efficient Inference of Sub-Item Id-based Sequential Recommendation Models with Millions of Items [63.117573355917465]
PQTopKアルゴリズムを用いてRecJPQに基づくモデルの推論効率を改善することができることを示す。
我々は、RecJPQで強化されたSASRecを、元のSASRecの推論手法に比べて4.5倍、RecJPQコードで実装された手法に比べて1.56倍の速度で高速化する。
論文 参考訳(メタデータ) (2024-08-19T13:43:48Z) - Scalable Dynamic Embedding Size Search for Streaming Recommendation [47.69328280479569]
実世界のレコメンデーションシステムは、しばしばストリーミングレコメンデーションシナリオで機能する。
ユーザやアイテムの数は増加を続けており、かなりのストレージリソース消費につながっている。
SCALLと呼ばれるストリーミングレコメンデーション用のLightweight Embeddingsを学び、ユーザ/イテムの埋め込みサイズを適応的に調整できる。
論文 参考訳(メタデータ) (2024-07-22T06:37:24Z) - Budgeted Embedding Table For Recommender Systems [39.882452493920724]
BET(Budgeted Embedding Table)は、メモリ予算を満たすように保証されたテーブルレベルのアクションを生成する新しい方法である。
BETは、メモリ予算の異なる3つの一般的な推奨モデルと組み合わせられている。
論文 参考訳(メタデータ) (2023-10-23T12:53:22Z) - Continuous Input Embedding Size Search For Recommender Systems [60.89189829112067]
連続入力埋め込みサイズ探索(CIESS)は、任意の埋め込みサイズを選択可能な連続探索空間上で動作する新しいRLベースの手法である。
CIESSはモデルに依存しないため、様々な潜在因子RSに一般化できる。
2つの実世界のデータセットに関する実験では、異なるメモリ予算の下でCIESSの最先端のパフォーマンスが示されている。
論文 参考訳(メタデータ) (2023-04-07T06:46:37Z) - M2TRec: Metadata-aware Multi-task Transformer for Large-scale and
Cold-start free Session-based Recommendations [9.327321259021236]
セッションベース推薦システム(SBRS)は従来の手法よりも優れた性能を示した。
セッションベースレコメンデーションのためのメタデータ対応マルチタスクトランスフォーマモデルであるM2TRecを提案する。
論文 参考訳(メタデータ) (2022-09-23T19:34:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。