論文の概要: Accelerating Generative Recommendation via Simple Categorical User Sequence Compression
- arxiv url: http://arxiv.org/abs/2601.19158v1
- Date: Tue, 27 Jan 2026 03:45:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 14:01:27.621586
- Title: Accelerating Generative Recommendation via Simple Categorical User Sequence Compression
- Title(参考訳): 単純分類型ユーザシーケンス圧縮による生成レコメンデーションの高速化
- Authors: Qijiong Liu, Lu Fan, Zhongzhou Liu, Xiaoyu Dong, Yuankai Luo, Guoyuan An, Nuo Chen, Wei Guo, Yong Liu, Xiao-Ming Wu,
- Abstract要約: 本稿では,アイテムカテゴリーの特徴を生かして,長期的ユーザ履歴を圧縮する手法を提案する。
提案手法は,計算コストを最大6倍に削減し,比較コストで最大39%の精度を実現する。
- 参考スコア(独自算出の注目度): 34.57254338096061
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although generative recommenders demonstrate improved performance with longer sequences, their real-time deployment is hindered by substantial computational costs. To address this challenge, we propose a simple yet effective method for compressing long-term user histories by leveraging inherent item categorical features, thereby preserving user interests while enhancing efficiency. Experiments on two large-scale datasets demonstrate that, compared to the influential HSTU model, our approach achieves up to a 6x reduction in computational cost and up to 39% higher accuracy at comparable cost (i.e., similar sequence length).
- Abstract(参考訳): 生成レコメンデータは、より長いシーケンスでパフォーマンスの向上を示すが、リアルタイムデプロイメントは相当な計算コストによって妨げられる。
この課題に対処するために、本研究では、固有の項目分類的特徴を活用して、長期間のユーザ履歴を圧縮し、効率を向上しながら、ユーザの興味を保ちながら保存する、シンプルかつ効果的な方法を提案する。
2つの大規模データセットの実験により、HSTUモデルと比較すると、計算コストの最大6倍の削減と、同等のコスト(すなわち、類似のシーケンス長)で最大39%の精度を実現することが示されている。
関連論文リスト
- BlossomRec: Block-level Fused Sparse Attention Mechanism for Sequential Recommendations [29.069570226262073]
トランスフォーマー構造はシーケンシャルレコメンデータシステム(SRS)で広く使われている。
BlossomRecは、様々な長さのシーケンスで安定したパフォーマンスを達成するために、注意を通して長期と短期の両方のユーザー興味をモデル化する。
論文 参考訳(メタデータ) (2025-12-15T14:23:57Z) - Cost-Aware Retrieval-Augmentation Reasoning Models with Adaptive Retrieval Depth [18.05278637533445]
本稿では,検索した文書リストの長さを動的に調整する検索拡張推論モデルを提案する。
我々は、強化学習による効率的な検索強化推論モデルの訓練のための費用対効果関数を開発する。
提案手法を7つの公開質問応答データセットで評価し,有効性を損なうことなく,高い効率性を示す。
論文 参考訳(メタデータ) (2025-10-17T15:04:03Z) - Maximum Impact with Fewer Features: Efficient Feature Selection for Cold-Start Recommenders through Collaborative Importance Weighting [0.6827423171182154]
ユーザの行動情報を優先する特徴選択戦略を提案する。
本手法は協調行動データから相関関係を組み込むことにより特徴表現を向上させる。
このアプローチは最も影響力のある特徴を特定し、推奨精度と計算効率のバランスを崩す。
論文 参考訳(メタデータ) (2025-08-08T16:58:47Z) - ELASTIC: Efficient Linear Attention for Sequential Interest Compression [5.689306819772134]
最先端のシーケンシャルレコメンデーションモデルは、トランスフォーマーの注意機構に大きく依存している。
逐次的関心圧縮のための効率的な線形注意法であるELASTICを提案する。
我々は、様々な公開データセットに関する広範な実験を行い、それをいくつかの強力なシーケンシャルなレコメンデータと比較する。
論文 参考訳(メタデータ) (2024-08-18T06:41:46Z) - S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching [51.38617149946765]
本稿ではスムースなスケルトンスケッチに基づくアテンション構造S$3$Attentionを提案する。
S$3$Attentionは、線形複雑性をシーケンス長に保ちながら、ノイズの影響を効果的に最小化する2つのメカニズムを持つ。
論文 参考訳(メタデータ) (2024-08-16T07:01:46Z) - Cost-Sensitive Multi-Fidelity Bayesian Optimization with Transfer of Learning Curve Extrapolation [55.75188191403343]
各ユーザが事前に定義した機能であるユーティリティを導入し,BOのコストと性能のトレードオフについて述べる。
このアルゴリズムをLCデータセット上で検証した結果,従来のマルチファイルBOや転送BOベースラインよりも優れていた。
論文 参考訳(メタデータ) (2024-05-28T07:38:39Z) - Correlate-and-Excite: Real-Time Stereo Matching via Guided Cost Volume
Excitation [65.83008812026635]
本稿では,GCE ( Guided Cost Volume Excitation) を構築し,画像によって誘導されるコストボリュームの簡単なチャネル励磁により,性能が大幅に向上することを示す。
我々はCorrelate-and-Excite(CoEx)と呼ぶエンドツーエンドネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-12T14:32:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。