論文の概要: MoToRec: Sparse-Regularized Multimodal Tokenization for Cold-Start Recommendation
- arxiv url: http://arxiv.org/abs/2602.11062v1
- Date: Wed, 11 Feb 2026 17:31:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:02.244671
- Title: MoToRec: Sparse-Regularized Multimodal Tokenization for Cold-Start Recommendation
- Title(参考訳): MoToRec:コールドスタート勧告のためのスパース規則化マルチモーダルトークン化
- Authors: Jialin Liu, Zhaorui Zhang, Ray C. C. Cheung,
- Abstract要約: コールドスタート勧告(MoToRec)のためのスパース規則化マルチモーダルトークン化を提案する。
MoToRecは、離散的、解釈可能なトークンの合成意味コードを生成する疎正規化Residual Quantized Variational Autoencoder(RQ-VAE)を中心としたフレームワークである。
3つの大規模なデータセットに対する大規模な実験は、全体的なシナリオとコールドスタートシナリオの両方において、MoToRecが最先端の手法よりも優れていることを示している。
- 参考スコア(独自算出の注目度): 6.78317230214304
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph neural networks (GNNs) have revolutionized recommender systems by effectively modeling complex user-item interactions, yet data sparsity and the item cold-start problem significantly impair performance, particularly for new items with limited or no interaction history. While multimodal content offers a promising solution, existing methods result in suboptimal representations for new items due to noise and entanglement in sparse data. To address this, we transform multimodal recommendation into discrete semantic tokenization. We present Sparse-Regularized Multimodal Tokenization for Cold-Start Recommendation (MoToRec), a framework centered on a sparsely-regularized Residual Quantized Variational Autoencoder (RQ-VAE) that generates a compositional semantic code of discrete, interpretable tokens, promoting disentangled representations. MoToRec's architecture is enhanced by three synergistic components: (1) a sparsely-regularized RQ-VAE that promotes disentangled representations, (2) a novel adaptive rarity amplification that promotes prioritized learning for cold-start items, and (3) a hierarchical multi-source graph encoder for robust signal fusion with collaborative signals. Extensive experiments on three large-scale datasets demonstrate MoToRec's superiority over state-of-the-art methods in both overall and cold-start scenarios. Our work validates that discrete tokenization provides an effective and scalable alternative for mitigating the long-standing cold-start challenge.
- Abstract(参考訳): グラフニューラルネットワーク(GNN)は、複雑なユーザとイテムのインタラクションを効果的にモデル化することで、リコメンダシステムに革命をもたらした。
マルチモーダルコンテンツは有望な解決策を提供するが、既存の手法はスパースデータのノイズや絡み合いによる新しい項目の最適下表現をもたらす。
これを解決するために、マルチモーダルなレコメンデーションを個別なセマンティックトークン化に変換する。
本稿では、離散的に解釈可能なトークンの合成意味コードを生成し、不整合表現を促進するスパース正規化Residual Quantized Variational Autoencoder(RQ-VAE)を中心としたフレームワークであるMoToRecについて述べる。
MoToRecのアーキテクチャは,(1)不整合表現を促進する疎正規化RQ-VAE,(2)コールドスタート項目の優先学習を促進する適応ラリティ増幅,(3)コラボレーティブな信号融合のための階層型マルチソースグラフエンコーダの3つの相乗的コンポーネントによって強化されている。
3つの大規模なデータセットに対する大規模な実験は、全体的なシナリオとコールドスタートシナリオの両方において、MoToRecが最先端の手法よりも優れていることを示している。
我々の研究は、離散トークン化が長期にわたるコールドスタートの課題を緩和するための効果的でスケーラブルな代替手段であることを示す。
関連論文リスト
- Multimodal Generative Recommendation for Fusing Semantic and Collaborative Signals [17.608491612845306]
逐次リコメンデータシステムは、ユーザのインタラクション履歴をモデル化し、結果のユーザ表現とストアドアイテムの埋め込みの間の内部積を計算することで、関連する項目をランク付けする。
大きなアイテムを格納する際のメモリオーバーヘッドを大幅に回避するため、生成推奨パラダイムは、各アイテムを独立したセマンティックコードとしてモデル化する。
これらのメソッドは、大きなアイテムセットの伝統的なシーケンシャルなレコメンデータを超えておらず、それらが対処するように設計されたシナリオでの採用を制限する。
マルチモーダル・セマンティック・コラボレーション・ジェネレーティブ・レコメンダであるMSCGRecを提案する。
論文 参考訳(メタデータ) (2026-02-03T16:39:35Z) - M-$LLM^3$REC: A Motivation-Aware User-Item Interaction Framework for Enhancing Recommendation Accuracy with LLMs [0.5735035463793009]
本稿では,M-$LLM3$RECと呼ばれる新しいレコメンデーションフレームワークを提案する。
モチベーション駆動のセマンティックモデリングを強調することで、M-$LLM3$RECは堅牢でパーソナライズされ、一般化可能なレコメンデーションを示す。
論文 参考訳(メタデータ) (2025-08-21T05:50:13Z) - FindRec: Stein-Guided Entropic Flow for Multi-Modal Sequential Recommendation [57.577843653775]
textbfFindRec (textbfFlexible unified textbfinformation textbfdisentanglement for multi-modal sequence textbfRecommendation)を提案する。
Stein kernel-based Integrated Information Coordination Module (IICM) は理論上、マルチモーダル特徴とIDストリーム間の分散一貫性を保証する。
マルチモーダル特徴を文脈的関連性に基づいて適応的にフィルタリング・結合するクロスモーダル・エキスパート・ルーティング機構。
論文 参考訳(メタデータ) (2025-07-07T04:09:45Z) - SpecRouter: Adaptive Routing for Multi-Level Speculative Decoding in Large Language Models [21.933379266533098]
大規模言語モデル(LLM)は、推論品質と計算コストの間に重要なトレードオフをもたらす。
既存のサービス戦略では、固定されたモデルスケールや静的な2段階の投機的デコードを用いることが多い。
本稿では,LLM推論を適応的ルーティング問題として再定義する新しいフレームワークであるsystemnameを紹介する。
論文 参考訳(メタデータ) (2025-05-12T15:46:28Z) - Towards Generalizable Trajectory Prediction Using Dual-Level Representation Learning And Adaptive Prompting [107.4034346788744]
既存の車両軌道予測モデルは、一般化可能性、予測の不確実性、複雑な相互作用を扱う。
本研究では,(1)自己拡張(SD)とマスドレコンストラクション(MR)による二重レベル表現学習,グローバルコンテキストと細部の詳細の収集,(2)レジスタベースのクエリと事前学習の強化,クラスタリングと抑圧の必要性の排除,(3)微調整中の適応型プロンプトチューニング,メインアーキテクチャの凍結,および少数のプロンプトの最適化といった,新たなトラジェクタ予測フレームワークであるPerceiverを提案する。
論文 参考訳(メタデータ) (2025-01-08T20:11:09Z) - Pre-train, Align, and Disentangle: Empowering Sequential Recommendation with Large Language Models [26.331324261505486]
Sequential Recommendation (SR) は、ユーザの過去のインタラクションにおけるシーケンシャルなパターンを活用して、ユーザの好みを正確に追跡することを目的としている。
大規模言語モデル(LLM)の有効性が証明されているにもかかわらず、商用レコメンデータシステムへの統合は妨げられている。
我々は,LLMを用いたSRモデルを強化するために,新しいPri-train,Align,Disentangle(PAD)フレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-05T12:17:56Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - Diffusion Recommender Model [85.9640416600725]
そこで我々は,DiffRecと呼ばれる新しい拡散レコメンダモデルを提案し,その生成過程を認知的に学習する。
ユーザインタラクションにおけるパーソナライズされた情報を維持するため、DiffRecは追加のノイズを低減し、画像合成のような純粋なノイズに対するユーザのインタラクションを損なうことを避ける。
論文 参考訳(メタデータ) (2023-04-11T04:31:00Z) - Learning to Learn a Cold-start Sequential Recommender [70.5692886883067]
コールドスタート勧告は、現代のオンラインアプリケーションにおいて緊急の問題である。
メタ学習に基づくコールドスタートシーケンシャルレコメンデーションフレームワークMetaCSRを提案する。
MetaCSRは、通常のユーザの行動から共通のパターンを学ぶ能力を持っている。
論文 参考訳(メタデータ) (2021-10-18T08:11:24Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。