Fugu-MT 論文翻訳(概要): CAMMSR: Category-Guided Attentive Mixture of Experts for Multimodal Sequential Recommendation

論文の概要: CAMMSR: Category-Guided Attentive Mixture of Experts for Multimodal Sequential Recommendation

arxiv url: http://arxiv.org/abs/2603.04320v1
Date: Wed, 04 Mar 2026 17:39:35 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-05 21:29:15.43033
Title: CAMMSR: Category-Guided Attentive Mixture of Experts for Multimodal Sequential Recommendation
Title（参考訳）: CAMMSR:マルチモーダルシークエンシャルレコメンデーションの専門家のカテゴリーガイドによる注意混合
Authors: Jinfeng Xu, Zheyu Chen, Shuo Yang, Jinze Li, Hewei Wang, Yijie Li, Jianheng Tang, Yunhuai Liu, Edith C. H. Ngai,
Abstract要約: 本稿では,マルチモーダルシーケンスレコメンデーションのためのカテゴリー誘導型専門家混合モデルを提案する。中心となるCAMMSRは、専門的な項目表現を複数の視点から学習する専門家モジュールのカテゴリ誘導注意混合を導入した。 4つの公開データセットの実験は、CAMMSRが一貫して最先端のベースラインを上回っていることを示している。
参考スコア（独自算出の注目度）: 23.478610632707728
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The explosion of multimedia data in information-rich environments has intensified the challenges of personalized content discovery, positioning recommendation systems as an essential form of passive data management. Multimodal sequential recommendation, which leverages diverse item information such as text and images, has shown great promise in enriching item representations and deepening the understanding of user interests. However, most existing models rely on heuristic fusion strategies that fail to capture the dynamic and context-sensitive nature of user-modal interactions. In real-world scenarios, user preferences for modalities vary not only across individuals but also within the same user across different items or categories. Moreover, the synergistic effects between modalities-where combined signals trigger user interest in ways isolated modalities cannot-remain largely underexplored. To this end, we propose CAMMSR, a Category-guided Attentive Mixture of Experts model for Multimodal Sequential Recommendation. At its core, CAMMSR introduces a category-guided attentive mixture of experts (CAMoE) module, which learns specialized item representations from multiple perspectives and explicitly models inter-modal synergies. This component dynamically allocates modality weights guided by an auxiliary category prediction task, enabling adaptive fusion of multimodal signals. Additionally, we design a modality swap contrastive learning task to enhance cross-modal representation alignment through sequence-level augmentation. Extensive experiments on four public datasets demonstrate that CAMMSR consistently outperforms state-of-the-art baselines, validating its effectiveness in achieving adaptive, synergistic, and user-centric multimodal sequential recommendation.
Abstract（参考訳）: 情報豊富な環境でのマルチメディアデータの爆発は、パーソナライズされたコンテンツ発見の課題を強化し、レコメンデーションシステムを受動的データ管理の不可欠な形態として位置づけている。テキストや画像などの多様な項目情報を活用するマルチモーダルシーケンシャルレコメンデーションは,項目表現の充実とユーザ関心の深化に大きく貢献している。しかし、既存のモデルのほとんどは、ユーザ・モーダル相互作用の動的で文脈に敏感な性質を捉えないヒューリスティックな融合戦略に依存している。現実のシナリオでは、モダリティに対するユーザの嗜好は個人によって異なるだけでなく、異なる項目やカテゴリで同じユーザ内でも異なる。さらに、モダリティ間の相乗効果により、孤立したモダリティがほとんど探索されていない方法でユーザー関心が引き起こされる。そこで我々は,CAMMSRを提案する。CAMMSRは多モードシーケンスレコメンデーションのためのカテゴリー誘導型アクテナティブ・ミックス・オブ・エキスパートモデルである。中心となるCAMMSRは、複数の視点から特殊アイテム表現を学習し、モーダル間のシナジーを明示的にモデル化するCAMoEモジュールのカテゴリ誘導注意混合を導入している。このコンポーネントは、補助圏予測タスクによって導かれるモダリティ重みを動的に割り当て、マルチモーダル信号の適応的な融合を可能にする。さらに、シーケンスレベルの拡張により、モーダル間表現アライメントを強化するために、モダリティスワップコントラッシブ学習タスクを設計する。 4つの公開データセットに対する大規模な実験により、CAMMSRは最先端のベースラインを一貫して上回り、適応性、相乗性、ユーザ中心のマルチモーダルシーケンシャルレコメンデーションを達成する効果を検証している。

関連論文リスト

PRISM: Personalized Recommendation via Information Synergy Module [12.797662213207936]
PRISMはシーケンシャルレコメンデーション(SR)のためのプラグイン・アンド・プレイフレームワークであるマルチモーダル情報をユニークで冗長でシナジスティックなコンポーネントに分解する。 4つのデータセットと3つのSRバックボーンの実験は、その有効性と汎用性を示している。
論文参考訳（メタデータ） (2026-01-16T02:17:54Z)
Structurally Refined Graph Transformer for Multimodal Recommendation [13.296555757708298]
構造的に最適化されたマルチモーダルレコメンデーションモデルSRGFormerを提案する。モデルへのより良い統合のためにトランスフォーマーを変更することで、ユーザの全体的な行動パターンをキャプチャします。そして,マルチモーダル情報をハイパーグラフ構造に埋め込み,ユーザとアイテム間の局所構造を学習する。
論文参考訳（メタデータ） (2025-11-01T15:18:00Z)
Revisiting scalable sequential recommendation with Multi-Embedding Approach and Mixture-of-Experts [15.976682531132676]
本稿では,Mixture-of-Experts(MoE)アーキテクチャとマルチ埋め込み戦略を統合するフレームワークであるFuxi-MMEを提案する。具体的には, 従来の単一埋込行列を複数の低次元埋込行列に分解する。
論文参考訳（メタデータ） (2025-10-29T08:42:15Z)
Semantic Gaussian Mixture Variational Autoencoder for Sequential Recommendation [49.492451800322144]
本稿では,VAEに基づくシークエンシャルレコメンデーションモデルであるSIGMAを提案する。 SIGMAは多利活用のための確率的多利抽出モジュールを含む。公開データセットの実験では、SIGMAの有効性が示されている。
論文参考訳（メタデータ） (2025-02-22T08:29:52Z)
LLM-based Bi-level Multi-interest Learning Framework for Sequential Recommendation [54.396000434574454]
本稿では,暗黙的行動と明示的意味論的視点を組み合わせた新しい多目的SRフレームワークを提案する。 Implicit Behavioral Interest ModuleとExplicit Semantic Interest Moduleの2つのモジュールが含まれている。 4つの実世界のデータセットの実験は、フレームワークの有効性と実用性を検証する。
論文参考訳（メタデータ） (2024-11-14T13:00:23Z)
BiVRec: Bidirectional View-based Multimodal Sequential Recommendation [55.87443627659778]
我々は,IDとマルチモーダルの両方で推薦タスクを共同で訓練する,革新的なフレームワークであるBivRecを提案する。 BivRecは5つのデータセットで最先端のパフォーマンスを達成し、様々な実用的な利点を示している。
論文参考訳（メタデータ） (2024-02-27T09:10:41Z)
Exploiting Modality-Specific Features For Multi-Modal Manipulation Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文参考訳（メタデータ） (2023-09-22T06:55:41Z)
MISSRec: Pre-training and Transferring Multi-modal Interest-aware Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文参考訳（メタデータ） (2023-08-22T04:06:56Z)
Knowledge-Enhanced Hierarchical Graph Transformer Network for Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。 KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。 KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2021-10-08T09:44:00Z)
Graph Meta Network for Multi-Behavior Recommendation [24.251784947151755]
本稿では,マルチビヘイビアパターンモデリングをメタラーニングパラダイムに組み込むために,グラフメタネットワークを用いたマルチビヘイビアレコメンデーションフレームワークを提案する。我々の開発したMB-GMNは、型に依存した行動表現を明らかにする能力により、ユーザ-イテム相互作用学習を増強する。
論文参考訳（メタデータ） (2021-10-08T08:38:27Z)
Abstractive Sentence Summarization with Guidance of Selective Multimodal Reference [3.505062507621494]
モーダル間の相互関係を考慮したマルチモーダル階層選択変換器(mhsf)モデルを提案する。提案したmhsfモデルの汎用性を,事前学習+微調整および新鮮トレーニング戦略を用いて評価した。
論文参考訳（メタデータ） (2021-08-11T09:59:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。