論文の概要: LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation
- arxiv url: http://arxiv.org/abs/2506.17966v1
- Date: Sun, 22 Jun 2025 09:53:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.674686
- Title: LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation
- Title(参考訳): LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation
- Authors: Wangyu Wu, Zhenhong Chen, Xianglin Qiu, Siqi Song, Xiaowei Huang, Fei Ma, Jimin Xiao,
- Abstract要約: クロスドメインシークエンシャルレコメンデーション(CDSR)は、複数のドメインにわたる歴史的なインタラクションを活用することで、ユーザの振る舞いを予測する。
我々は,LLM-EMF(クロスドメインシーケンスレコメンデーション)のためのLLM強化多モード核融合を提案する。
LLM-EMFは、LLM(Large Language Models)の知識でテキスト情報を強化する新しい高度なアプローチである。
- 参考スコア(独自算出の注目度): 19.654959889052638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-Domain Sequential Recommendation (CDSR) predicts user behavior by leveraging historical interactions across multiple domains, focusing on modeling cross-domain preferences and capturing both intra- and inter-sequence item relationships. We propose LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation (LLM-EMF), a novel and advanced approach that enhances textual information with Large Language Models (LLM) knowledge and significantly improves recommendation performance through the fusion of visual and textual data. Using the frozen CLIP model, we generate image and text embeddings, thereby enriching item representations with multimodal data. A multiple attention mechanism jointly learns both single-domain and cross-domain preferences, effectively capturing and understanding complex user interests across diverse domains. Evaluations conducted on four e-commerce datasets demonstrate that LLM-EMF consistently outperforms existing methods in modeling cross-domain user preferences, thereby highlighting the effectiveness of multimodal data integration and its advantages in enhancing sequential recommendation systems. Our source code will be released.
- Abstract(参考訳): クロスドメインシーケンスレコメンデーション(CDSR)は、複数のドメインにわたる歴史的相互作用を活用し、ドメイン間の嗜好をモデル化し、シーケンス内およびシーケンス間アイテムの関係をキャプチャすることに焦点を当て、ユーザの振る舞いを予測する。
LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation (LLM-EMF) は,Large Language Models (LLM) 知識によるテキスト情報を強化し,ビジュアルデータとテキストデータの融合による推奨性能を著しく向上する,新規かつ先進的なアプローチである。
凍結したCLIPモデルを用いて、画像とテキストの埋め込みを生成し、マルチモーダルデータでアイテム表現を豊かにする。
マルチアテンションメカニズムは、単一ドメインとクロスドメインの両方の好みを共同で学習し、多様なドメインにわたる複雑なユーザの関心を効果的に捉え、理解する。
4つの電子商取引データセットを用いて行った評価から、LLM-EMFはドメイン間ユーザの嗜好をモデル化する既存の手法より一貫して優れており、マルチモーダルデータ統合の有効性とシーケンシャルレコメンデーションシステムの強化におけるその優位性を強調している。
ソースコードはリリースされます。
関連論文リスト
- Hierarchical Attention Fusion of Visual and Textual Representations for Cross-Domain Sequential Recommendation [19.654959889052638]
クロスドメインシークエンシャルレコメンデーション(CDSR)は、複数のドメインにわたる歴史的なインタラクションを活用することで、ユーザの振る舞いを予測する。
本稿では,視覚的・テキスト的表現の階層的意図融合(HAF-VT)を提案する。
階層的な注意機構は、人間の情報統合を模倣して、単一ドメインとクロスドメインの好みを共同で学習する。
論文 参考訳(メタデータ) (2025-04-21T13:18:54Z) - AgentCF++: Memory-enhanced LLM-based Agents for Popularity-aware Cross-domain Recommendations [28.559223475725137]
LLMベースのユーザエージェントは、レコメンダシステムを強化するための有望なアプローチとして現れつつある。
本稿では,2段階融合機構と組み合わせた2層メモリアーキテクチャを提案する。
また、関心グループの概念やグループ共有メモリを導入し、類似の関心を持つユーザに対する人気要因の影響をよりよく把握する。
論文 参考訳(メタデータ) (2025-02-19T16:02:59Z) - Image Fusion for Cross-Domain Sequential Recommendation [20.37668418178215]
Cross-Domain Sequential Recommendationは、複数のドメインにわたる過去のインタラクションに基づいて、将来のユーザインタラクションを予測することを目的としている。
CDSRの鍵となる課題は、シーケンス内とシーケンス間の両方の相互作用を十分に活用することで、ドメイン間のユーザの好みを効果的に捉えることである。
本稿では、アイテム画像情報を組み込んで視覚的嗜好をよりよく捉えた画像融合(IFCDSR)を提案する。
論文 参考訳(メタデータ) (2024-12-31T02:44:38Z) - Investigating the potential of Sparse Mixtures-of-Experts for multi-domain neural machine translation [59.41178047749177]
トレーニング中に見られるさまざまなドメインのデータを扱うことができ、トレーニング中に見つからないドメインに対して堅牢な効率的なモデルを開発することを目的として、マルチドメインニューラルネットワーク翻訳に重点を置いている。
SMOE(Sparse Mixture-of-Experts)モデルは、効率的なモデルスケーリングを可能にするため、このタスクに適していると仮定する。
マルチドメインシナリオにおけるSMoEの有用性を検証するための一連の実験を行い、Transformerの簡単な幅スケーリングは、実際はよりシンプルで驚くほど効率的なアプローチであり、SMoEと同等の性能レベルに達することを発見した。
論文 参考訳(メタデータ) (2024-07-01T09:45:22Z) - Exploring User Retrieval Integration towards Large Language Models for Cross-Domain Sequential Recommendation [66.72195610471624]
Cross-Domain Sequential Recommendationは、異なるドメイン間でユーザのシーケンシャルな好みをマイニングし、転送することを目的としている。
本稿では,ユーザ検索手法を探索し,CDSRの性能向上を目的とした URLLM という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T09:19:54Z) - MM-GEF: Multi-modal representation meet collaborative filtering [43.88159639990081]
本稿では,グラフアーリーフュージョンを用いたマルチモーダルレコメンデーション MM-GEF を提案する。
MM-GEFはマルチモーダル信号と協調信号の両方から得られる構造情報を注入することにより、洗練された項目表現を学習する。
論文 参考訳(メタデータ) (2023-08-14T15:47:36Z) - Exploiting Graph Structured Cross-Domain Representation for Multi-Domain
Recommendation [71.45854187886088]
マルチドメインレコメンデータシステムは、クロスドメイン表現学習とポジティブな知識伝達の恩恵を受ける。
我々はMAGRecと呼ばれる手法のコンテキスト情報として時間的ドメイン内相互作用とドメイン間相互作用を用いる。
我々は、MAGRecが最先端の手法を一貫して上回る様々なシナリオで、公開データセットで実験を行う。
論文 参考訳(メタデータ) (2023-02-12T19:51:32Z) - Dual Attentive Sequential Learning for Cross-Domain Click-Through Rate
Prediction [76.98616102965023]
クロスドメインレコメンダシステムは、コールドスタートとスパシティの問題に対処するための強力な方法である。
本稿では,二元学習機構に基づくクロスドメインシーケンシャルなレコメンデーション手法を提案する。
論文 参考訳(メタデータ) (2021-06-05T01:21:21Z) - Learning to Combine: Knowledge Aggregation for Multi-Source Domain
Adaptation [56.694330303488435]
マルチソースドメイン適応(LtC-MSDA)フレームワークを併用する学習法を提案する。
簡単に言うと、知識グラフは様々なドメインのプロトタイプ上に構築され、セマンティックに隣接した表現間の情報伝達を実現する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-07-17T07:52:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。