論文の概要: Distribution-Guided Auto-Encoder for User Multimodal Interest Cross Fusion
- arxiv url: http://arxiv.org/abs/2508.14485v1
- Date: Wed, 20 Aug 2025 07:21:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.373021
- Title: Distribution-Guided Auto-Encoder for User Multimodal Interest Cross Fusion
- Title(参考訳): マルチモーダル・インターフュージョン用配電誘導オートエンコーダ
- Authors: Moyu Zhang, Yongxiang Tang, Yujun Jin, Jinxin Hu, Yu Zhang,
- Abstract要約: 本稿では,DMAE(Distributed-Guided Multimodal-Interest Auto-Encoder)を提案する。
- 参考スコア(独自算出の注目度): 3.5015430462759936
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional recommendation methods rely on correlating the embedding vectors of item IDs to capture implicit collaborative filtering signals to model the user's interest in the target item. Consequently, traditional ID-based methods often encounter data sparsity problems stemming from the sparse nature of ID features. To alleviate the problem of item ID sparsity, recommendation models incorporate multimodal item information to enhance recommendation accuracy. However, existing multimodal recommendation methods typically employ early fusion approaches, which focus primarily on combining text and image features, while neglecting the contextual influence of user behavior sequences. This oversight prevents dynamic adaptation of multimodal interest representations based on behavioral patterns, consequently restricting the model's capacity to effectively capture user multimodal interests. Therefore, this paper proposes the Distribution-Guided Multimodal-Interest Auto-Encoder (DMAE), which achieves the cross fusion of user multimodal interest at the behavioral level.Ultimately, extensive experiments demonstrate the superiority of DMAE.
- Abstract(参考訳): 従来のレコメンデーション方法は、ターゲットアイテムに対するユーザの関心をモデル化するために暗黙の協調フィルタリング信号をキャプチャするために、アイテムIDの埋め込みベクトルを関連付けることに依存している。
結果として、従来のIDベースの手法は、ID特徴のスパース性に起因するデータ空間の問題にしばしば遭遇する。
アイテムIDの空間性の問題を軽減するため、レコメンデーションモデルはマルチモーダルアイテム情報を組み込んでレコメンデーション精度を高める。
しかし、既存のマルチモーダルレコメンデーション手法は、主にテキストと画像の特徴を組み合わせることに焦点を当て、ユーザ行動シーケンスの文脈的影響を無視しながら、早期融合アプローチを採用するのが一般的である。
この監視により、行動パターンに基づくマルチモーダルな関心表現の動的適応が防止され、それによってモデルの能力が制限され、ユーザのマルチモーダルな関心を効果的に捉えることができる。
そこで本稿では,DMAE の動作レベルにおけるユーザマルチモーダル利害の相互融合を実現するための分散ガイド型マルチモーダル利害自動エンコーダ (DMAE) を提案する。
関連論文リスト
- Multimodal Fusion And Sparse Attention-based Alignment Model for Long Sequential Recommendation [9.086257183699418]
マルチモーダルアイテムシーケンスとマイニング マルチモーダルユーザ興味は、コンテンツ理解とレコメンデーションのギャップを埋めることができます。
本稿では,ムルティモダル核融合とスパースアテンションに基づくアライメントモデルであるMUFASAを提案する。
実世界のベンチマーク実験では、MUFASAが最先端のベースラインを一貫して超越していることが示されている。
論文 参考訳(メタデータ) (2025-08-13T09:50:44Z) - M^2VAE: Multi-Modal Multi-View Variational Autoencoder for Cold-start Item Recommendation [14.644213412218742]
コールドスタートアイテムレコメンデーションはレコメンデーションシステムにおいて重要な課題である。
既存の方法は、コールドスタート問題を緩和するためにマルチモーダルコンテンツを利用する。
本稿では,属性とマルチモーダルの特徴の共通性とユニークなビューをモデル化する上での課題に対処する生成モデルを提案する。
論文 参考訳(メタデータ) (2025-08-01T09:16:26Z) - Multimodal Difference Learning for Sequential Recommendation [5.243083216855681]
ユーザの関心とアイテムの関係は、さまざまなモダリティによって異なる、と我々は主張する。
本稿では,MDSRec のシークエンシャルレコメンデーションのための新しいマルチモーダルラーニングフレームワークを提案する。
5つの実世界のデータセットの結果は、最先端のベースラインよりもMDSRecの方が優れていることを示している。
論文 参考訳(メタデータ) (2024-12-11T05:08:19Z) - MMGRec: Multimodal Generative Recommendation with Transformer Model [81.61896141495144]
MMGRecは、マルチモーダルレコメンデーションに生成パラダイムを導入することを目指している。
まず,階層的な量子化手法であるGraph CF-RQVAEを考案し,各項目にRec-IDを割り当てる。
次に、Transformerベースのレコメンデータをトレーニングし、過去のインタラクションシーケンスに基づいて、ユーザが推奨するアイテムのRec-IDを生成する。
論文 参考訳(メタデータ) (2024-04-25T12:11:27Z) - Exploiting Modality-Specific Features For Multi-Modal Manipulation
Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。
本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。
本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文 参考訳(メタデータ) (2023-09-22T06:55:41Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - Knowledge-Enhanced Hierarchical Graph Transformer Network for
Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。
KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。
KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-10-08T09:44:00Z) - Modeling High-order Interactions across Multi-interests for Micro-video
Reommendation [65.16624625748068]
利用者の興味表現を高めるためのセルフオーバーCoアテンションモジュールを提案します。
特に、まず相関パターンを異なるレベルでモデル化し、次に自己注意を使って特定のレベルで相関パターンをモデル化します。
論文 参考訳(メタデータ) (2021-04-01T07:20:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。