論文の概要: MDVT: Enhancing Multimodal Recommendation with Model-Agnostic Multimodal-Driven Virtual Triplets
- arxiv url: http://arxiv.org/abs/2505.16665v1
- Date: Thu, 22 May 2025 13:28:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.32628
- Title: MDVT: Enhancing Multimodal Recommendation with Model-Agnostic Multimodal-Driven Virtual Triplets
- Title(参考訳): MDVT:モデルに依存しないマルチモーダル駆動仮想トリプレットによるマルチモーダル勧告の強化
- Authors: Jinfeng Xu, Zheyu Chen, Jinze Li, Shuo Yang, Hewei Wang, Yijie Li, Mengran Li, Puzhen Wu, Edith C. H. Ngai,
- Abstract要約: 本稿では,MDVTを提案する。MDVTは,マルチモーダル駆動の仮想三重項を構成するモデルに依存しない手法で,重要な監視信号を提供する。
複数の実世界のデータセットの実験では、MDVTがデータ空間問題を効果的に軽減し、レコメンデーション性能を向上させることが示されている。
- 参考スコア(独自算出の注目度): 9.610483276170235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The data sparsity problem significantly hinders the performance of recommender systems, as traditional models rely on limited historical interactions to learn user preferences and item properties. While incorporating multimodal information can explicitly represent these preferences and properties, existing works often use it only as side information, failing to fully leverage its potential. In this paper, we propose MDVT, a model-agnostic approach that constructs multimodal-driven virtual triplets to provide valuable supervision signals, effectively mitigating the data sparsity problem in multimodal recommendation systems. To ensure high-quality virtual triplets, we introduce three tailored warm-up threshold strategies: static, dynamic, and hybrid. The static warm-up threshold strategy exhaustively searches for the optimal number of warm-up epochs but is time-consuming and computationally intensive. The dynamic warm-up threshold strategy adjusts the warm-up period based on loss trends, improving efficiency but potentially missing optimal performance. The hybrid strategy combines both, using the dynamic strategy to find the approximate optimal number of warm-up epochs and then refining it with the static strategy in a narrow hyper-parameter space. Once the warm-up threshold is satisfied, the virtual triplets are used for joint model optimization by our enhanced pair-wise loss function without causing significant gradient skew. Extensive experiments on multiple real-world datasets demonstrate that integrating MDVT into advanced multimodal recommendation models effectively alleviates the data sparsity problem and improves recommendation performance, particularly in sparse data scenarios.
- Abstract(参考訳): 従来のモデルでは、ユーザの好みやアイテムプロパティを学習するために、履歴的なインタラクションが限られていたため、データ空間の問題によってレコメンデータシステムのパフォーマンスが著しく低下する。
マルチモーダル情報を組み込むことは、これらの嗜好や特性を明確に表すことができるが、既存の作品ではサイド情報としてのみ使用されることが多く、その潜在能力を十分に活用できない。
本稿では、MDVTを提案する。MDVTは、マルチモーダル駆動の仮想三重項を構成するモデルに依存しない手法で、有用な監視信号を提供し、マルチモーダルレコメンデーションシステムにおけるデータ空間問題を効果的に軽減する。
高品質な仮想三重項を確保するために、静的、動的、ハイブリッドの3つのウォームアップしきい値戦略を導入する。
静的ウォームアップしきい値戦略は、最適数のウォームアップエポックを網羅的に探索するが、時間がかかり、計算集約的である。
動的ウォームアップしきい値戦略は、損失傾向に基づいてウォームアップ期間を調整する。
ハイブリッド戦略は、動的戦略を用いて、ウォームアップエポックの近似的な最適な数の探索を行い、それを狭いハイパーパラメータ空間の静的戦略で精製する。
ウォームアップしきい値を満たすと、仮想三重項は、有意な勾配スキューを生じさせることなく、強化されたペアワイズ損失関数によるジョイントモデル最適化に使用される。
複数の実世界のデータセットに対する大規模な実験により、MDVTを高度なマルチモーダルレコメンデーションモデルに統合することで、データ空間の問題が効果的に軽減され、特にスパースデータシナリオにおけるレコメンデーションパフォーマンスが向上することが示された。
関連論文リスト
- A Novel Mamba-based Sequential Recommendation Method [4.941272356564765]
逐次レコメンデーション(SR)は、次のアクションを予測するためにユーザアクティビティをエンコードする。
トランスフォーマーベースのモデルはシーケンシャルレコメンデーションに有効であることが証明されているが、トランスフォーマーにおける自己アテンションモジュールの複雑さは、シーケンス長と2次にスケールする。
複数の低次元マンバ層と完全連結層を用いる新しいマルチヘッド潜在マンバアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-04-10T02:43:19Z) - Training-Free Graph Filtering via Multimodal Feature Refinement for Extremely Fast Multimodal Recommendation [8.462186629861046]
効率的なマルチモーダルレコメンデーションのためのマルチモーダルグラフフィルタリング(MM-GF)を提案する。
MM-GFは、グラフフィルタリング(GF)の概念に基づく、効率的かつ正確なマルチモーダルレコメンデーションに基づく、トレーニング不要な手法である。
実世界のベンチマークデータセットの実験は、MM-GFが推奨精度を最大13.35%向上するだけでなく、ランタイムを10秒未満で達成することで計算コストを大幅に削減することを示した。
論文 参考訳(メタデータ) (2025-03-06T13:00:53Z) - Continual Optimization with Symmetry Teleportation for Multi-Task Learning [73.28772872740744]
マルチタスク学習(MTL)は、1つのモデルを用いて複数のタスクの同時学習を可能にする。
シンメトリ・テレポーテーション(COST)を用いた連続最適化に基づく新しい手法を提案する。
COSTは、競合の勾配を減らすために、損失ランドスケープに別の損失等価点を求める。
論文 参考訳(メタデータ) (2025-03-06T02:58:09Z) - TD3: Tucker Decomposition Based Dataset Distillation Method for Sequential Recommendation [50.23504065567638]
本稿では,メタラーニングフレームワークにおける textbfDataset textbfDistillation 手法である textbfTD3 を紹介する。
TD3は、オリジナルのデータから完全に表現力のある合成配列の要約を蒸留する。
拡張技術により、学習者は合成要約を忠実に適合させ、アンプループでの正確な更新を確実にすることができる。
論文 参考訳(メタデータ) (2025-02-05T03:13:25Z) - Pre-train, Align, and Disentangle: Empowering Sequential Recommendation with Large Language Models [26.331324261505486]
Sequential Recommendation (SR) は、ユーザの過去のインタラクションにおけるシーケンシャルなパターンを活用して、ユーザの好みを正確に追跡することを目的としている。
大規模言語モデル(LLM)の有効性が証明されているにもかかわらず、商用レコメンデータシステムへの統合は妨げられている。
我々は,LLMを用いたSRモデルを強化するために,新しいPri-train,Align,Disentangle(PAD)フレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-05T12:17:56Z) - Denoising Pre-Training and Customized Prompt Learning for Efficient Multi-Behavior Sequential Recommendation [69.60321475454843]
マルチビヘイビアシークエンシャルレコメンデーションに適した,最初の事前学習および迅速な学習パラダイムであるDPCPLを提案する。
事前学習段階において,複数の時間スケールでノイズを除去する新しい行動マイナ (EBM) を提案する。
次に,提案するCustomized Prompt Learning (CPL)モジュールを用いて,事前学習したモデルを高効率にチューニングすることを提案する。
論文 参考訳(メタデータ) (2024-08-21T06:48:38Z) - Mirror Gradient: Towards Robust Multimodal Recommender Systems via
Exploring Flat Local Minima [54.06000767038741]
フラットローカルミニマの新しい視点からマルチモーダルリコメンデータシステムの解析を行う。
我々はミラーグラディエント(MG)と呼ばれる簡潔で効果的な勾配戦略を提案する。
提案したMGは、既存の堅牢なトレーニング手法を補完し、多様な高度なレコメンデーションモデルに容易に拡張できることが判明した。
論文 参考訳(メタデータ) (2024-02-17T12:27:30Z) - Break a Lag: Triple Exponential Moving Average for Enhanced Optimization [2.0199251985015434]
本稿では,三重指数移動平均のパワーを利用する新しい最適化手法であるFAMEを紹介する。
FAMEはデータダイナミクスに対する応答性を高め、トレンド識別ラグを緩和し、学習効率を最適化する。
包括的評価は、画像分類、オブジェクト検出、セマンティックセグメンテーションを含む様々なコンピュータビジョンタスクを含み、FAMEを30の異なるアーキテクチャに統合する。
論文 参考訳(メタデータ) (2023-06-02T10:29:33Z) - Knowledge-Enhanced Hierarchical Graph Transformer Network for
Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。
KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。
KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-10-08T09:44:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。