論文の概要: Multi-modal Adaptive Mixture of Experts for Cold-start Recommendation
- arxiv url: http://arxiv.org/abs/2508.08042v1
- Date: Mon, 11 Aug 2025 14:47:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.151989
- Title: Multi-modal Adaptive Mixture of Experts for Cold-start Recommendation
- Title(参考訳): コールドスタート勧告のための多モード適応型エキスパート混合
- Authors: Van-Khang Nguyen, Duc-Hoang Pham, Huy-Son Nguyen, Cam-Van Thi Nguyen, Hoang-Quynh Le, Duc-Trong Le,
- Abstract要約: MAMEXはマルチモーダルなコールドスタートレコメンデーションのための新しいフレームワークである。
異なるモダリティから潜在表現を動的に活用する。
実験では、MAMEXはコールドスタートシナリオで最先端の手法よりも優れています。
- 参考スコア(独自算出の注目度): 1.9967512860886603
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Recommendation systems have faced significant challenges in cold-start scenarios, where new items with a limited history of interaction need to be effectively recommended to users. Though multimodal data (e.g., images, text, audio, etc.) offer rich information to address this issue, existing approaches often employ simplistic integration methods such as concatenation, average pooling, or fixed weighting schemes, which fail to capture the complex relationships between modalities. Our study proposes a novel Mixture of Experts (MoE) framework for multimodal cold-start recommendation, named MAMEX, which dynamically leverages latent representation from different modalities. MAMEX utilizes modality-specific expert networks and introduces a learnable gating mechanism that adaptively weights the contribution of each modality based on its content characteristics. This approach enables MAMEX to emphasize the most informative modalities for each item while maintaining robustness when certain modalities are less relevant or missing. Extensive experiments on benchmark datasets show that MAMEX outperforms state-of-the-art methods in cold-start scenarios, with superior accuracy and adaptability. For reproducibility, the code has been made available on Github https://github.com/L2R-UET/MAMEX.
- Abstract(参考訳): 推奨システムはコールドスタートシナリオにおいて重大な課題に直面しており、インタラクションの履歴が限られている新しいアイテムをユーザに効果的に推奨する必要がある。
マルチモーダルデータ(画像、テキスト、オーディオなど)は、この問題に対処するための豊富な情報を提供するが、既存のアプローチでは、結合、平均プール、固定重み付けスキームといった単純な統合手法を用いることが多く、モダリティ間の複雑な関係を捉えることができない。
本研究は,マルチモーダルコールドスタートレコメンデーションのためのMAMEX(Mixture of Experts)フレームワークを提案する。
MAMEXは、モダリティ固有の専門家ネットワークを利用し、その内容特性に基づいて各モダリティの寄与を適応的に重み付けする学習可能なゲーティング機構を導入する。
このアプローチにより、MAMEXは各項目の最も情報に富むモダリティを強調しつつ、特定のモダリティが関連性や欠落の少ない場合のロバスト性を維持することができる。
ベンチマークデータセットの大規模な実験により、MAMEXはコールドスタートシナリオにおいて最先端の手法より優れ、精度と適応性に優れていた。
再現性のために、コードはGithub https://github.com/L2R-UET/MAMEXで公開されている。
関連論文リスト
- Efficient Multimodal Streaming Recommendation via Expandable Side Mixture-of-Experts [40.79898677069334]
マルチモーダルストリーミングレコメンダシステムは、ユーザの関心が時間とともに変化する現実世界のアプリケーションに広くデプロイされている。
マルチモーダルストリーミングレコメンデーションのためのメモリ効率の高いフレームワークであるXSMoE(Expandable Side Mixture-of-Experts)を提案する。
XSMoEは、凍結したトレーニング済みエンコーダに軽量なサイドチューニングモジュールをアタッチし、ユーザのフィードバックの進化に応じて徐々に拡張する。
論文 参考訳(メタデータ) (2025-08-08T04:00:05Z) - FindRec: Stein-Guided Entropic Flow for Multi-Modal Sequential Recommendation [50.438552588818]
textbfFindRec (textbfFlexible unified textbfinformation textbfdisentanglement for multi-modal sequence textbfRecommendation)を提案する。
Stein kernel-based Integrated Information Coordination Module (IICM) は理論上、マルチモーダル特徴とIDストリーム間の分散一貫性を保証する。
マルチモーダル特徴を文脈的関連性に基づいて適応的にフィルタリング・結合するクロスモーダル・エキスパート・ルーティング機構。
論文 参考訳(メタデータ) (2025-07-07T04:09:45Z) - Gated Multimodal Graph Learning for Personalized Recommendation [9.466822984141086]
マルチモーダルレコメンデーションは、協調フィルタリングにおけるコールドスタートとスパーシリティの問題を軽減するための有望なソリューションとして登場した。
グラフベースユーザモデリングと適応型マルチモーダルアイテムエンコーディングを組み合わせた軽量かつモジュール化されたレコメンデーションフレームワーク RLMultimodalRec を提案する。
論文 参考訳(メタデータ) (2025-05-30T16:57:17Z) - Spectrum-based Modality Representation Fusion Graph Convolutional Network for Multimodal Recommendation [7.627299398469962]
本稿では,新しいスペクトルベースのモダリティ表現グラフレコメンデータを提案する。
モダリティノイズを同時に抑制しながら、ユニモーダルとフュージョンの両方の好みを捉えることを目的としている。
実世界の3つのデータセットを用いた実験により,提案モデルの有効性が示された。
論文 参考訳(メタデータ) (2024-12-19T15:53:21Z) - DiffMM: Multi-Modal Diffusion Model for Recommendation [19.43775593283657]
DiffMMと呼ばれる新しいマルチモーダルグラフ拡散モデルを提案する。
本フレームワークは,モダリティを意識したグラフ拡散モデルとクロスモーダルコントラスト学習パラダイムを統合し,モダリティを意識したユーザ表現学習を改善する。
論文 参考訳(メタデータ) (2024-06-17T17:35:54Z) - Uni-MoE: Scaling Unified Multimodal LLMs with Mixture of Experts [54.529880848937104]
そこで我々は,MoEアーキテクチャをUni-MoEと呼ぶ一貫したMLLMを開発し,様々なモダリティを扱えるようにした。
具体的には、統一マルチモーダル表現のためのコネクタを持つモダリティ特化エンコーダを特徴とする。
マルチモーダルデータセットの包括的集合を用いた命令調整Uni-MoEの評価を行った。
論文 参考訳(メタデータ) (2024-05-18T12:16:01Z) - Mirror Gradient: Towards Robust Multimodal Recommender Systems via
Exploring Flat Local Minima [54.06000767038741]
フラットローカルミニマの新しい視点からマルチモーダルリコメンデータシステムの解析を行う。
我々はミラーグラディエント(MG)と呼ばれる簡潔で効果的な勾配戦略を提案する。
提案したMGは、既存の堅牢なトレーニング手法を補完し、多様な高度なレコメンデーションモデルに容易に拡張できることが判明した。
論文 参考訳(メタデータ) (2024-02-17T12:27:30Z) - Exploiting Modality-Specific Features For Multi-Modal Manipulation
Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。
本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。
本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文 参考訳(メタデータ) (2023-09-22T06:55:41Z) - Deep Equilibrium Multimodal Fusion [88.04713412107947]
多重モーダル融合は、複数のモーダルに存在する相補的な情報を統合し、近年多くの注目を集めている。
本稿では,動的多モード核融合プロセスの固定点を求めることにより,多モード核融合に対する新しいDeep equilibrium (DEQ)法を提案する。
BRCA,MM-IMDB,CMU-MOSI,SUN RGB-D,VQA-v2の実験により,DEC融合の優位性が示された。
論文 参考訳(メタデータ) (2023-06-29T03:02:20Z) - Mining Stable Preferences: Adaptive Modality Decorrelation for
Multimedia Recommendation [23.667430143035787]
そこで我々は,ユーザの安定な嗜好を学習するための,新しいモダリティ記述型静的学習フレームワークMODESTを提案する。
サンプル再重み付け手法に着想を得た提案手法は,各項目の重み付けを推定し,重み付け分布の異なるモジュラリティの特徴が重み付けされるようにすることを目的としている。
提案手法は,既存のマルチメディアレコメンデーションバックボーンのプレイ・アンド・プラグモジュールとして利用できる。
論文 参考訳(メタデータ) (2023-06-25T09:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。