論文の概要: MultiHead MultiModal Deep Interest Recommendation Network
- arxiv url: http://arxiv.org/abs/2110.10205v1
- Date: Tue, 19 Oct 2021 18:59:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 17:31:12.521601
- Title: MultiHead MultiModal Deep Interest Recommendation Network
- Title(参考訳): マルチヘッドマルチモーダル深層関心推薦ネットワーク
- Authors: Mingbao Yang, ShaoBo Li, Zhou Peng, Ansi Zhang, Yuanmeng Zhang
- Abstract要約: 本稿ではDINciteAuthors01モデルにマルチヘッドおよびマルチモーダルモジュールを追加する。
実験により、マルチヘッドマルチモーダルDINは推奨予測効果を向上し、様々な包括的指標において最先端の手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the development of information technology, human beings are constantly
producing a large amount of information at all times. How to obtain the
information that users are interested in from the large amount of information
has become an issue of great concern to users and even business managers. In
order to solve this problem, from traditional machine learning to deep learning
recommendation systems, researchers continue to improve optimization models and
explore solutions. Because researchers have optimized more on the
recommendation model network structure, they have less research on enriching
recommendation model features, and there is still room for in-depth
recommendation model optimization. Based on the DIN\cite{Authors01} model, this
paper adds multi-head and multi-modal modules, which enriches the feature sets
that the model can use, and at the same time strengthens the cross-combination
and fitting capabilities of the model. Experiments show that the multi-head
multi-modal DIN improves the recommendation prediction effect, and outperforms
current state-of-the-art methods on various comprehensive indicators.
- Abstract(参考訳): 情報技術の発展とともに、人間は常に大量の情報を常に生成している。
大量の情報からユーザが関心を持っている情報を取得する方法は、ユーザやビジネスマネージャにとっても大きな関心事となっている。
この問題を解決するために、従来の機械学習からディープラーニングレコメンデーションシステムまで、研究者は最適化モデルの改善とソリューションの探索を続けている。
研究者はレコメンデーションモデルネットワーク構造をより最適化しているため、レコメンデーションモデル機能の充実に関する研究は少なく、詳細なレコメンデーションモデル最適化の余地は残っている。
DIN\cite{Authors01} モデルに基づく本論文では,マルチヘッドおよびマルチモーダルモジュールを追加し,モデルが使用可能な機能セットを充実させると同時に,モデルのクロスコンビネーションと適合性を強化する。
実験により,マルチヘッドマルチモーダルdinは推奨予測効果を向上し,様々な包括的指標において現在の最先端手法を上回った。
関連論文リスト
- Generative Large Recommendation Models: Emerging Trends in LLMs for Recommendation [85.52251362906418]
このチュートリアルでは、大規模言語モデル(LLM)を統合するための2つの主要なアプローチを探求する。
これは、最近の進歩、課題、潜在的研究の方向性を含む、生成的な大規模なレコメンデーションモデルの包括的な概要を提供する。
主なトピックは、データ品質、スケーリング法則、ユーザの行動マイニング、トレーニングと推論の効率性である。
論文 参考訳(メタデータ) (2025-02-19T14:48:25Z) - Enhancing Healthcare Recommendation Systems with a Multimodal LLMs-based MOE Architecture [4.429093762434193]
患者の説明に基づいて健康食品を推奨するための小さなデータセットを構築した。
我々は,精度,リコール,NDCG,MAP@5など,いくつかの重要な指標を用いてモデルの性能を評価する。
本稿では,パーソナライズされたレコメンデーションシステムの性能を比較的限定的に改善した画像データを見出した。
論文 参考訳(メタデータ) (2024-12-16T08:42:43Z) - Scaling New Frontiers: Insights into Large Recommendation Models [74.77410470984168]
MetaのジェネレーティブレコメンデーションモデルHSTUは、パラメータを数千億に拡張することでレコメンデーションシステムのスケーリング法則を説明している。
我々は、これらのスケーリング法則の起源を探るため、包括的なアブレーション研究を行っている。
大規模なレコメンデーションモデルの今後の方向性に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-12-01T07:27:20Z) - A Collaborative Ensemble Framework for CTR Prediction [73.59868761656317]
我々は、複数の異なるモデルを活用するための新しいフレームワーク、CETNet(Collaborative Ensemble Training Network)を提案する。
ナイーブなモデルスケーリングとは違って,私たちのアプローチは,共同学習による多様性とコラボレーションを重視しています。
当社のフレームワークは,Metaの3つのパブリックデータセットと大規模産業データセットに基づいて検証する。
論文 参考訳(メタデータ) (2024-11-20T20:38:56Z) - MMREC: LLM Based Multi-Modal Recommender System [2.3113916776957635]
本稿では,Large Language Models(LLM)とディープラーニング技術を活用して,レコメンデータシステムを強化する新しい手法を提案する。
提案フレームワークは,マルチモーダル情報処理を取り入れたレコメンデーションの精度と妥当性を,統一された潜在空間表現を用いて向上することを目的としている。
論文 参考訳(メタデータ) (2024-08-08T04:31:29Z) - Data-Juicer Sandbox: A Feedback-Driven Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは、フィードバック駆動の実験プラットフォームを提供し、コスト効率とデータとモデルの両方のガイド付き洗練を可能にする。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - DiffMM: Multi-Modal Diffusion Model for Recommendation [19.43775593283657]
DiffMMと呼ばれる新しいマルチモーダルグラフ拡散モデルを提案する。
本フレームワークは,モダリティを意識したグラフ拡散モデルとクロスモーダルコントラスト学習パラダイムを統合し,モダリティを意識したユーザ表現学習を改善する。
論文 参考訳(メタデータ) (2024-06-17T17:35:54Z) - ISR-DPO: Aligning Large Multimodal Models for Videos by Iterative Self-Retrospective DPO [36.69910114305134]
我々は、優先モデルを強化するために、反復自己ふりかえり直接選好最適化(ISR-DPO)を提案する。
ISR-DPOは、情報的ビデオ領域に対する自己判断の焦点を強化する。
広範な経験的評価では、ISR-DPOは芸術の状態を著しく上回る。
論文 参考訳(メタデータ) (2024-06-17T07:33:30Z) - Mirror Gradient: Towards Robust Multimodal Recommender Systems via
Exploring Flat Local Minima [54.06000767038741]
フラットローカルミニマの新しい視点からマルチモーダルリコメンデータシステムの解析を行う。
我々はミラーグラディエント(MG)と呼ばれる簡潔で効果的な勾配戦略を提案する。
提案したMGは、既存の堅牢なトレーニング手法を補完し、多様な高度なレコメンデーションモデルに容易に拡張できることが判明した。
論文 参考訳(メタデータ) (2024-02-17T12:27:30Z) - When Parameter-efficient Tuning Meets General-purpose Vision-language
Models [65.19127815275307]
PETALは、一意のモード近似技術によって達成される全パラメータの0.5%しか必要とせず、トレーニングプロセスに革命をもたらす。
実験の結果,PETALは現状の手法をほとんどのシナリオで上回るだけでなく,完全な微調整モデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-12-16T17:13:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。