Fugu-MT 論文翻訳(概要): MUFM: A Mamba-Enhanced Feedback Model for Micro Video Popularity Prediction

論文の概要: MUFM: A Mamba-Enhanced Feedback Model for Micro Video Popularity Prediction

arxiv url: http://arxiv.org/abs/2411.15455v1
Date: Sat, 23 Nov 2024 05:13:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:50.422326
Title: MUFM: A Mamba-Enhanced Feedback Model for Micro Video Popularity Prediction
Title（参考訳）: MUFM:マイクロビデオの人気予測のためのマンバのフィードバックモデル
Authors: Jiacheng Lu, Mingyuan Xiao, Weijian Wang, Yuxin Du, Yi Cui, Jingnan Zhao, Cheng Hua,
Abstract要約: ユーザフィードバックと動的イベントインタラクションにおける長期的依存関係をキャプチャするフレームワークを導入する。大規模なオープンソースマルチモーダルデータセットに関する我々の実験は、我々のモデルが最先端のアプローチを23.2%上回っていることを示している。
参考スコア（独自算出の注目度）: 1.7040391128945196
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The surge in micro-videos is transforming the concept of popularity. As researchers delve into vast multi-modal datasets, there is a growing interest in understanding the origins of this popularity and the forces driving its rapid expansion. Recent studies suggest that the virality of short videos is not only tied to their inherent multi-modal content but is also heavily influenced by the strength of platform recommendations driven by audience feedback. In this paper, we introduce a framework for capturing long-term dependencies in user feedback and dynamic event interactions, based on the Mamba Hawkes process. Our experiments on the large-scale open-source multi-modal dataset show that our model significantly outperforms state-of-the-art approaches across various metrics by 23.2%. We believe our model's capability to map the relationships within user feedback behavior sequences will not only contribute to the evolution of next-generation recommendation algorithms and platform applications but also enhance our understanding of micro video dissemination and its broader societal impact.
Abstract（参考訳）: マイクロビデオの急増は、人気の概念を変えつつある。研究者が膨大なマルチモーダルデータセットを探索するにつれ、この人気の起源と急速な拡大の推進力を理解することへの関心が高まっている。近年の研究では、ショートビデオのバイラル性は、本来のマルチモーダルコンテンツと結びついているだけでなく、オーディエンスフィードバックによるプラットフォームレコメンデーションの強みにも大きく影響されていることが示唆されている。本稿では,Mamba Hawkesプロセスに基づく,ユーザフィードバックと動的イベントインタラクションの長期依存性をキャプチャするフレームワークを提案する。大規模なオープンソースマルチモーダルデータセットに関する我々の実験は、我々のモデルが様々なメトリクスにわたる最先端のアプローチを23.2%上回っていることを示している。我々は,ユーザフィードバック行動系列内の関係をマッピングする能力が,次世代の推薦アルゴリズムやプラットフォームアプリケーションの発展に寄与するだけでなく,マイクロビデオの普及とその社会的影響に対する理解を深めると考えている。

関連論文リスト

Multimodal Foundation Model-Driven User Interest Modeling and Behavior Analysis on Short Video Platforms [4.393914222141582]
本稿では,ユーザ関心モデリングと行動分析のためのマルチモーダル基礎モデルに基づくフレームワークを提案する。本研究では、動的興味の進化をモデル化するために、視聴、好み、コメントのシーケンスを組み込んだ行動駆動型特徴埋め込み機構を導入する。その結果, 行動予測精度, 冷間開始ユーザの関心モデリング, クリックスルー率の大幅な改善が示された。
論文参考訳（メタデータ） (2025-09-05T02:05:10Z)
Short-video Propagation Influence Rating: A New Real-world Dataset and A New Large Graph Model [55.58701436630489]
クロスプラットフォームのショートビデオデータセットには、117,720の動画、381,926のサンプル、中国最大の5つのプラットフォームにわたる535のトピックが含まれている。大グラフモデル(LGM)NetGPTは、多種多様なグラフ構造データを強力な推論能力とLarge Language Models(LLM)の知識で橋渡しすることができる我々のNetGPTは,短ビデオ伝搬グラフの理解と解析が可能であり,短ビデオの長期伝搬の影響を予測できる。
論文参考訳（メタデータ） (2025-03-31T05:53:15Z)
Dynamic Multimodal Fusion via Meta-Learning Towards Micro-Video Recommendation [97.82707398481273]
メタマルチモーダルフュージョン(MetaMMF)と呼ばれるメタラーニングに基づく新しいマルチモーダルフュージョンフレームワークを開発する。メタMMFは、入力タスクのマルチモーダル特徴から抽出されたメタ情報に基づいて、メタラーナを介して、アイテム固有の融合関数としてニューラルネットワークをパラメータ化する。我々は3つのベンチマークデータセットに対して広範な実験を行い、最先端のマルチモーダルレコメンデーションモデルに対する大幅な改善を実証した。
論文参考訳（メタデータ） (2025-01-13T07:51:43Z)
Dreaming User Multimodal Representation Guided by The Platonic Representation Hypothesis for Micro-Video Recommendation [1.8604168495693911]
マルチモーダ空間におけるリアルタイムなユーザ表現を実現するために,ユーザの履歴行動を活用する新しいアプローチであるDreamUMMを紹介する。 DreamUMMは、ユーザビデオの好みとマルチモーダルな類似性を関連づけたクローズドフォームのソリューションを採用しており、ユーザ興味が統一マルチモーダル空間で効果的に表現できるという仮説を立てている。本研究は,マルチモーダル空間に居住するユーザ関心表現の可能性を支持する実証的証拠を提供することにより,表現収束の継続的な探索に寄与する。
論文参考訳（メタデータ） (2024-09-15T06:40:38Z)
DiffMM: Multi-Modal Diffusion Model for Recommendation [19.43775593283657]
DiffMMと呼ばれる新しいマルチモーダルグラフ拡散モデルを提案する。本フレームワークは,モダリティを意識したグラフ拡散モデルとクロスモーダルコントラスト学習パラダイムを統合し,モダリティを意識したユーザ表現学習を改善する。
論文参考訳（メタデータ） (2024-06-17T17:35:54Z)
MMBee: Live Streaming Gift-Sending Recommendations via Multi-Modal Fusion and Behaviour Expansion [18.499672566131355]
ギフトインタラクションの正確なモデリングは、ユーザのエクスペリエンスを向上するだけでなく、ストリーマーの収益も増大させる。従来のレコメンデーション問題として,ライブストリーミングギフト予測に関する先行研究がある。実時間マルチモーダル・フュージョンとビヘイビア・エクスパンジョンに基づくMMBeeを提案する。
論文参考訳（メタデータ） (2024-06-15T04:59:00Z)
Direct Preference Optimization of Video Large Multimodal Models from Language Model Reward [118.65089648651308]
本稿では,映像コンテンツのプロキシとして詳細な動画キャプションを利用する新しいフレームワークを提案する。本稿では,DPOによる報酬の調整により,ビデオ質問応答(QA)タスクにおけるビデオLMMの性能が著しく向上することを示す。
論文参考訳（メタデータ） (2024-04-01T17:28:16Z)
Learning Unseen Modality Interaction [54.23533023883659]
マルチモーダル学習は、すべてのモダリティの組み合わせが訓練中に利用でき、クロスモーダル対応を学ぶことを前提としている。我々は、目に見えないモダリティ相互作用の問題を提起し、第1の解を導入する。異なるモジュラリティの多次元的特徴を、豊富な情報を保存した共通空間に投影するモジュールを利用する。
論文参考訳（メタデータ） (2023-06-22T10:53:10Z)
Multi-queue Momentum Contrast for Microvideo-Product Retrieval [57.527227171945796]
マルチモーダルインスタンスとマルチモーダルインスタンス間の検索を探索する最初の試みであるマイクロビデオ製品検索タスクを定式化する。双方向検索のためのMulti-Queue Momentum Contrast(MQMC)ネットワークという新しい手法を提案する。マルチキューを用いた識別的選択戦略は、カテゴリによって異なる負の重要性を区別するために用いられる。
論文参考訳（メタデータ） (2022-12-22T03:47:14Z)
Perceptual Score: What Data Modalities Does Your Model Perceive? [73.75255606437808]
モデルが入力特徴の異なる部分集合に依存する度合いを評価する指標である知覚スコアを導入する。近年,視覚的質問応答に対するマルチモーダルモデルでは,前者よりも視覚的データを知覚しにくい傾向がみられた。知覚スコアを使用することで、スコアをデータサブセットのコントリビューションに分解することで、モデルのバイアスを分析することもできる。
論文参考訳（メタデータ） (2021-10-27T12:19:56Z)
Modeling High-order Interactions across Multi-interests for Micro-video Reommendation [65.16624625748068]
利用者の興味表現を高めるためのセルフオーバーCoアテンションモジュールを提案します。特に、まず相関パターンを異なるレベルでモデル化し、次に自己注意を使って特定のレベルで相関パターンをモデル化します。
論文参考訳（メタデータ） (2021-04-01T07:20:15Z)
Predicting the Popularity of Micro-videos with Multimodal Variational Encoder-Decoder Framework [54.194340961353944]
マイクロビデオ人気タスクのためのマルチモーダル変分エンコーダ・デコーダフレームワークを提案する。 MMVEDは、その人気レベルに情報を与えるマイクロビデオの埋め込みを学習する。 Xiguaから収集した公開データセットとデータセットで実施された実験は、提案したMMVEDフレームワークの有効性を実証する。
論文参考訳（メタデータ） (2020-03-28T06:08:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。