論文の概要: Causal Inspired Multi Modal Recommendation
- arxiv url: http://arxiv.org/abs/2510.12325v1
- Date: Tue, 14 Oct 2025 09:29:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.269341
- Title: Causal Inspired Multi Modal Recommendation
- Title(参考訳): 因果性インスパイアされたマルチモーダルレコメンデーション
- Authors: Jie Yang, Chenyang Gu, Zixuan Liu,
- Abstract要約: マルチモーダルレコメンデーションシステムは、eコマースとオンライン広告におけるパーソナライズされたレコメンデーションを強化する。
既存の方法は、しばしば2つの重要なバイアス、すなわちモーダル・コンファウンディングと相互作用バイアスを見落としている。
本稿では,これらの課題に対処するためのCausal-inspired Multimodal Recommendationフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.356256402158066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal recommender systems enhance personalized recommendations in e-commerce and online advertising by integrating visual, textual, and user-item interaction data. However, existing methods often overlook two critical biases: (i) modal confounding, where latent factors (e.g., brand style or product category) simultaneously drive multiple modalities and influence user preference, leading to spurious feature-preference associations; (ii) interaction bias, where genuine user preferences are mixed with noise from exposure effects and accidental clicks. To address these challenges, we propose a Causal-inspired multimodal Recommendation framework. Specifically, we introduce a dual-channel cross-modal diffusion module to identify hidden modal confounders, utilize back-door adjustment with hierarchical matching and vector-quantized codebooks to block confounding paths, and apply front-door adjustment combined with causal topology reconstruction to build a deconfounded causal subgraph. Extensive experiments on three real-world e-commerce datasets demonstrate that our method significantly outperforms state-of-the-art baselines while maintaining strong interpretability.
- Abstract(参考訳): マルチモーダルレコメンデータシステムは、視覚的、テキスト的、ユーザとイテムのインタラクションデータを統合することで、電子商取引およびオンライン広告におけるパーソナライズされたレコメンデーションを強化する。
しかし、既存の方法はしばしば2つの重要なバイアスを見落とします。
一 遅滞要因(例えば、ブランドスタイル又は製品カテゴリー)が同時に複数のモダリティを推進し、利用者の嗜好に影響を及ぼし、刺激的な特徴選好関係に繋がるモーダル・コンバウンディング
(II) 実際のユーザの嗜好と露出効果や偶然クリックのノイズが混ざり合った相互作用バイアス。
これらの課題に対処するため、我々はCausal-inspired multimodal Recommendationフレームワークを提案する。
具体的には,二重チャネルのクロスモーダル拡散モジュールを導入して,隠蔽されたモダル共同創設者を識別し,階層的マッチングとベクトル量子化されたコードブックによるバックドア調整を用いて,境界経路をブロックし,因果的トポロジー再構成と組み合わせてフロントドア調整を適用して因果的部分グラフを構築する。
3つの実世界のeコマースデータセットに対する大規模な実験は、我々の手法が強い解釈性を維持しながら最先端のベースラインを大幅に上回っていることを示している。
関連論文リスト
- CAMMSR: Category-Guided Attentive Mixture of Experts for Multimodal Sequential Recommendation [23.478610632707728]
本稿では,マルチモーダルシーケンスレコメンデーションのためのカテゴリー誘導型専門家混合モデルを提案する。
中心となるCAMMSRは、専門的な項目表現を複数の視点から学習する専門家モジュールのカテゴリ誘導注意混合を導入した。
4つの公開データセットの実験は、CAMMSRが一貫して最先端のベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2026-03-04T17:39:35Z) - From Sparse Decisions to Dense Reasoning: A Multi-attribute Trajectory Paradigm for Multimodal Moderation [59.27094165576015]
疎度な意思決定から高密度な推論トレースへ移行する新しい学習パラダイム(UniMod)を提案する。
モノリシックな意思決定タスクを多次元境界学習プロセスに再構成し,エビデンス,モダリティ評価,リスクマッピング,政策決定,応答生成を含む構造化軌道を構築する。
タスク固有のパラメータを分離し、トレーニングダイナミクスを再バランスさせ、マルチタスク学習における多様な目的間の干渉を効果的に解消する、特別な最適化戦略を導入する。
論文 参考訳(メタデータ) (2026-01-28T09:29:40Z) - Cross-Modal Attention Network with Dual Graph Learning in Multimodal Recommendation [12.802844514133255]
二重グラフ埋め込み(CRANE)を用いたクロスモーダル再帰注意ネットワーク
我々は,共同潜在空間における相互相関に基づくモダリティ特徴を反復的に洗練するコア再帰的クロスモーダルアテンション(RCA)機構を設計する。
対称型マルチモーダル学習では,対話した項目の特徴を集約することで,ユーザのマルチモーダルプロファイルを明示的に構築する。
論文 参考訳(メタデータ) (2026-01-16T10:09:39Z) - PRISM: Personalized Recommendation via Information Synergy Module [12.797662213207936]
PRISMはシーケンシャルレコメンデーション(SR)のためのプラグイン・アンド・プレイフレームワークである
マルチモーダル情報をユニークで冗長でシナジスティックなコンポーネントに分解する。
4つのデータセットと3つのSRバックボーンの実験は、その有効性と汎用性を示している。
論文 参考訳(メタデータ) (2026-01-16T02:17:54Z) - Progressive Semantic Residual Quantization for Multimodal-Joint Interest Modeling in Music Recommendation [6.790539226766362]
本稿では,2段階の新たなマルチモーダルレコメンデーションフレームワークを提案する。
最初の段階では、モーダル固有およびモーダルジョイントのセマンティックIDを生成する。
第2段階では、ユーザのマルチモーダルな関心をモデル化するために、マルチコードブックのクロスアテンションネットワークが設計されている。
論文 参考訳(メタデータ) (2025-08-28T02:16:57Z) - Multi-Modal Multi-Behavior Sequential Recommendation with Conditional Diffusion-Based Feature Denoising [1.4207530018625354]
本稿では,マルチモーダルマルチビヘイビアシーケンシャルレコメンデーションの問題に焦点をあてる。
マルチモーダルマルチビヘイビアシーケンスレコメンデーションモデル(M$3$BSR)を提案する。
実験結果から,M$3$BSRはベンチマークデータセット上で既存の最先端手法を著しく上回ることがわかった。
論文 参考訳(メタデータ) (2025-08-07T12:58:34Z) - FindRec: Stein-Guided Entropic Flow for Multi-Modal Sequential Recommendation [57.577843653775]
textbfFindRec (textbfFlexible unified textbfinformation textbfdisentanglement for multi-modal sequence textbfRecommendation)を提案する。
Stein kernel-based Integrated Information Coordination Module (IICM) は理論上、マルチモーダル特徴とIDストリーム間の分散一貫性を保証する。
マルチモーダル特徴を文脈的関連性に基づいて適応的にフィルタリング・結合するクロスモーダル・エキスパート・ルーティング機構。
論文 参考訳(メタデータ) (2025-07-07T04:09:45Z) - Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。
本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-04T07:55:41Z) - Multimodal Difference Learning for Sequential Recommendation [5.243083216855681]
ユーザの関心とアイテムの関係は、さまざまなモダリティによって異なる、と我々は主張する。
本稿では,MDSRec のシークエンシャルレコメンデーションのための新しいマルチモーダルラーニングフレームワークを提案する。
5つの実世界のデータセットの結果は、最先端のベースラインよりもMDSRecの方が優れていることを示している。
論文 参考訳(メタデータ) (2024-12-11T05:08:19Z) - Prompt-to-Slate: Diffusion Models for Prompt-Conditioned Slate Generation [9.864273882854297]
本稿では, 急速条件付きスレート生成のための拡散モデルに基づく生成フレームワークであるDMSGを紹介する。
検索ベースや自己回帰モデルとは異なり、DMSGはスレート上の結合分布をモデル化し、柔軟性と多様性を高める。
DMSGを音楽プレイリスト生成とeコマースバンドル生成の2つの重要な領域で評価する。
論文 参考訳(メタデータ) (2024-08-13T13:29:57Z) - DiffMM: Multi-Modal Diffusion Model for Recommendation [19.43775593283657]
DiffMMと呼ばれる新しいマルチモーダルグラフ拡散モデルを提案する。
本フレームワークは,モダリティを意識したグラフ拡散モデルとクロスモーダルコントラスト学習パラダイムを統合し,モダリティを意識したユーザ表現学習を改善する。
論文 参考訳(メタデータ) (2024-06-17T17:35:54Z) - BiVRec: Bidirectional View-based Multimodal Sequential Recommendation [55.87443627659778]
我々は,IDとマルチモーダルの両方で推薦タスクを共同で訓練する,革新的なフレームワークであるBivRecを提案する。
BivRecは5つのデータセットで最先端のパフォーマンスを達成し、様々な実用的な利点を示している。
論文 参考訳(メタデータ) (2024-02-27T09:10:41Z) - Exploiting Modality-Specific Features For Multi-Modal Manipulation
Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。
本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。
本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文 参考訳(メタデータ) (2023-09-22T06:55:41Z) - Knowledge-Enhanced Hierarchical Graph Transformer Network for
Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。
KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。
KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-10-08T09:44:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。