論文の概要: Causal Inspired Multi Modal Recommendation
- arxiv url: http://arxiv.org/abs/2510.12325v1
- Date: Tue, 14 Oct 2025 09:29:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.269341
- Title: Causal Inspired Multi Modal Recommendation
- Title(参考訳): 因果性インスパイアされたマルチモーダルレコメンデーション
- Authors: Jie Yang, Chenyang Gu, Zixuan Liu,
- Abstract要約: マルチモーダルレコメンデーションシステムは、eコマースとオンライン広告におけるパーソナライズされたレコメンデーションを強化する。
既存の方法は、しばしば2つの重要なバイアス、すなわちモーダル・コンファウンディングと相互作用バイアスを見落としている。
本稿では,これらの課題に対処するためのCausal-inspired Multimodal Recommendationフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.356256402158066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal recommender systems enhance personalized recommendations in e-commerce and online advertising by integrating visual, textual, and user-item interaction data. However, existing methods often overlook two critical biases: (i) modal confounding, where latent factors (e.g., brand style or product category) simultaneously drive multiple modalities and influence user preference, leading to spurious feature-preference associations; (ii) interaction bias, where genuine user preferences are mixed with noise from exposure effects and accidental clicks. To address these challenges, we propose a Causal-inspired multimodal Recommendation framework. Specifically, we introduce a dual-channel cross-modal diffusion module to identify hidden modal confounders, utilize back-door adjustment with hierarchical matching and vector-quantized codebooks to block confounding paths, and apply front-door adjustment combined with causal topology reconstruction to build a deconfounded causal subgraph. Extensive experiments on three real-world e-commerce datasets demonstrate that our method significantly outperforms state-of-the-art baselines while maintaining strong interpretability.
- Abstract(参考訳): マルチモーダルレコメンデータシステムは、視覚的、テキスト的、ユーザとイテムのインタラクションデータを統合することで、電子商取引およびオンライン広告におけるパーソナライズされたレコメンデーションを強化する。
しかし、既存の方法はしばしば2つの重要なバイアスを見落とします。
一 遅滞要因(例えば、ブランドスタイル又は製品カテゴリー)が同時に複数のモダリティを推進し、利用者の嗜好に影響を及ぼし、刺激的な特徴選好関係に繋がるモーダル・コンバウンディング
(II) 実際のユーザの嗜好と露出効果や偶然クリックのノイズが混ざり合った相互作用バイアス。
これらの課題に対処するため、我々はCausal-inspired multimodal Recommendationフレームワークを提案する。
具体的には,二重チャネルのクロスモーダル拡散モジュールを導入して,隠蔽されたモダル共同創設者を識別し,階層的マッチングとベクトル量子化されたコードブックによるバックドア調整を用いて,境界経路をブロックし,因果的トポロジー再構成と組み合わせてフロントドア調整を適用して因果的部分グラフを構築する。
3つの実世界のeコマースデータセットに対する大規模な実験は、我々の手法が強い解釈性を維持しながら最先端のベースラインを大幅に上回っていることを示している。
関連論文リスト
- Progressive Semantic Residual Quantization for Multimodal-Joint Interest Modeling in Music Recommendation [6.790539226766362]
本稿では,2段階の新たなマルチモーダルレコメンデーションフレームワークを提案する。
最初の段階では、モーダル固有およびモーダルジョイントのセマンティックIDを生成する。
第2段階では、ユーザのマルチモーダルな関心をモデル化するために、マルチコードブックのクロスアテンションネットワークが設計されている。
論文 参考訳(メタデータ) (2025-08-28T02:16:57Z) - Multi-Modal Multi-Behavior Sequential Recommendation with Conditional Diffusion-Based Feature Denoising [1.4207530018625354]
本稿では,マルチモーダルマルチビヘイビアシーケンシャルレコメンデーションの問題に焦点をあてる。
マルチモーダルマルチビヘイビアシーケンスレコメンデーションモデル(M$3$BSR)を提案する。
実験結果から,M$3$BSRはベンチマークデータセット上で既存の最先端手法を著しく上回ることがわかった。
論文 参考訳(メタデータ) (2025-08-07T12:58:34Z) - Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。
本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-04T07:55:41Z) - Multimodal Difference Learning for Sequential Recommendation [5.243083216855681]
ユーザの関心とアイテムの関係は、さまざまなモダリティによって異なる、と我々は主張する。
本稿では,MDSRec のシークエンシャルレコメンデーションのための新しいマルチモーダルラーニングフレームワークを提案する。
5つの実世界のデータセットの結果は、最先端のベースラインよりもMDSRecの方が優れていることを示している。
論文 参考訳(メタデータ) (2024-12-11T05:08:19Z) - Prompt-to-Slate: Diffusion Models for Prompt-Conditioned Slate Generation [9.864273882854297]
本稿では, 急速条件付きスレート生成のための拡散モデルに基づく生成フレームワークであるDMSGを紹介する。
検索ベースや自己回帰モデルとは異なり、DMSGはスレート上の結合分布をモデル化し、柔軟性と多様性を高める。
DMSGを音楽プレイリスト生成とeコマースバンドル生成の2つの重要な領域で評価する。
論文 参考訳(メタデータ) (2024-08-13T13:29:57Z) - DiffMM: Multi-Modal Diffusion Model for Recommendation [19.43775593283657]
DiffMMと呼ばれる新しいマルチモーダルグラフ拡散モデルを提案する。
本フレームワークは,モダリティを意識したグラフ拡散モデルとクロスモーダルコントラスト学習パラダイムを統合し,モダリティを意識したユーザ表現学習を改善する。
論文 参考訳(メタデータ) (2024-06-17T17:35:54Z) - BiVRec: Bidirectional View-based Multimodal Sequential Recommendation [55.87443627659778]
我々は,IDとマルチモーダルの両方で推薦タスクを共同で訓練する,革新的なフレームワークであるBivRecを提案する。
BivRecは5つのデータセットで最先端のパフォーマンスを達成し、様々な実用的な利点を示している。
論文 参考訳(メタデータ) (2024-02-27T09:10:41Z) - Exploiting Modality-Specific Features For Multi-Modal Manipulation
Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。
本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。
本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文 参考訳(メタデータ) (2023-09-22T06:55:41Z) - Knowledge-Enhanced Hierarchical Graph Transformer Network for
Multi-Behavior Recommendation [56.12499090935242]
本研究では,ユーザとレコメンデータシステムにおける項目間の多種類の対話パターンを探索する知識強化階層型グラフトランスフォーマネットワーク(KHGT)を提案する。
KHGTはグラフ構造化ニューラルネットワーク上に構築され、タイプ固有の振る舞い特性をキャプチャする。
KHGTは、様々な評価設定において、最先端のレコメンデーション手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-10-08T09:44:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。