論文の概要: Propagating Similarity, Mitigating Uncertainty: Similarity Propagation-enhanced Uncertainty for Multimodal Recommendation
- arxiv url: http://arxiv.org/abs/2601.19198v1
- Date: Tue, 27 Jan 2026 04:53:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 13:55:37.740377
- Title: Propagating Similarity, Mitigating Uncertainty: Similarity Propagation-enhanced Uncertainty for Multimodal Recommendation
- Title(参考訳): 類似性の伝播と不確かさの緩和:マルチモーダルレコメンデーションのための類似の伝播による不確実性
- Authors: Xinzhuo Wu, Hongbo Wang, Yuan Lin, Kan Xu, Liang Yang, Hongfei Lin,
- Abstract要約: マルチモーダルレコメンデーション(SPUMR)のための新しいフレームワーク「類似性-強化不確実性」を提案する。
SPUMRは、まずModality similarity GraphとCollaborative similarity Graphを構築し、不確実性を明示的にモデル化し緩和する。
3つのベンチマークデータセットの実験では、SPUMRが既存のリードメソッドよりも大幅に改善されていることが示されている。
- 参考スコア(独自算出の注目度): 26.819070711100206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal Recommendation (MMR) systems are crucial for modern platforms but are often hampered by inherent noise and uncertainty in modal features, such as blurry images, diverse visual appearances, or ambiguous text. Existing methods often overlook this modality-specific uncertainty, leading to ineffective feature fusion. Furthermore, they fail to leverage rich similarity patterns among users and items to refine representations and their corresponding uncertainty estimates. To address these challenges, we propose a novel framework, Similarity Propagation-enhanced Uncertainty for Multimodal Recommendation (SPUMR). SPUMR explicitly models and mitigates uncertainty by first constructing the Modality Similarity Graph and the Collaborative Similarity Graph to refine representations from both content and behavioral perspectives. The Uncertainty-aware Preference Aggregation module then adaptively fuses the refined multimodal features, assigning greater weight to more reliable modalities. Extensive experiments on three benchmark datasets demonstrate that SPUMR achieves significant improvements over existing leading methods.
- Abstract(参考訳): MMR(Multimodal Recommendation)システムは、現代のプラットフォームでは不可欠であるが、ぼやけた画像、多様な視覚的外観、曖昧なテキストなどのモーダルな特徴に固有のノイズや不確実性によって、しばしば妨げられる。
既存の方法は、しばしばこのモダリティ固有の不確実性を見落とし、非効率な特徴融合をもたらす。
さらに、ユーザとアイテム間のリッチな類似パターンを利用して表現とそれに対応する不確実性推定を洗練できない。
これらの課題に対処するため、我々はSPUMR(Simisity Propagation-enhanced Uncertainty for Multimodal Recommendation)という新しいフレームワークを提案する。
SPUMRは、まずModality similarity GraphとCollaborative similarity Graphを構築して、コンテンツと行動の両方の観点から表現を洗練することによって、不確実性を明示的にモデル化し緩和する。
不確かさを意識したPreference Aggregationモジュールは、改良されたマルチモーダル特徴を適応的に融合させ、より信頼性の高いモダリティに重みを割り当てる。
3つのベンチマークデータセットに対する大規模な実験は、SPUMRが既存のリードメソッドよりも大幅に改善されていることを示している。
関連論文リスト
- UGG-ReID: Uncertainty-Guided Graph Model for Multi-Modal Object Re-Identification [26.770271366177603]
マルチモーダルオブジェクトReID(UGG-ReID)に対する不確実性誘導グラフモデルというロバストなアプローチを提案する。
UGG-ReIDは、ノイズ干渉を緩和し、効果的なマルチモーダル融合を促進するように設計されている。
実験結果から,提案手法は全データセットに対して優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2025-07-07T03:41:08Z) - Latent Distribution Decoupling: A Probabilistic Framework for Uncertainty-Aware Multimodal Emotion Recognition [7.25361375272096]
マルチモーダル・マルチラベル感情認識は,マルチモーダルデータにおける複数の感情の存在を同時に認識することを目的としている。
既存の研究では、マルチモーダルデータに固有のノイズであるテクスブファレラティック不確実性の影響を見落としている。
本稿では,不確かさ認識フレームワークを用いた潜在感情分布分解法を提案する。
論文 参考訳(メタデータ) (2025-02-19T18:53:23Z) - ELFNet: Evidential Local-global Fusion for Stereo Matching [17.675146012208124]
ステレオマッチングのためのtextbfEvidential textbfLocal-global textbfFusion (ELF) フレームワークを提案する。
不確実性推定と信頼に値する頭部との信頼を意識した融合の両方を付与する。
論文 参考訳(メタデータ) (2023-08-01T15:51:04Z) - Cross-Attention is Not Enough: Incongruity-Aware Dynamic Hierarchical
Fusion for Multimodal Affect Recognition [69.32305810128994]
モダリティ間の同調性は、特に認知に影響を及ぼすマルチモーダル融合の課題となる。
本稿では,動的モダリティゲーティング(HCT-DMG)を用いた階層型クロスモーダルトランスを提案する。
HCT-DMG: 1) 従来のマルチモーダルモデルを約0.8Mパラメータで上回り、2) 不整合が認識に影響を及ぼすハードサンプルを認識し、3) 潜在レベルの非整合性をクロスモーダルアテンションで緩和する。
論文 参考訳(メタデータ) (2023-05-23T01:24:15Z) - Exploiting modality-invariant feature for robust multimodal emotion
recognition with missing modalities [76.08541852988536]
我々は、欠落したモダリティ・イマジネーション・ネットワーク(IF-MMIN)に不変な特徴を用いることを提案する。
提案モデルは,不確実なモダリティ条件下で,すべてのベースラインを上回り,全体の感情認識性能を不変に向上することを示す。
論文 参考訳(メタデータ) (2022-10-27T12:16:25Z) - Trusted Multi-View Classification with Dynamic Evidential Fusion [73.35990456162745]
信頼型マルチビュー分類(TMC)と呼ばれる新しいマルチビュー分類アルゴリズムを提案する。
TMCは、様々な視点をエビデンスレベルで動的に統合することで、マルチビュー学習のための新しいパラダイムを提供する。
理論的および実験的結果は、精度、堅牢性、信頼性において提案されたモデルの有効性を検証した。
論文 参考訳(メタデータ) (2022-04-25T03:48:49Z) - Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma
Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。
実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文 参考訳(メタデータ) (2021-11-11T14:28:12Z) - Uncertainty-Aware Few-Shot Image Classification [118.72423376789062]
ラベル付き限られたデータから新しいカテゴリを認識できる画像分類はほとんどない。
画像分類のための不確実性を考慮したFew-Shotフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-09T12:26:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。