論文の概要: I$^3$-MRec: Invariant Learning with Information Bottleneck for Incomplete Modality Recommendation
- arxiv url: http://arxiv.org/abs/2508.04247v2
- Date: Fri, 15 Aug 2025 09:40:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.554459
- Title: I$^3$-MRec: Invariant Learning with Information Bottleneck for Incomplete Modality Recommendation
- Title(参考訳): I$^3$-MRec:不完全モダリティ勧告のための情報ボトルネックによる不変学習
- Authors: Huilin Chen, Miaomiao Cai, Fan Liu, Zhiyong Cheng, Richang Hong, Meng Wang,
- Abstract要約: textbfIncomplete textbfModality textbfRecommendationのボトルネック原理で学習する textbfI$3$-MRec を紹介する。
I$3$-MRecは、(i)クロスモーダルな選好不変性、(ii)コンパクトで効果的なマルチモーダル表現の2つの重要な性質を強制する。
I$3$-MRec は、様々なモダリティを欠くシナリオで既存の最先端の MRS メソッドを一貫して上回っている。
- 参考スコア(独自算出の注目度): 42.37107069331169
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal recommender systems (MRS) improve recommendation performance by integrating complementary semantic information from multiple modalities. However, the assumption of complete multimodality rarely holds in practice due to missing images and incomplete descriptions, hindering model robustness and generalization. To address these challenges, we introduce a novel method called \textbf{I$^3$-MRec}, which uses \textbf{I}nvairant learning with \textbf{I}nformation bottleneck principle for \textbf{I}ncomplete \textbf{M}odality \textbf{Rec}ommendation. To achieve robust performance in missing modality scenarios, I$^3$-MRec enforces two pivotal properties: (i) cross-modal preference invariance, ensuring consistent user preference modeling across varying modality environments, and (ii) compact yet effective multimodal representation, as modality information becomes unreliable in such scenarios, reducing the dependence on modality-specific information is particularly important. By treating each modality as a distinct semantic environment, I$^3$-MRec employs invariant risk minimization (IRM) to learn preference-oriented representations. In parallel, a missing-aware fusion module is developed to explicitly simulate modality-missing scenarios. Built upon the Information Bottleneck (IB) principle, the module aims to preserve essential user preference signals across these scenarios while effectively compressing modality-specific information. Extensive experiments conducted on three real-world datasets demonstrate that I$^3$-MRec consistently outperforms existing state-of-the-art MRS methods across various modality-missing scenarios, highlighting its effectiveness and robustness in practical applications.
- Abstract(参考訳): マルチモーダルリコメンデータシステム(MRS)は、複数のモーダルから補完的なセマンティック情報を統合することにより、レコメンデーション性能を向上させる。
しかし、完全なマルチモーダリティの仮定は、画像の欠如や不完全な記述、モデルの堅牢性や一般化を妨げるために、実際にはほとんど成り立たない。
これらの課題に対処するために、我々は、 \textbf{I}nvairant Learning と \textbf{I}ncomplete \textbf{M}odality \textbf{Rec}ommendation を併用した \textbf{I}nvairant Learning という新しい手法を導入する。
I$^3$-MRecは、モダリティの欠如におけるロバストな性能を達成するために、2つの重要な特性を強制する。
(i)クロスモーダルな選好不変性、様々なモーダル環境における一貫したユーザ選好モデリングの確保、
(II)コンパクトで効果的なマルチモーダル表現は、そのようなシナリオではモダリティ情報が信頼できないため、モダリティ固有の情報への依存を減らすことが特に重要である。
それぞれのモダリティを異なる意味環境として扱うことで、I$^3$-MRecは不変リスク最小化(IRM)を用いて嗜好指向の表現を学習する。
並行して、モダリティ欠落シナリオを明示的にシミュレートするために、欠落を認識した融合モジュールが開発された。
このモジュールは、IB(Information Bottleneck)の原則に基づいており、これらのシナリオにまたがる重要なユーザー嗜好信号を効果的に圧縮しながら保持することを目的としている。
3つの実世界のデータセットで実施された大規模な実験により、I$^3$-MRecは様々なモダリティを欠いたシナリオで既存の最先端のMSS手法を一貫して上回り、実用的応用におけるその有効性と堅牢性を強調している。
関連論文リスト
- BiXFormer: A Robust Framework for Maximizing Modality Effectiveness in Multi-Modal Semantic Segmentation [55.486872677160015]
マスクレベルの分類タスクとしてマルチモーダルなセマンティックセグメンテーションを再構成する。
統一モダリティマッチング(UMM)とクロスモダリティアライメント(CMA)を統合したBiXFormerを提案する。
合成および実世界のマルチモーダルベンチマーク実験により,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-06-04T08:04:58Z) - Disentangling and Generating Modalities for Recommendation in Missing Modality Scenarios [21.73914052076956]
本稿では,モダリティを欠くシナリオに対して,DGMレコメンダ(Disentangling and Generating Modality Recommender)を提案する。
DGMRecは、情報ベースの観点から、モダリティの特徴を一般的な、特定のモダリティの特徴に分解する。
挑戦的なシナリオでは、最先端のMSSよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-04-23T02:04:14Z) - Benchmarking Multi-modal Semantic Segmentation under Sensor Failures: Missing and Noisy Modality Robustness [61.87055159919641]
マルチモーダルセマンティックセグメンテーション(MMSS)は、モーダル間で補完情報を統合することで、単一モーダルデータの制限に対処する。
顕著な進歩にもかかわらず、マルチモーダルデータ品質の変動と不確実性により、研究と実世界の展開の間に大きなギャップが持続する。
Intire-Missing Modality (EMM)、Random-Missing Modality (RMM)、Noisy Modality (NM)の3つのシナリオでMMSSモデルを評価する頑健性ベンチマークを導入する。
論文 参考訳(メタデータ) (2025-03-24T08:46:52Z) - MIFNet: Learning Modality-Invariant Features for Generalizable Multimodal Image Matching [54.740256498985026]
キーポイントの検出と記述方法は、しばしばマルチモーダルデータと競合する。
マルチモーダル画像マッチングにおけるキーポイント記述に対するモダリティ不変特徴量を計算するためのモダリティ不変特徴量学習ネットワーク(MIFNet)を提案する。
論文 参考訳(メタデータ) (2025-01-20T06:56:30Z) - Retrieval-Augmented Dynamic Prompt Tuning for Incomplete Multimodal Learning [27.867369806400834]
本稿では,Retrieval-AuGmented Dynamic Prompt TuningフレームワークであるRAGPTを提案する。
RAGPTは、(I)マルチチャネルレトリバー、(II)モダリティ生成器、(III)コンテキスト認識プロンプトの3つのモジュールから構成される。
3つの実世界のデータセットで実施された実験によると、RAGPTは不完全なモダリティ問題に対処する際の全ての競争ベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2025-01-02T07:39:48Z) - MAGIC++: Efficient and Resilient Modality-Agnostic Semantic Segmentation via Hierarchical Modality Selection [20.584588303521496]
本稿では,効率的なマルチモーダル融合と階層的モダリティ選択のための2つの重要なプラグアンドプレイモジュールからなるMAGIC++フレームワークを紹介する。
本手法は実世界のベンチマークと合成ベンチマークの両方で最先端の性能を実現する。
本手法は, 先行技術よりも大きなマージンで優れる新奇なモダリティ非依存環境において, 優れた手法である。
論文 参考訳(メタデータ) (2024-12-22T06:12:03Z) - LLM-based Bi-level Multi-interest Learning Framework for Sequential Recommendation [54.396000434574454]
本稿では,暗黙的行動と明示的意味論的視点を組み合わせた新しい多目的SRフレームワークを提案する。
Implicit Behavioral Interest ModuleとExplicit Semantic Interest Moduleの2つのモジュールが含まれている。
4つの実世界のデータセットの実験は、フレームワークの有効性と実用性を検証する。
論文 参考訳(メタデータ) (2024-11-14T13:00:23Z) - Centering the Value of Every Modality: Towards Efficient and Resilient Modality-agnostic Semantic Segmentation [7.797154022794006]
最近の試みでは、RGBのモダリティを中心とみなし、その他を補助的とみなし、2つの枝を持つ非対称なアーキテクチャを生み出している。
本稿では,コンパクトモデルから高性能モデルまで,様々なバックボーンと柔軟にペアリングできるMAGICという新しい手法を提案する。
提案手法は, モデルパラメータを60%削減しつつ, 最先端性能を実現する。
論文 参考訳(メタデータ) (2024-07-16T03:19:59Z) - Exploiting modality-invariant feature for robust multimodal emotion
recognition with missing modalities [76.08541852988536]
我々は、欠落したモダリティ・イマジネーション・ネットワーク(IF-MMIN)に不変な特徴を用いることを提案する。
提案モデルは,不確実なモダリティ条件下で,すべてのベースラインを上回り,全体の感情認識性能を不変に向上することを示す。
論文 参考訳(メタデータ) (2022-10-27T12:16:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。