Fugu-MT 論文翻訳(概要): Modality-Aware Identity Construction and Counterfactual Structure Learning for ID-Free Multimodal Recommendation

論文の概要: Modality-Aware Identity Construction and Counterfactual Structure Learning for ID-Free Multimodal Recommendation

arxiv url: http://arxiv.org/abs/2605.18044v1
Date: Mon, 18 May 2026 08:35:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 17:57:49.129021
Title: Modality-Aware Identity Construction and Counterfactual Structure Learning for ID-Free Multimodal Recommendation
Title（参考訳）: IDフリーマルチモーダルレコメンデーションのためのモダリティを考慮したアイデンティティ構築と対実的構造学習
Authors: Hongjian Ma, Wenxin Huang, Yan Zhang, Zhifei Li, Zheng Wang,
Abstract要約: IDフリーマルチモーダルレコメンデーション(MAIL)のためのモダリティ・アウェア・アイデンティティ構築と対実的構造学習を提案する。 MAILはRecall@10で7.81%、NDCG@10で12.81%の平均的な改善を実現している。
参考スコア（独自算出の注目度）: 12.322982137738661
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multimodal recommendation has attracted extensive attention by leveraging heterogeneous modality information to alleviate data sparsity and improve recommendation accuracy. Existing methods have attempted to replace ID embeddings with multimodal features and have achieved promising preliminary results. However, these methods still exhibit the following two limitations: (1) the reconstructed ID representations remain relatively static and fail to fully exploit multimodal semantics; and (2) the graph learning process is insufficient in mining latent long-tail semantic relations and is easily affected by popularity bias. To address these issues, we propose a novel method named Modality-Aware Identity Construction and Counterfactual Structure Learning for ID-free Multimodal Recommendation (MAIL). Specifically, we design a modality-aware identity construction module that dynamically modulates positional encodings with multimodal semantics to construct content-aware ID-free identity representations. Then, we propose a counterfactual structure learning paradigm that mines low-exposure semantic neighbors via popularity penalization and alleviates popularity bias. Extensive experiments are conducted on five public Amazon datasets. Experimental results show that MAIL achieves average improvements of 7.81% in Recall@10 and 12.81% in NDCG@10 compared with the baseline models. Our code is available at https://github.com/HubuKG/MAIL.
Abstract（参考訳）: マルチモーダルレコメンデーションは、不均一なモダリティ情報を活用してデータの分散を緩和し、レコメンデーション精度を向上させることで、広く注目を集めている。既存の手法では、ID埋め込みをマルチモーダルな特徴に置き換えようと試みており、有望な予備的な結果を得た。しかし, これらの手法は, 1) 再構成されたID表現は比較的静的であり, マルチモーダルなセマンティクスを完全に活用できないこと, (2) グラフ学習プロセスは潜伏長尾意味関係のマイニングに不十分であり, 人気バイアスの影響を受けやすいこと, という2つの制限をまだ示している。これらの課題に対処するために,IDのないマルチモーダルレコメンデーション(MAIL)のためのModality-Aware Identity Construction and Counterfactual Structure Learningという新しい手法を提案する。具体的には、マルチモーダルなセマンティクスで位置エンコーディングを動的に変調し、コンテンツフリーなID表現を構築するモダリティ対応ID構築モジュールを設計する。そこで我々は,低露出なセマンティックな隣人を,人気ペナリゼーションによりマイニングし,人気バイアスを緩和する,反実的構造学習パラダイムを提案する。大規模な実験は5つのパブリックなAmazonデータセットで実施されている。実験の結果、MAILはベースラインモデルと比較して、Recall@10で7.81%、NDCG@10で12.81%の平均的な改善を実現している。私たちのコードはhttps://github.com/HubuKG/MAILで利用可能です。

関連論文リスト

SMA: Submodular Modality Aligner For Data Efficient Multimodal Learning [3.9890357781493595]
本稿では,集合としてエンティティの複数の拡張と記述を扱うemphSubmodular Modality Aligner(SMA)を紹介し,よりリッチなクロスモーダル構造を捉えるために,データの複数の記述を活用する。 CLIPベンチマークから14のゼロショット分類および検索タスクについてSMAを評価し,低データ方式における一貫した利得を示す。
論文参考訳（メタデータ） (2026-05-13T01:36:43Z)
From Sparse Decisions to Dense Reasoning: A Multi-attribute Trajectory Paradigm for Multimodal Moderation [59.27094165576015]
疎度な意思決定から高密度な推論トレースへ移行する新しい学習パラダイム(UniMod)を提案する。モノリシックな意思決定タスクを多次元境界学習プロセスに再構成し,エビデンス,モダリティ評価,リスクマッピング,政策決定,応答生成を含む構造化軌道を構築する。タスク固有のパラメータを分離し、トレーニングダイナミクスを再バランスさせ、マルチタスク学習における多様な目的間の干渉を効果的に解消する、特別な最適化戦略を導入する。
論文参考訳（メタデータ） (2026-01-28T09:29:40Z)
From ID-based to ID-free: Rethinking ID Effectiveness in Multimodal Collaborative Filtering Recommendation [12.711479510330436]
ID機能は初期埋め込みを提供するが、セマンティック・リッチネスは欠如している。ユーザとアイテム毎にユニークな識別子を提供するが、トレーニングされていないデータへの一般化を妨げる。マルチモーダルな特徴の整合と融合を支援するが、表現シフトにつながる可能性がある。
論文参考訳（メタデータ） (2025-07-08T06:58:24Z)
ReID5o: Achieving Omni Multi-modal Person Re-identification in a Single Model [59.00754756072231]
Omni Multi-modal Person Re-identification (OM-ReID) と呼ばれる新しい課題について検討する。 ORBenchは、5つのモダリティにまたがる1,000のユニークなIDからなる最初の高品質なマルチモーダルデータセットである。また,ReIDのための新しいマルチモーダル学習フレームワークであるReID5oを提案する。
論文参考訳（メタデータ） (2025-06-11T04:26:13Z)
Continual Multimodal Contrastive Learning [99.53621521696051]
MCL(Multimodal Contrastive Learning)は、異なるモダリティを整列し、関節空間におけるマルチモーダル表現を生成する。マルチモーダルデータは単一のプロセスで収集されることはめったになく、スクラッチからのトレーニングは計算コストがかかる。本稿では, 安定性と塑性の2つの原理によりCMCLを定式化する。理論的には、二辺から部分空間への勾配の更新を計画する、新しい最適化に基づく手法を導出する。
論文参考訳（メタデータ） (2025-03-19T07:57:08Z)
NativE: Multi-modal Knowledge Graph Completion in the Wild [51.80447197290866]
本研究では,MMKGCを実現するための包括的フレームワークNativEを提案する。 NativEは、任意のモダリティに対して適応的な融合を可能にするリレーショナル誘導デュアルアダプティブフュージョンモジュールを提案する。提案手法を評価するために,5つのデータセットを用いたWildKGCという新しいベンチマークを構築した。
論文参考訳（メタデータ） (2024-03-28T03:04:00Z)
Preserving Modality Structure Improves Multi-Modal Learning [64.10085674834252]
大規模マルチモーダルデータセットによる自己教師付き学習は、人間のアノテーションに頼ることなく、意味的に意味のある埋め込みを学ぶことができる。これらの手法は、モダリティ固有の埋め込みに存在する意味構造を無視して、ドメイン外のデータをうまく一般化するのに苦労することが多い。共同埋め込み空間におけるモダリティ特異的な関係を保ち, 一般化性を向上させるためのセマンティック・構造保存整合性アプローチを提案する。
論文参考訳（メタデータ） (2023-08-24T20:46:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。