論文の概要: EGRA:Toward Enhanced Behavior Graphs and Representation Alignment for Multimodal Recommendation
- arxiv url: http://arxiv.org/abs/2508.16170v1
- Date: Fri, 22 Aug 2025 07:47:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.296355
- Title: EGRA:Toward Enhanced Behavior Graphs and Representation Alignment for Multimodal Recommendation
- Title(参考訳): EGRA:マルチモーダルレコメンデーションのためのToward Enhanced Behavior GraphsとRepresentation Alignment
- Authors: Xiaoxiong Zhang, Xin Zhou, Zhiwei Zeng, Yongjie Wang, Dusit Niyato, Zhiqi Shen,
- Abstract要約: MMR(MultiModal Recommendation)システムは、リッチな項目側モダリティ情報を活用することで、推奨品質を改善するための有望なソリューションとして登場した。
本稿では,事前学習したMMRモデルにより生成された表現から構築されたアイテム-イムグラフの挙動グラフを組み込んだEGRAを提案する。
また、両レベルの動的アライメント重み付け機構を導入し、モダリティ・ビヘイビアのアライメントアライメントを改善する。
- 参考スコア(独自算出の注目度): 50.848374648774374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: MultiModal Recommendation (MMR) systems have emerged as a promising solution for improving recommendation quality by leveraging rich item-side modality information, prompting a surge of diverse methods. Despite these advances, existing methods still face two critical limitations. First, they use raw modality features to construct item-item links for enriching the behavior graph, while giving limited attention to balancing collaborative and modality-aware semantics or mitigating modality noise in the process. Second, they use a uniform alignment weight across all entities and also maintain a fixed alignment strength throughout training, limiting the effectiveness of modality-behavior alignment. To address these challenges, we propose EGRA. First, instead of relying on raw modality features, it alleviates sparsity by incorporating into the behavior graph an item-item graph built from representations generated by a pretrained MMR model. This enables the graph to capture both collaborative patterns and modality aware similarities with enhanced robustness against modality noise. Moreover, it introduces a novel bi-level dynamic alignment weighting mechanism to improve modality-behavior representation alignment, which dynamically assigns alignment strength across entities according to their alignment degree, while gradually increasing the overall alignment intensity throughout training. Extensive experiments on five datasets show that EGRA significantly outperforms recent methods, confirming its effectiveness.
- Abstract(参考訳): MMR(MultiModal Recommendation)システムは、リッチなアイテムサイドのモダリティ情報を活用することで、推薦品質を改善するための有望なソリューションとして登場し、多様な手法が急増している。
これらの進歩にもかかわらず、既存の方法には2つの限界がある。
第一に、彼らは生のモダリティ特徴を用いて、行動グラフを豊かにするためのアイテムとイテムのリンクを構築し、協調性とモダリティを意識したセマンティクスのバランスや、プロセスにおけるモダリティノイズの緩和に限定的な注意を払っている。
第2に、全ての要素に均一なアライメントウェイトを使用し、トレーニングを通して一定のアライメント強度を維持し、モダリティ・ビヘイビアアライメントの有効性を制限する。
これらの課題に対処するため,EGRAを提案する。
第一に、生のモダリティの特徴に頼る代わりに、事前訓練されたMMRモデルによって生成された表現から構築されたアイテム-イムグラフの振る舞いグラフを組み込むことで、空間性を軽減する。
これにより、コラボレーティブパターンとモダリティを考慮した類似性の両方を、モダリティノイズに対して強化されたロバストネスでキャプチャすることができる。
さらに,2段階の動的アライメント重み付け機構を導入し,アライメント度に応じてアライメント強度を動的に割り当てると共に,トレーニング全体を通してアライメント強度を徐々に向上させる。
5つのデータセットに対する大規模な実験は、EGRAが最近の手法を著しく上回り、その有効性を確認していることを示している。
関連論文リスト
- Semantic Item Graph Enhancement for Multimodal Recommendation [49.66272783945571]
マルチモーダルレコメンデーションシステムは、商品のマルチモーダル情報を活用することで、パフォーマンスの向上に注目が集まっている。
先行する手法は、しばしばモダリティ固有のアイテム・イテム意味グラフを生のモダリティの特徴から構築する。
これらのセマンティックグラフは、アイテム間の協調信号のモデリングが不十分ななど、セマンティックな欠陥に悩まされている。
論文 参考訳(メタデータ) (2025-08-08T09:20:50Z) - SLIF-MR: Self-loop Iterative Fusion of Heterogeneous Auxiliary Information for Multimodal Recommendation [13.3951304427872]
マルチモーダルレコメンデーション(SLIF-MR)のための不均一補助情報の自己ループ反復融合(Self-loop Iterative Fusion)という新しいフレームワークを提案する。
SLIF-MRは、KG、マルチモーダルアイテム特徴グラフ、ユーザ-イテム相互作用グラフからなる異種グラフ構造を動的に最適化するために、以前のトレーニングエポックからの項目表現をフィードバック信号として活用する。
実験により、SLIF-MRは既存の手法、特に精度と堅牢性において著しく優れていた。
論文 参考訳(メタデータ) (2025-07-14T07:32:16Z) - MoCa: Modality-aware Continual Pre-training Makes Better Bidirectional Multimodal Embeddings [75.0617088717528]
MoCaは、トレーニング済みのVLMバックボーンを効果的な双方向埋め込みモデルに変換するためのフレームワークである。
MoCaは、MMEBとViDoRe-v2ベンチマークのパフォーマンスを継続的に改善し、新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2025-06-29T06:41:00Z) - Fast State-Augmented Learning for Wireless Resource Allocation with Dual Variable Regression [83.27791109672927]
本稿では,資源割当ポリシに対する状態拡張グラフニューラルネットワーク(GNN)のパラメトリゼーションが,ユビキタスな二段階的手法の欠点を回避する方法を示す。
ラグランジアンによる国家拡張政策の最大化は、オフライントレーニングフェーズ中に学習される。
収束結果と指数確率は、双対函数(有限値)最適性ギャップの剰余に縛られることを証明する。
論文 参考訳(メタデータ) (2025-06-23T15:20:58Z) - Contrastive Matrix Completion with Denoising and Augmented Graph Views for Robust Recommendation [1.0128808054306186]
マトリックス補完は推薦システムにおいて広く採用されているフレームワークである。
コントラスト学習(MCCL)を用いた行列補完法を提案する。
提案手法は,予測スコアの数値精度を向上するだけでなく,ランキング指標の最大36%を向上する上で,優れたランキングを生成する。
論文 参考訳(メタデータ) (2025-06-12T12:47:35Z) - GRAMA: Adaptive Graph Autoregressive Moving Average Models [26.755971450887333]
本稿では,学習可能な自動回帰移動平均(ARMA)フレームワークに基づくグラフ適応手法であるGRAMAを紹介する。
静的グラフデータからシーケンシャルグラフデータへの変換により、GRAMAは効率的で柔軟な長距離情報伝搬を可能にする。
また、GRAMAと選択SSMの理論的関係を確立し、長距離依存関係をキャプチャする能力に関する洞察を提供する。
論文 参考訳(メタデータ) (2025-01-22T09:09:17Z) - Dynamic Weighted Combiner for Mixed-Modal Image Retrieval [8.683144453481328]
フレキシブル検索パラダイムとしてのMixed-Modal Image Retrieval (MMIR) が注目されている。
以前のアプローチは常に2つの重要な要因のため、限られたパフォーマンスを達成する。
以上の課題に対処するための動的重み付け結合器(DWC)を提案する。
論文 参考訳(メタデータ) (2023-12-11T07:36:45Z) - Scaling Multimodal Pre-Training via Cross-Modality Gradient
Harmonization [68.49738668084693]
自己教師付き事前学習は、最近、大規模マルチモーダルデータで成功している。
クロスモダリティアライメント(CMA)は、弱くノイズの多い監視である。
CMAは、モダリティ間の衝突や偏見を引き起こす可能性がある。
論文 参考訳(メタデータ) (2022-11-03T18:12:32Z) - Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person
Re-Identification [208.1227090864602]
Visible-infrared person re-identification (VI-ReID) は、歩行者検索の課題である。
既存のVI-ReID法は、識別可能性に制限があり、ノイズの多い画像に対して弱いロバスト性を持つグローバル表現を学習する傾向にある。
そこで我々は,VI-ReIDのための動的二段階集合(DDAG)学習法を提案する。
論文 参考訳(メタデータ) (2020-07-18T03:08:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。