論文の概要: Anchored Alignment: Preventing Positional Collapse in Multimodal Recommender Systems
- arxiv url: http://arxiv.org/abs/2603.12726v1
- Date: Fri, 13 Mar 2026 07:17:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:11.962494
- Title: Anchored Alignment: Preventing Positional Collapse in Multimodal Recommender Systems
- Title(参考訳): アンコレアライメント:マルチモーダルレコメンダシステムにおける位置ずれ防止
- Authors: Yonghun Jeong, David Yoon Suk Kang, Yeon-Chang Lee,
- Abstract要約: マルチモーダルレコメンデータシステムは、画像、テキスト、相互作用信号を利用してアイテム表現を豊かにする。
軽量プロジェクションドメインで間接的にアンカーベースのアライメントを実行するフレームワークであるAnchorRecを提案する。
- 参考スコア(独自算出の注目度): 7.239665377845207
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal recommender systems (MMRS) leverage images, text, and interaction signals to enrich item representations. However, recent alignment based MMRSs that enforce a unified embedding space often blur modality specific structures and exacerbate ID dominance. Therefore, we propose AnchorRec, a multimodal recommendation framework that performs indirect, anchor based alignment in a lightweight projection domain. By decoupling alignment from representation learning, AnchorRec preserves each modality's native structure while maintaining cross modal consistency and avoiding positional collapse. Experiments on four Amazon datasets show that AnchorRec achieves competitive top N recommendation accuracy, while qualitative analyses demonstrate improved multimodal expressiveness and coherence. The codebase of AnchorRec is available at https://github.com/hun9008/AnchorRec.
- Abstract(参考訳): マルチモーダルレコメンデータシステム(MMRS)は、画像、テキスト、相互作用信号を利用してアイテム表現を豊かにする。
しかし、最近のアライメントに基づくMMRSは、統合された埋め込み空間を強制し、しばしばモダリティ固有の構造を曖昧にし、ID支配を悪化させる。
そこで本稿では,軽量投影領域における間接的アンカーベースアライメントを行うマルチモーダルレコメンデーションフレームワークであるAnchorRecを提案する。
表現学習からアライメントを分離することにより、AnchorRecは各モダリティのネイティブ構造を保ちながら、相互整合性を維持し、位置崩壊を避ける。
Amazonの4つのデータセットの実験によると、AnchorRecは競合するトップNレコメンデーションの精度を達成し、質的な分析ではマルチモーダル表現性とコヒーレンスが改善されている。
AnchorRecのコードベースはhttps://github.com/hun9008/AnchorRecで公開されている。
関連論文リスト
- Multimodal Enhancement of Sequential Recommendation [10.466765832314683]
本稿では,マルチモーダルおよびシーケンシャルなレコメンデーションパラダイムを統一する新しいレコメンデーションフレームワークであるMuSTRecを提案する。
MuSTRecは、抽出したテキストと視覚的特徴からアイテムとアイテムのグラフを構築することで、横断的な類似性と協調的なフィルタリング信号をキャプチャする。
複数のAmazonデータセット全体で、MuSTRecはマルチモーダルおよびシーケンシャルな最先端ベースラインよりも優れたパフォーマンス(最大33.5%の改善)を示している。
論文 参考訳(メタデータ) (2026-02-06T21:32:56Z) - Structural and Disentangled Adaptation of Large Vision Language Models for Multimodal Recommendation [27.19123935646594]
マルチモーダルレコメンデーションは、視覚信号とテキスト信号を活用することで精度を高め、その成功は、高品質なクロスモーダル表現の学習に大きく依存する。
近年のLVLM(Large Vision-Language Models)は,マルチモーダル表現学習の統一化を実現している。
SDA は,Cross-Modal Structure Alignment (CMSA) とModality-Disentangled Adaptation の2つのコンポーネントを統合した,構造的・不整合適応のための軽量フレームワークである。
論文 参考訳(メタデータ) (2025-12-07T15:18:04Z) - MARS-Sep: Multimodal-Aligned Reinforced Sound Separation [72.85468563236005]
MARS-Sepは音分離のための強化学習フレームワークである。
クリッピングされた信頼領域サロゲートによって最適化された、ファクタライズされたベータマスクポリシを学ぶ。
複数のベンチマークの実験は、テキスト、オーディオ、イメージ-キュード分離において一貫した利得を示している。
論文 参考訳(メタデータ) (2025-10-12T09:05:28Z) - FindRec: Stein-Guided Entropic Flow for Multi-Modal Sequential Recommendation [57.577843653775]
textbfFindRec (textbfFlexible unified textbfinformation textbfdisentanglement for multi-modal sequence textbfRecommendation)を提案する。
Stein kernel-based Integrated Information Coordination Module (IICM) は理論上、マルチモーダル特徴とIDストリーム間の分散一貫性を保証する。
マルチモーダル特徴を文脈的関連性に基づいて適応的にフィルタリング・結合するクロスモーダル・エキスパート・ルーティング機構。
論文 参考訳(メタデータ) (2025-07-07T04:09:45Z) - CADMR: Cross-Attention and Disentangled Learning for Multimodal Recommender Systems [0.6037276428689637]
本稿では,新しいオートエンコーダに基づくマルチモーダルレコメンデータシステムCADMRを提案する。
CADMRを3つのベンチマークデータセット上で評価し,最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-12-03T09:09:52Z) - AlignRec: Aligning and Training in Multimodal Recommendations [29.995007279325947]
マルチモーダル・レコメンデーションは 相互作用を超えて 豊かなコンテキストを活用できる
既存の手法では、主に多モーダル情報を補助的なものとみなし、それを用いてIDの特徴を学習する。
マルチモーダルコンテンツの特徴とIDベースの特徴の間にはセマンティックなギャップがあり、それによってユーザやアイテムの表現の誤調整につながる。
論文 参考訳(メタデータ) (2024-03-19T02:49:32Z) - Preserving Modality Structure Improves Multi-Modal Learning [64.10085674834252]
大規模マルチモーダルデータセットによる自己教師付き学習は、人間のアノテーションに頼ることなく、意味的に意味のある埋め込みを学ぶことができる。
これらの手法は、モダリティ固有の埋め込みに存在する意味構造を無視して、ドメイン外のデータをうまく一般化するのに苦労することが多い。
共同埋め込み空間におけるモダリティ特異的な関係を保ち, 一般化性を向上させるためのセマンティック・構造保存整合性アプローチを提案する。
論文 参考訳(メタデータ) (2023-08-24T20:46:48Z) - Align then Fusion: Generalized Large-scale Multi-view Clustering with
Anchor Matching Correspondences [53.09276639185084]
マルチビューアンカーグラフクラスタリングは、完全なペアワイド類似性を避けるために代表アンカーを選択する。
既存のアプローチでは、ビューをまたいだアンカーセット間の正しい対応を確立するのに十分な注意を払わない。
論文 参考訳(メタデータ) (2022-05-30T13:07:40Z) - CRACT: Cascaded Regression-Align-Classification for Robust Visual
Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。
CRACは多くのベンチマークで最先端のパフォーマンスを得る。
OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文 参考訳(メタデータ) (2020-11-25T02:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。